pyquery可以像jquery那样操作xml文档,一般如果想要获取html里某元素的内容都是使用正则之类的方法,正则这方法想要匹配精准,表达式得写好,不像pyquery选择器那样很容易就可以写出来,下面我简单的介绍下我个人使用。
首先使用:"pip install pyquery"安装,结果如下图:
安装完毕之后即可使用:
from pyquery import PyQuery as pq
d = pq(url='http://www.bstaint.net')
d('title').text()
不过在使用中遇到个问题,在使用"d(‘td:first’).text()"的时候报如下错误:
AttributeError: ‘XPathExpr’ object has no attribute ‘add_post_condition’
截图如下:
之后搜索了下,找到了解决方法,使用github上的版本即可解决该问题:
pip uninstall pyquery
pip install git+git://github.com/gawel/pyquery.git
下面是测试截图:
补充:
简单使用了下,感觉还需要继续加强,比如上图我原本使用的选择器是"d(‘h2 a:first’).text()"这样是无法获取我需要的标签。
转载请注明: 本文《pyquery的使用》来源于bstaint的博客
没有评论:
发表评论