BaiduSpider⚓︎
BaiduSpider 是一个使用 Python 编写的轻量级百度爬虫。它基于 Requests 和 BeautifulSoup 构建,并提供了易用的 API 接口以及完善的类型注释,提升开发者的使用体验。
有了 BaiduSpider,你可以:
- 精准,快速的提取百度搜索结果
- 获取多种结果类型
- 使用我们简洁易用的 API
必要条件⚓︎
- Python 3.6+
安装⚓︎
$ pip install baiduspider
链接⚓︎
- 文档:https://baiduspider.github.io
- PyPI:https://pypi.org/project/BaiduSpider/
- GitHub:https://github.com/BaiduSpider/BaiduSpider
- 讨论:https://github.com/BaiduSpider/BaiduSpider/discussions
- 报告 Issue:https://github.com/BaiduSpider/BaiduSpider/issues
示例⚓︎
from baiduspider import BaiduSpider
from pprint import pprint
pprint(BaiduSpider().search_web(input('搜索词:')).plain)
from baiduspider import BaiduSpider
from pprint import pprint
pprint(BaiduSpider().search_web(input('搜索词:'), pn=int(input('页码:'))).plain)
什么是pprint
?
pprint
是一个 Python 内置的输出美化库,可以改善结构化数据的输出体验。可以通过import pprint
导入此库。下面是它的一个实例,使用 BaiduSpider 的返回值作为对比。
from pprint import pprint
from baiduspider import BaiduSpider
result = BaiduSpider().search_web('Python')
print(result) # print
print('\n\n')
pprint(result) # pprint
在接下来的文档中,我们将会大量使用此函数,因为BaiduSpider 的字典返回值十分复杂。