跳转至

BaiduSpider

BaiduSpider⚓︎

Contributors Forks Stargazers Issues MIT License

BaiduSpider 是一个使用 Python 编写的轻量级百度爬虫。它基于 RequestsBeautifulSoup 构建,并提供了易用的 API 接口以及完善的类型注释,提升开发者的使用体验。

有了 BaiduSpider,你可以:

  • 精准,快速的提取百度搜索结果
  • 获取多种结果类型
  • 使用我们简洁易用的 API

必要条件⚓︎

  • Python 3.6+

安装⚓︎

$ pip install baiduspider

链接⚓︎

示例⚓︎

from baiduspider import BaiduSpider
from pprint import pprint

pprint(BaiduSpider().search_web(input('搜索词:')).plain)
from baiduspider import BaiduSpider
from pprint import pprint

pprint(BaiduSpider().search_web(input('搜索词:'), pn=int(input('页码:'))).plain)
什么是pprint

pprint是一个 Python 内置的输出美化库,可以改善结构化数据的输出体验。可以通过import pprint导入此库。下面是它的一个实例,使用 BaiduSpider 的返回值作为对比。

from pprint import pprint
from baiduspider import BaiduSpider

result = BaiduSpider().search_web('Python')
print(result)  # print
print('\n\n')
pprint(result)  # pprint

在接下来的文档中,我们将会大量使用此函数,因为BaiduSpider 的字典返回值十分复杂。

Back to top