跳转至

资讯搜索⚓︎

百度资讯搜索,从海量新闻当中提取重要信息。

BaiduSpider.search_news(
    self: BaiduSpider,
    query: str,
    pn: int = 1,
    sort_by: str = "focus",
    show: str = "all",
    proxies: Union[dict, None] = None,
) -> NewsResult:

参数⚓︎

  • query str: 要查询资讯搜索的字符串
  • pn int: 要爬取的页码,默认为1,可选
  • sort_by str: 搜索结果排序方式,默认为"focus",可选
  • show str: 搜索结果筛选方式,默认为"all",可选
  • proxies Union[dict, None]: 代理配置,默认为None,可选

实例⚓︎

基本的调用⚓︎

from baiduspider import BaiduSpider
from pprint import pprint

spider = BaiduSpider()

pprint(spider.search_news(query="要搜索的关键词").plain)

指定页码⚓︎

from baiduspider import BaiduSpider
from pprint import pprint

pprint(BaiduSpider().search_news("要搜索的关键词", pn=2).plain)

搜索结果排序方式⚓︎

BaiduSpider 提供两种不同的资讯搜索搜索结果排序方式:焦点与时间。默认情况下,BaiduSpider 会按照焦点进行排序,当然你也可以指定使用时间进行排序:通过更改sort_by参数的值。

sort_by参数接受两种字符串的值:focus(焦点,默认)与time(时间)。

from baiduspider import BaiduSpider
from pprint import pprint

pprint(BaiduSpider().search_news("要搜索的关键词", sort_by="time").plain)  # 按时间排序

筛选资讯来源⚓︎

这个参数可以让你搜到所需要的来源。你可以通过更改show参数的值来达到这一目的。默认无筛选。

目前支持的选项有:all(全部,即无筛选,默认)、media(来自媒体的新闻)、baijiahao(来自百家号的新闻)。

from baiduspider import BaiduSpider
from pprint import pprint

pprint(BaiduSpider().search_news("要搜索的关键词", show="media").plain)  # 仅显示来自媒体的资讯

返回值⚓︎

字典返回值⚓︎

详见 API 文档

模型结果返回值⚓︎

详见 API 文档

评论

Back to top