跳转至

BaiduSpider

资讯搜索

BaiduSpider/BaiduSpider

资讯搜索⚓︎

百度资讯搜索，从海量新闻当中提取重要信息。

BaiduSpider.search_news(
    self: BaiduSpider,
    query: str,
    pn: int = 1,
    sort_by: str = "focus",
    show: str = "all",
    proxies: Union[dict, None] = None,
) -> NewsResult:

参数⚓︎

query str: 要查询资讯搜索的字符串
pn int: 要爬取的页码，默认为1，可选
sort_by str: 搜索结果排序方式，默认为"focus"，可选
show str: 搜索结果筛选方式，默认为"all"，可选
proxies Union[dict, None]: 代理配置，默认为None，可选

实例⚓︎

基本的调用⚓︎

from baiduspider import BaiduSpider
from pprint import pprint

spider = BaiduSpider()

pprint(spider.search_news(query="要搜索的关键词").plain)

指定页码⚓︎

from baiduspider import BaiduSpider
from pprint import pprint

pprint(BaiduSpider().search_news("要搜索的关键词", pn=2).plain)

搜索结果排序方式⚓︎

BaiduSpider 提供两种不同的资讯搜索搜索结果排序方式：焦点与时间。默认情况下，BaiduSpider 会按照焦点进行排序，当然你也可以指定使用时间进行排序：通过更改sort_by参数的值。

sort_by参数接受两种字符串的值：focus（焦点，默认）与time（时间）。

from baiduspider import BaiduSpider
from pprint import pprint

pprint(BaiduSpider().search_news("要搜索的关键词", sort_by="time").plain)  # 按时间排序

筛选资讯来源⚓︎

这个参数可以让你搜到所需要的来源。你可以通过更改show参数的值来达到这一目的。默认无筛选。

目前支持的选项有：all（全部，即无筛选，默认）、media（来自媒体的新闻）、baijiahao（来自百家号的新闻）。

from baiduspider import BaiduSpider
from pprint import pprint

pprint(BaiduSpider().search_news("要搜索的关键词", show="media").plain)  # 仅显示来自媒体的资讯

返回值⚓︎

字典返回值⚓︎

详见 API 文档。

模型结果返回值⚓︎

详见 API 文档。

评论