Baidu

有两种方法可以使用我们的 SERP 爬虫 API 检索 Baidu 中的数据。您可以向我们提供一个完整的 URL 或通过专门建立的数据源传递参数 - 搜索

总览

以下是我们通过 Baidu 支持的所有可用数据source值的快速概览。

来源描述结构化数据

baidu

提交您喜欢的任何 Baidu 网址。

baidu_search

Baidu SERPs.

URL

baidu 源设计用于检索各种 Baidu 页面直接 URL 中的检索内容。与其发送多个参数,您可以向我们提供 Baidu 页面所需的直接 URL。我们不会剥离任何参数或以任何其他方式更改您的 URL

查询参数

参数描述默认值

source

数据源。更多信息

baidu

url

转到 Baidu 页面的直接 URL(链接)

-

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

callback_url

转至回调端点的 URL。更多信息

-

- 必须提供的参数

代码示例

在下面的示例中,我们提出了一个请求,以检索提供的 URL 的一个结果。

{
    "source": "baidu", 
    "url": "http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&ch=&tn=baidu&bar=&wd=adidas"
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

搜索

baidu_search 源设计用于检索 HTML 格式的 Baidu 搜索结果(SERP)。

查询参数

参数描述默认值

source

数据源。更多信息

baidu_search

domain

域本地化

com

query

UTF 编码的关键字

-

start_page

起始页数er

1

pages

检索的页数

1

limit

每页中要检索的结果数

10

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

callback_url

转至回调端点的 URL。更多信息

-

- 必须提供的参数

代码示例

在以下示例中,我们提出了一个请求,以检索 10 个 Baidu SERP,从第 11页开始,搜索词为 adidas

{
    "source": "baidu_search", 
    "domain": "com", 
    "query": "adidas", 
    "start_page": 11, 
    "pages": 10
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

最后更新于