搜索

提取 Bing 搜索结果的解析数据,包含付费广告和自然列表,并支持地理定位、域名本地化和分页。

bing_search source 的设计用于检索 Bing 搜索结果页面(SERP)。

circle-info

要抓取 AI 生成的搜索结果 来自 Bing,请使用 render 参数。

请求示例

在下面的示例中,我们发出请求以检索搜索词的 Bing 搜索结果 adidas。搜索将从第 11 页开始并检索 10 页结果,这些结果将以结构化格式返回。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "bing_search",
        "domain": "com",
        "query": "adidas",
        "start_page": 11,
        "pages": 10,
        "callback_url": "https://your.callback.url",
        "parse": true
    }'

我们在示例中使用同步的 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

在以下示例中,我们发送请求以检索搜索词的 AI 生成 Bing 搜索结果 best seo tools.

请求参数值

通用

Bing 搜索抓取的基本设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

bing_search

query

要搜索的关键字或短语。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为 true. 查看输出 数据字典.

false

callback_url

回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在此处找到 此处.

桌面端

- 必需参数

本地化

将搜索结果适配到特定地理位置、域和语言。

参数
说明
默认值

geo_location

指定搜索结果的位置。支持城市、州、国家或坐标格式。 阅读更多.

-

domain

为特定国家/地区本地化结果。有效值: com, ru, ua, by, kz, tr.

com

locale

Accept-Language 更改 Bing 搜索页面 Web 界面语言的 header 值。 更多信息.

-

分页

用于管理分页和检索搜索结果的控制项。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页数。

1

limit

每页要检索的结果数。

10

结构化数据

SERP Scraper API 能够提取包含 Bing 搜索结果的 HTML 或 JSON 对象,提供有关结果页各个元素的结构化数据。

file-download
9KB

输出数据字典

HTML 示例

JSON 结构

下表列出我们解析的每个 SERP 特性的详细清单、其描述和数据类型。表中还包含一些元数据。

说明
类型

url

Bing 搜索页面的 URL。

字符串

页面

当前页码。

整数

结果

包含搜索结果的字典。

对象

paid (可选)

带有各自详细信息的赞助结果列表。

数组

organic

带有各自详细信息的非付费列表。

数组

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码的说明 此处arrow-up-right.

整数

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码的说明 此处arrow-up-right.

整数

job_id

与抓取作业关联的任务 ID。

字符串

circle-info

在下列部分中,当某类结果有多于一项时,解析后的 JSON 代码片段会被缩短。

键(paid)
说明
类型

pos

广告在付费广告列表中的位置。

整数

url

付费广告的完整 URL。

字符串

desc

广告内容的简要描述或摘要。

字符串

title

广告的主要标题或题目。

字符串

url_shown

显示给用户的简化 URL。

字符串

pos_overall

广告在所有搜索结果中的排名,包括付费和自然列表。

整数

Organic

键(organic)
说明
类型

pos

有机结果在有机搜索结果列表中的排名。

整数

url

有机搜索结果的完整 URL。

字符串

desc

有机搜索结果内容的简要描述或摘要。

字符串

title

有机搜索结果的主要标题或题目。

字符串

url_shown

显示给用户的简化 URL。

字符串

pos_overall

有机结果在所有搜索结果中的排名,包括付费和自然列表。

整数

最后更新于

这有帮助吗?