搜索

了解如何使用 Web Scraper API 抓取 Bing 搜索结果。

bing_search source 旨在检索 Bing Search 结果页面 (SERPs)。

要抓取 AI 生成的搜索结果 来自 Bing,请使用 render 参数。

请求示例

在下面的示例中,我们发出请求以检索搜索词的 Bing 搜索结果 adidas。搜索将从第 11 页开始并检索 10 页结果,结果将以结构化格式返回。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "bing_search",
        "domain": "com",
        "query": "adidas",
        "start_page": 11,
        "pages": 10,
        "callback_url": "https://your.callback.url",
        "parse": true
    }'

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

在下面的示例中,我们发送请求以检索针对搜索词的 AI 生成的 Bing 搜索结果: best seo tools.

请求参数值

通用

Bing 搜索抓取的基本设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

bing_search

query

要搜索的关键字或短语。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析数据 true。探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 强制参数

本地化

将搜索结果适配到特定的地理位置、域名和语言。

参数
说明
默认值

geo_location

指定搜索结果的地理位置。支持城市、州、国家或坐标格式。 阅读更多.

-

domain

将结果本地化到特定国家。有效值: com, ru, ua, by, kz, tr.

com

locale

Accept-Language 更改 Bing 搜索页面网络界面语言的 header 值。 更多信息.

-

分页

用于管理搜索结果分页和检索的控制。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页面数量。

1

limit

每页要检索的结果数量。

10

结构化数据

SERP 爬虫 API 能够提取包含 Bing 搜索结果的 HTML 或 JSON 对象,提供关于结果页面各种元素的结构化数据。

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个 SERP 特性的详细列表,以及其描述和数据类型。表中还包含一些元数据。

说明
类型

url

Bing 搜索页面的 URL。

字符串

page

当前页码。

整数

results

包含搜索结果的字典。

对象

paid (可选)

包含相应详情的赞助结果列表。

数组

organic

包含相应详情的自然(非付费)列表。

数组

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

job_id

与抓取作业关联的作业 ID。

字符串

在下列部分,当结果类型存在多个项时,解析后的 JSON 代码片段会被缩短。

付费

Key (paid)
说明
类型

pos

广告在付费广告列表中的位置。

整数

url

付费广告的完整 URL。

字符串

desc

广告内容的简要描述或摘要。

字符串

title

广告的主要标题或题目。

字符串

url_shown

向用户显示的简化 URL。

字符串

pos_overall

该广告在所有搜索结果中的排名,包括付费和自然列表。

整数

自然

Key (organic)
说明
类型

pos

该自然结果在自然搜索结果列表中的排名。

整数

url

自然搜索结果的完整 URL。

字符串

desc

自然搜索结果内容的简要描述或摘要。

字符串

title

自然搜索结果的主要标题或题目。

字符串

url_shown

向用户显示的简化 URL。

字符串

pos_overall

该自然结果在所有搜索结果中的排名,包括付费和自然列表。

整数

最后更新于

这有帮助吗?