图片搜索

google_search source 旨在检索 Google 搜索结果(SERP)。此子页面专门展示与 Google 图片搜索相关的数据。若要查看其他结果类型,请阅读: 网页搜索, 新闻搜索.

查看输出 数据字典 针对每个图片 SERP 功能,提供简短描述、截图、解析后的 JSON 代码片段以及定义每个解析字段的表格。可使用右侧导航或向下滚动页面浏览详细信息。

请求示例

在下列示例中,我们发出请求以获取搜索词的图片搜索结果页面 adidasgoogle.nl 域名。

udm

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "google_search",
        "domain": "nl",
        "query": "adidas",
        "parse": true,
        "context": [
            {
                "key": "udm",
                "value": "2"
            }
        ]
    }'

tbm

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Google 图片搜索结果的基本设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

google_search

query

要搜索的关键字或短语。

-

context: udm

要获取图片搜索结果,请将值设置为 2。 查找其他接受的值 此处.

-

context: tbm

要获取图片搜索结果,请将值设置为 isch。 其他接受的值: app, blg, bks, dsc, nws, pts, plcs, rcp, lcl。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析数据 true。探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 强制参数

- udmtbm context 参数不能在单个抓取请求中一起使用; 请只选择其中一个。 同时使用两者可能导致冲突或意外行为。

Google 高级搜索运算符

在抓取时,将 Google 高级搜索运算符与查询结合使用可能很有用。它使您能够自定义搜索范围,确保结果更相关、更集中。探索这些特殊命令 此处此处。见下方示例。

本地化

将搜索结果适配到特定的地理位置、域名和语言。

参数
说明
默认值

geo_location

应适配结果的地理位置。正确使用此参数对于获取正确数据非常重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 此处.

-

domain

Google 的域名本地化。完整可用域名列表可在此处找到 此处.

com

locale

Accept-Language 更改您 Google 搜索页面网页界面语言的 header 值。 更多信息.

-

分页

用于管理搜索结果分页和检索的控制。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页面数量。

1

筛选

用于根据各种条件筛选和优化搜索结果的选项。

参数
说明
默认值

context:safe_search

安全搜索。设置为以启用它。 true 以启用它。

false

context: tbs

tbs 参数。该参数类似于一个容器,用于包含更晦涩的 google 参数,例如按日期限制/排序结果以及其他某些依赖于 tbm 参数(例如 tbs=app_os:1 仅在与一起使用时可用 tbm value app)。更多信息 此处.

-

其他

用于专门需求的其他高级设置和控制。

参数
说明
默认值

context: fpstate

fpstate 的值设置为 aig 将使 Google 加载更多应用。仅在与一起使用时此参数才有用。 render 参数。

-

context: nfpr

true 将关闭拼写自动更正

false

上下文参数

所有上下文参数应作为对象添加到 context 数组,包含 keyvalue 键值对,例如:

结构化数据

SERP 爬虫 API 能够提取包含 Google 搜索结果的 HTML 或 JSON 对象,提供有关结果页面各元素的结构化数据。

google_search 图片结构化输出

我们仅解析图片搜索结果用于 desktop 搜索。

输出数据字典

HTML 示例

JSON 结构

Google 图片搜索的结构化输出包含诸如以下字段 URL, page, results等字段。下表列出了我们解析的每个 SERP 功能的详细列表,以及其描述和数据类型。表中还包含一些元数据。

特定结果类型的项数和字段可能会根据搜索查询而变化。

键 (results.images)
说明
类型

url

Google 搜索页面的 URL。

字符串

results

包含搜索结果的字典。

数组

results.organic

包含各自详细信息的未付费结果列表。

数组

resaults.search_information

已提交搜索查询的详细信息列表。

对象

results.suggested_searches

在原始搜索查询下方显示的建议搜索列表。

数组

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

page

相对于 Google SERP 分页的页码。

整数

job_id

与抓取作业关联的作业 ID。

字符串

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

在下列部分,当结果类型存在多个项时,解析后的 JSON 代码片段会被缩短。

自然

图片搜索 organic 部分显示 Google 图片搜索结果中的未付费列表,按 Google 的算法按相关性组织。这些结果呈现给寻找视觉内容的用户,并在一个与其他搜索结果类型区分开的专用部分中显示。

键 (results.organic)
说明
类型

pos

表示图像在列表中位置的唯一指示器。

字符串

link

图片所在网站的 URL。

数组

image

图片的 URL。

数组

title

图片所在文章的标题。

对象

domain

包含该图片结果的网站域名。

数组

pos_overall

表示图像在列表中位置的唯一指示器。

整数

搜索信息

搜索信息 是一个提供有关搜索查询详细信息的部分。它包括原始搜索词以及(如适用) Google 进行的任何自动更正信息。

键 (results.search_information)
说明
类型

query

原始搜索词。

字符串

showing_results_for

搜索结果所显示的搜索词。 queryshowing_results_for 如果 Google 对提供的搜索词进行了自动更正,则可能不同。

数组

建议搜索

suggested_searches (数组)在 Google 图片搜索中提供与原始查询相关的建议搜索词列表。用户可以探索这些额外的搜索选项以缩小或扩展他们的图片搜索。

最后更新于

这有帮助吗?