图片搜索

提取 Google 图片搜索结果及其解析数据,包括自然图片列表、图片 URL、来源域名、标题、建议搜索和搜索信息。

google_search source 用于检索 Google 搜索结果(SERP)。此子页面专门展示与 Google 图片搜索相关的数据。要探索其他结果类型,请阅读这里: 网页搜索, 新闻搜索.

查看输出 数据字典 用于每个 Image SERP 功能,提供简要说明、截图、解析后的 JSON 代码片段,以及定义每个解析字段的表格。可通过右侧导航或向下滚动页面查看详细信息。

请求示例

在下面的示例中,我们发送请求以获取搜索词 adidas.

udm

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "google_search",
        "query": "adidas",
        "parse": true,
        "context": [
            {
                "key": "udm",
                "value": "2"
            }
        ]
    }'

tbm

我们使用同步的 Realtime 集成方法作为示例。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

抓取 Google 图片搜索结果的基本设置和自定义选项。

参数
说明
默认值

source

设置爬虫。

google_search

query

要搜索的关键词或短语。

-

context: udm

要获取图片搜索结果,请将值设为 2。查找其他可接受的值 这里.

-

context: tbm

要获取图片搜索结果,请将值设为 isch。其他可接受的值: app, blg, bks, dsc, nws, pts, plcs, rcp, lcl.

-

render

设置为 html. 更多信息.

-

parse

设置为 true时返回解析后的数据。查看输出 数据字典.

false

callback_url

您的回调端点 URL。 更多信息

-

user_agent_type

设备类型和浏览器。完整列表可在 这里.

desktop

- 必填参数

- udmtbm context 参数不能在单个抓取请求中同时使用; 请选择其中一个。同时使用两者可能会导致冲突或意外行为。

Google 高级搜索运算符

抓取时,您可能会发现将 Google 高级搜索运算符与您的查询结合使用很有帮助。这样您就可以自定义搜索范围,确保结果更相关、更聚焦。探索这些特殊命令 这里这里。请参见下面的示例。

本地化

将搜索结果适配到特定地理位置和语言。

参数
说明
默认值

geo_location

结果应适配的地理位置。正确使用此参数对于获取正确数据极其重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 这里.

-

locale

Accept-Language 请求头值,它会更改您的 Google 搜索页面 Web 界面语言。 更多信息.

-

分页

用于管理分页和检索搜索结果的控制项。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页数。

1

筛选

根据各种条件筛选和优化搜索结果的选项。

参数
说明
默认值

context:safe_search

安全搜索。设置为 true 即可启用。

false

context: tbs

tbs 参数。此参数类似于一个容器,用于存放更不常见的 Google 参数,例如按日期限制/排序结果以及其他筛选条件,其中一些取决于 tbm 参数(例如 tbs=app_os:1 仅在 tbm 值下可用 app)。更多信息 这里.

-

其他

适用于专门需求的其他高级设置和控制项。

参数
说明
默认值

context: fpstate

fpstate 值设置为 aig 会让 Google 加载更多应用。此参数仅在与 render 参数一起使用时才有用。

-

context: nfpr

true 将关闭拼写自动更正

false

Context 参数

所有 context 参数都应作为带有 context 对象添加到 key值下可用 对的数组中,例如:

结构化数据

SERP 爬虫 API 能够提取包含 Google 搜索结果的 HTML 或 JSON 对象,并针对结果页的各种元素提供结构化数据。

google_search 图片结构化输出

我们只解析以下内容的图片搜索结果 desktop 搜索。

输出数据字典

HTML 示例

JSON 结构

Google 图片搜索的结构化输出包括如下字段 URL, page, results等字段。下表列出了我们解析的每个 SERP 功能的详细清单,以及其描述和数据类型。该表还包含一些元数据。

特定结果类型的项目数和字段数可能因搜索查询而异。

键(results.images)
说明
类型

url

Google 搜索页面的 URL。

字符串

results

包含搜索结果的字典。

数组

results.organic

未付费结果及其各自详情的列表。

数组

resaults.search_information

已提交搜索查询的详细信息列表。

对象

results.suggested_searches

显示在原始搜索查询正下方的建议搜索列表。

数组

parse_status_code

解析任务的状态码。你可以查看所描述的解析器状态码 这里.

整数

created_at

抓取任务创建时的时间戳。

timestamp

updated_at

抓取任务完成时的时间戳。

timestamp

page

相对于 Google SERP 分页的页码。

整数

job_id

与抓取任务关联的任务 ID。

字符串

status_code

抓取任务的状态码。你可以查看所描述的抓取器状态码 这里.

整数

在以下部分中,当某种结果类型包含多个项目时,解析后的 JSON 代码片段会被缩短。

自然

Image Search organic 部分显示 Google 图片搜索结果中的未付费列表,并按 Google 算法的相关性进行排序。这些结果展示给寻找视觉内容的用户,并在一个独立于其他搜索结果类型的专用区域中显示。

键(results.organic)
说明
类型

pos

用于表示列表中图片位置的唯一标识。

字符串

link

放置该图片的网站 URL。

数组

image

图片的 URL。

数组

title

放置该图片所在文章的标题。

对象

域名

包含该图片结果的网站域名。

数组

pos_overall

用于表示列表中图片位置的唯一标识。

整数

搜索信息

搜索信息 是一个提供搜索查询详情的部分。它包含原始搜索词,以及在适用时 Google 所做的自动更正。

键(results.search_information)
说明
类型

query

原始搜索词。

字符串

showing_results_for

搜索结果所显示对应的搜索词。 queryshowing_results_for 如果 Google 自动更正了提供的搜索词,则可能不同。

数组

建议搜索

suggested_searches Google 图片搜索中的(数组)提供与原始查询相关的建议搜索词列表。用户可以探索这些额外的搜索选项,以优化或扩展图片搜索。

最后更新于

这有帮助吗?