购物搜索

提取 Google Shopping 搜索结果及其解析数据,包括自然商品列表和付费商品广告,涵盖价格、评分、评论、产品令牌等。

google_shopping_search source 返回来自 Google Shopping 的搜索结果。每个渲染结果都包含一个 product token 这是使用 google_shopping_product source.

请求示例

在下面的代码示例中,我们搜索 "Nvidia RTX" 以获取产品 token 在响应中。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
    "source": "google_shopping_search",
    "query": "nvidia rtx",
    "render": "html",
    "parse": true
    }'

我们使用同步的 Realtime 集成方法作为示例。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

参数
说明
默认值

source

设置爬虫。

google_shopping_search

query

要搜索的关键词或短语。

-

render

启用 JavaScript 渲染。必须设置为 html 以获取产品 tokens. 更多信息.

-

parse

设置为 true时返回解析后的数据。查看输出 数据字典.

false

callback_url

您的回调端点 URL。 更多信息

-

user_agent_type

设备类型和浏览器。完整列表可在 这里.

desktop

- 必填参数

本地化

参数
说明
默认值

geo_location

结果应适配的地理位置。正确使用此参数对于获取正确数据极其重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 这里.

-

locale

Accept-Language 请求头值,它会更改您的 Google 搜索页面 Web 界面语言。 更多信息.

-

分页

用于管理分页和检索搜索结果的控制项。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页数。

1

Context 参数

用于定制搜索上下文或满足特殊需求的高级选项。上下文参数应按如下所示添加到 context 数组中:

参数
说明
默认值

context: sort_by

按给定标准对产品列表排序。 r 应用默认的 Google 排序, rv - 按评分, p - 按价格升序, pd - 按价格降序。

r

context: 最低价格

用于筛选的产品最低价格。

-

context: 最高价格

用于筛选的产品最高价格。

-

context: nfpr

true 将关闭拼写自动纠正。

-

结构化数据

下面可以找到一个 结构化输出示例 用于 google_shopping_search.

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个搜索页面元素的详细列表,以及其描述和数据类型。表中还包括一些元数据。

说明
类型

url

该查询对应的 Google Shopping 搜索页面 URL。

字符串

page

搜索结果的当前页码。

整数

results

包含详细搜索结果的对象。

对象

pla (可选)

包含各自详细信息的商品列表广告列表。

数组

过滤器 (可选)

各种过滤器的列表。

数组

organic

包含各自详细信息的自然结果列表。

数组

search_information

已提交搜索查询的详细信息列表。

对象

search_information.query

原始搜索词。

字符串

search_information.showing_results_for

显示搜索结果所对应的搜索词。如果 Google 自动更正了提供的搜索词,`query` 和 `showing_results_for` 可能不同。

字符串

last_visible_page

标识搜索查询结果页中可见最大页码的值。(当通过滚动触发加载更多结果时为 -1)。

整数

parse_status_code

解析任务的状态码。你可以查看所描述的解析器状态码 这里.

整数

created_at

抓取任务创建时的时间戳。

timestamp

updated_at

抓取任务完成时的时间戳。

timestamp

status_code

抓取任务的状态码。你可以查看所描述的抓取器状态码 这里.

整数

job_id

与抓取任务关联的任务 ID。

字符串

在以下部分中,当某种结果类型包含多个项目时,解析后的 JSON 代码片段会被缩短。

付费商品广告

包含该产品的商品列表广告(PLA)的对象数组。(示例)

键(pla)
说明
类型

项目

页面内可用的所有 PLA。

数组

pos

表示某个项目在 PLA 结果中的位置的指示器。

整数

url

商品的 URL。

字符串

价格

列表广告中商品的价格。

字符串

title

列表广告中商品的标题。

字符串

rating

产品评分。

整数

seller

列表广告中商品的卖家。

字符串

thumbnail

产品缩略图的 URL。

字符串

reviews_count

产品的评论数量。

可选

pos_overall

结果在 SERP 中的位置指示。

整数

筛选条件

键(filters)
说明
类型

name

过滤器类别的名称

字符串

values

该类别中可用的过滤选项。

数组

values.url

表示该过滤选项筛选后搜索查询的 URL。

字符串

values.value

过滤选项的显示名称

字符串

values.merchant_id (可选)

与该过滤选项关联的商家 ID。

字符串

自然

包含有机搜索结果详情的对象数组。

键(自然)
说明
类型

pos

产品在搜索结果中的位置。

整数

url

商品页的 URL。

字符串

type

列表布局的类型。

字符串

价格

指定货币中的商品价格。

浮点数

title

商品列表的标题。

字符串

token

产品 token。

字符串

rating (可选)

产品的平均用户评分,通常满分为 5。

整数

货币

商品价格的货币代码。

字符串

配送

配送详情,包括预计送达日期和退货政策。

字符串

merchant (可选)

包含出售该产品的商家详情的对象。

对象

merchant.url

商家页面的 URL。

字符串

merchant.name

商家的名称。

字符串

price_str

产品价格字符串,包含货币符号。

字符串

thumbnail

产品缩略图的 URL。

字符串

product_id

产品的唯一标识符。

字符串

pos_overall

产品在搜索结果中的总体位置。

整数

reviews_count (可选)

商品的评论总数。

整数

最后更新于

这有帮助吗?