购物搜索

提取 Google Shopping 搜索结果并解析自然商品列表和付费商品广告,包括价格、评分、评论、产品令牌等。

google_shopping_search source 返回来自 Google Shopping 的搜索结果。每个呈现的结果都包含一个 product token 它是使用 google_shopping_product source.

请求示例

在下面的代码示例中,我们搜索 "Nvidia RTX" 以获取产品的 令牌 在响应中。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
    "source": "google_shopping_search",
    "query": "nvidia rtx",
    "render": "html",
    "parse": true
    }'
circle-exclamation

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

参数
描述
默认值

source

设置爬虫。

google_shopping_search

query

要搜索的关键词或短语。

-

render

启用 JavaScript 渲染。必须设置为 html 以获取产品 令牌. 更多信息.

-

parse

当设置为时返回解析后的数据 true。查看输出 数据字典.

false

callback_url

回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 here.

desktop

- 必填参数

本地化

参数
描述
默认值

geo_location

应适配结果的地理位置。正确使用此参数对于获取正确数据非常重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 here.

-

locale

Accept-Language 标头值,用于更改您 Google 搜索页面的网页界面语言。 更多信息.

-

context: results_language

结果语言。受支持的 Google 语言列表可在 here.

-

circle-exclamation

分页

用于管理搜索结果分页和检索的控制项。

参数
描述
默认值

start_page

起始页码。

1

pages

要检索的页数。

1

上下文参数

用于定制搜索上下文或针对特殊需求的高级选项。上下文参数应按下面所示添加到 context 数组中:

参数
描述
默认值

context: sort_by

按给定条件对产品列表进行排序。 r 应用默认 Google 排序, rv - 按评论分数, p - 按价格升序, pd - 按价格降序。

r

context: min_price

要筛选的产品最低价格。

-

context: max_price

要筛选的产品最高价格。

-

context: nfpr

true 将关闭拼写自动更正。

-

结构化数据

下面您可以找到一个 结构化输出示例 之间, google_shopping_search.

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个搜索页面元素的详细清单,包括其描述和数据类型。表中还包含一些元数据。

描述
类型

url

查询对应的 Google Shopping 搜索页面的 URL。

字符串

page

搜索结果的当前页码。

整数

结果

包含详细搜索结果的对象。

对象

pla (可选)

包含各自详细信息的商品展示广告列表。

数组

filters (可选)

各种筛选器的列表。

数组

organic

包含各自详细信息的非付费(自然)列表。

数组

search_information

提交的搜索查询的详细信息列表。

对象

search_information.query

原始搜索词。

字符串

search_information.showing_results_for

搜索结果为其显示的搜索词。`query` 和 `showing_results_for` 如果 Google 自动更正了提供的搜索词可能会不同。

字符串

last_visible_page

标识搜索结果页面中可见最大页码的值。(当通过滚动启动加载更多结果时为 -1)。

整数

parse_status_code

解析任务的状态代码。您可以在此处查看解析器状态代码的描述 herearrow-up-right.

整数

created_at

抓取任务创建的时间戳。

timestamp

updated_at

抓取任务完成的时间戳。

timestamp

status_code

抓取任务的状态代码。您可以在此处查看抓取器状态代码的描述 herearrow-up-right.

整数

job_id

与抓取任务关联的作业 ID。

字符串

circle-info

在下列部分,当某个结果类型存在多个项目时,解析后的 JSON 代码片段会被缩短。

付费列表广告

包含产品列表广告 (PLA) 的对象数组。(示例)

键 (pla)
描述
类型

项目

页面中可用的所有 PLA 项目。

数组

pos

表示某个项目在 PLA 结果中位置的指示器。

整数

url

产品的 URL。

字符串

price

商品展示广告中产品的价格。

字符串

title

商品展示广告中产品的标题。

字符串

rating

产品的评分。

整数

seller

商品展示广告中产品的卖家。

字符串

thumbnail

产品缩略图图片的 URL。

字符串

reviews_count

产品的评论数量。

可选

pos_overall

表示该结果在 SERP 中的位置。

整数

筛选器

键 (filters)
描述
类型

name

筛选类别的名称

字符串

values

类别内可用的筛选选项。

数组

values.url

表示该筛选选项的过滤搜索查询的 URL。

字符串

values.value

筛选选项的显示名称

字符串

values.merchant_id (可选)

与此筛选选项关联的商家 ID。

字符串

自然结果

包含有机(自然)搜索结果详细信息的对象数组。

键 (organic)
描述
类型

pos

产品在搜索结果中的位置。

整数

url

产品页面的 URL。

字符串

类型

列表布局的类型。

字符串

price

指定货币下产品的价格。

浮点数

title

产品列表的标题。

字符串

令牌

产品令牌。

字符串

rating (可选)

产品的平均用户评分,通常以 5 分制计。

整数

currency

产品价格使用的货币代码。

字符串

delivery

交付详情,包括预计交付日期和退货政策。

字符串

merchant (可选)

包含有关出售该产品的商家详细信息的对象。

对象

merchant.url

商家页面的 URL。

字符串

merchant.name

商家的名称。

字符串

price_str

作为字符串显示的产品价格,包括货币符号。

字符串

thumbnail

产品缩略图的 URL。

字符串

product_id

产品的唯一标识符。

字符串

pos_overall

产品在搜索结果中的整体位置。

整数

reviews_count (可选)

该产品的评论总数。

整数

最后更新于

这有帮助吗?