购物搜索

google_shopping_search source 返回来自 Google Shopping 的搜索结果。每个呈现的结果都包含一个 产品令牌 这是使用 google_shopping_product source.

请求示例

在下方代码示例中,我们搜索 "Nvidia RTX" 以获取产品 token 在响应中。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
    "source": "google_shopping_search",
    "query": "nvidia rtx",
    "render": "html",
    "parse": true
    }'

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

参数
说明
默认值

source

设置要使用的爬虫。

google_shopping_search

query

要搜索的关键字或短语。

-

render

启用 JavaScript 渲染。必须设置为 html 以获取产品 tokens. 更多信息.

-

parse

设置为时返回解析数据 true。探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 强制参数

本地化

参数
说明
默认值

geo_location

应适配结果的地理位置。正确使用此参数对于获取正确数据非常重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 此处.

-

domain

Google 的域名本地化。完整可用域名列表可在此处找到 此处.

com

locale

Accept-Language 更改您 Google 搜索页面网页界面语言的 header 值。 更多信息.

-

context: results_language

结果语言。支持的 Google 语言列表可在此找到 此处.

-

分页

用于管理搜索结果分页和检索的控制。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页面数量。

1

上下文参数

用于定制搜索上下文或满足特殊需求的高级选项。上下文参数应如下面所示添加到 context 数组中:

参数
说明
默认值

context: 排序方式

按给定条件对产品列表进行排序。 r 应用默认的 Google 排序, rv - 按评论得分, p - 按价格从低到高, pd - 按价格从高到低。

r

context: min_price

要筛选的产品最低价格。

-

context: max_price

要筛选的产品最高价格。

-

context: nfpr

true 将关闭拼写自动更正。

-

结构化数据

下面您可以找到一个 结构化输出示例 用于 google_shopping_search.

输出数据字典

HTML 示例

JSON 结构

下表详细列出了我们解析的每个搜索页面元素及其描述和数据类型。表中还包含一些元数据。

说明
类型

url

查询的 Google Shopping 搜索页面的 URL。

字符串

page

搜索结果的当前页码。

整数

results

包含详细搜索结果的对象。

对象

pla (可选)

包含各自详情的产品列表广告(PLA)列表。

数组

filters (可选)

各种筛选器的列表。

数组

organic

包含相应详情的自然(非付费)列表。

数组

search_information

已提交搜索查询的详细信息列表。

对象

search_information.query

原始搜索词。

字符串

search_information.showing_results_for

显示搜索结果的搜索词。`query` 与 `showing_results_for` 可能不同,如果 Google 对提供的搜索词进行了自动更正。

字符串

last_visible_page

标识搜索结果页面中可见最大页码的值。(当通过滚动加载更多结果时为 -1)。

整数

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

job_id

与抓取作业关联的作业 ID。

字符串

在下列部分,当结果类型存在多个项时,解析后的 JSON 代码片段会被缩短。

付费商品列表广告

包含产品列表广告(PLA)对象的数组。 (示例示意)

键(pla)
说明
类型

items

页面中所有可用的 PLA。

数组

pos

表示给定项在 PLA 结果中位置的指示器。

整数

url

产品的 URL。

字符串

价格

列表广告中产品的价格。

字符串

title

列表广告中产品的标题。

字符串

rating

产品评分。

整数

卖家

列表广告中产品的卖家。

字符串

thumbnail

产品缩略图的 URL。

字符串

reviews_count

该产品的评论数量。

optional

pos_overall

结果在搜索引擎结果页(SERP)中的位置指示。

整数

筛选器

键(filters)
说明
类型

name

筛选类别的名称

字符串

values

类别内可用的筛选选项。

数组

values.url

表示该筛选选项的过滤后搜索查询的 URL。

字符串

values.value

筛选选项的显示名称

字符串

values.merchant_id (可选)

与此筛选选项关联的商家 ID。

字符串

自然

包含自然搜索结果详情的对象数组。

Key (organic)
说明
类型

pos

产品在搜索结果中的位置。

整数

url

产品页面的 URL。

字符串

type

列表布局的类型。

字符串

价格

指定货币下产品的价格。

float

title

产品列表的标题。

字符串

token

产品令牌。

字符串

rating (可选)

产品的平均用户评分,通常满分为 5。

整数

货币

产品价格的货币代码。

字符串

delivery

配送详情,包括预计送达日期和退货政策。

字符串

merchant (可选)

包含销售该产品的商家详情的对象。

对象

merchant.url

商家页面的 URL。

字符串

merchant.name

商家的名称。

字符串

price_str

作为字符串的产品价格,包含货币符号。

字符串

thumbnail

产品缩略图的 URL。

字符串

product_id

产品的唯一标识符。

字符串

pos_overall

产品在搜索结果中的总体位置。

整数

reviews_count (可选)

产品的总评论数。

整数

最后更新于

这有帮助吗?