购物产品

使用 Web Scraper API 检索详细的 Google Shopping 产品数据,包括价格、评价、规格和变体。

google_shopping_product source 使用 一个 从 Google Shopping 获取的 详细产品信息(标题、描述、价格、卖家、相关商品、评论等)的 产品令牌 从 以下 获取 google_shopping_search source.

请求示例

在下面的示例代码中,我们使用有效令牌发出请求以检索 Google Shopping 产品的产品页面。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
       "source": "google_shopping_product",
       "query": "<PRODUCT_TOKEN>",
       "render": "html",
       "parse": true
    }'

重要:query 参数必须包含 通过 生成 的 有效令牌 google_shopping_search source.

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Google Shopping 产品页面的基本设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

google_shopping_product

query

来自 的产品令牌 google_shopping_search

-

render

设置为时启用 JavaScript 渲染 html. 必需 以从“更多商店”部分接收额外的价格结果。 更多信息.

-

parse

设置为时返回解析数据 true。探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 强制参数

本地化

将结果适配到特定的地理位置、域名和语言。

参数
说明
默认值

geo_location

应适配结果的地理位置。正确使用此参数对于获取正确数据非常重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 此处.

-

domain

Google 域名本地化。可用域名的完整列表可在 此 处 找到 此处.

com

locale

Accept-Language 用于界面语言更改的 header 值。 更多信息.

-

context: results_language

结果语言。支持的 Google 语言列表可在此找到 此处.

-

结构化数据

下面您可以找到一个 结构化输出示例 用于 google_shopping_product.

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个产品页面元素的详细清单,包含其描述和数据类型。表中还包括一些元数据。

说明
类型

url

Google Shopping 产品页面的 URL。

字符串

title

商品列表的标题。

字符串

description

产品的详细描述。

字符串

images

包含产品图片的对象。

对象

images.full_size

包含产品全尺寸图片 URL 的数组。

数组

images.thumbnails

包含产品缩略图 URL 的数组。

数组

pricing

包含所有在线价格信息的数组。

数组

评论

包含评论信息的对象。(仅限美国)

对象

variants

包含产品变体的对象数组。(颜色、尺寸等)

数组

related_items

包含相关商品的对象数组。

数组

specifications

包含产品规格的对象数组。

数组

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

job_id

与抓取作业关联的作业 ID。

字符串

在下列部分,当结果类型存在多个项时,解析后的 JSON 代码片段会被缩短。

Pricing

包含产品价格信息的对象。

键 (pricing[])
说明
类型

online

包含产品价格详细信息的对象数组。

数组

online.price

指定货币下的产品价格。

float

online.seller

提供该产品的卖家或商家的名称。

字符串

online.details

关于产品或购买的附加信息,例如配送和退货政策。

字符串

online.currency

产品价格的货币代码。

字符串

online.condition

产品的状况。

字符串

online.price_tax

应用于产品价格的税额。

float

online.price_total (可选)

包含税费在内的产品总价。

float

online.seller_link

卖家产品页面的 URL。

字符串

online.price_shipping

产品的运费。

float

评论

包含产品评论和评分信息的对象。

目前,评论仅在美国区域可用。

键(reviews[])
说明
类型

rating

产品的平均评分,通常以 5 分为满分。

float

top_review

包含产品最佳评论详情的对象。

对象

top_review.text (可选)

最佳评论的文本内容

字符串

top_review.title (可选)

最佳评论的标题。

字符串

top_review.author

最佳评论的作者。

字符串

top_review.rating

最佳评论作者给出的评分,通常以 5 分为满分。

float

top_review.source

发布最佳评论的来源或网站。

字符串

rating_stars

产品的平均评分,通常以 5 星为满分。

float

reviews_count (可选)

该产品的评论总数。

整数

reviews_by_stars

包含每个星级评分评论计数的对象。

对象

reviews_by_stars.url (可选)

包含 X 星评论详细信息的对象。

字符串

reviews_by_stars.reviews_count

X 星评论的数量。

整数

相关商品(更多选项)

包含目标产品相关商品的对象数组。

键(related_items[])
说明
类型

items

包含每个相关商品详细信息的对象数组。

数组

items.url

相关产品页面的 URL。

字符串

items.image

相关产品图片的 URL。

字符串

items.price

相关产品在指定货币下的价格。

float

items.title (可选)

相关产品列表的标题。

字符串

items.rating (可选)

相关产品的平均用户评分,通常以 5 分为满分。

整数

items.store (可选)

提供相关产品的商店或商家的名称。

字符串

items.currency

产品价格的货币代码。

字符串

items.reviews_count

相关产品的评论总数。

整数

title

相关商品部分的标题或标题文本

字符串

规格

包含产品规格详细信息的对象数组。

键 (specifications[])
说明
类型

items

包含单个规格详情的对象数组。

数组

items.title

规格的标题。

字符串

items.value

规格的值。

字符串

section_title

规格部分的标题或标题文本。

字符串

最后更新于

这有帮助吗?