购物商品

使用网页爬虫API 获取详细的 Google Shopping 商品数据,包括价格、评论、规格和变体。

google_shopping_product source 使用 a 从 Google Shopping 获取详细的产品信息(标题、描述、价格、卖家、相关商品、评论等) product token 来自 google_shopping_search source.

请求示例

在下面的代码示例中,我们使用有效的 token 发起请求,以检索 Google Shopping 商品的商品页面。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
       "source": "google_shopping_product",
       "query": "<PRODUCT_TOKEN>",
       "render": "html",
       "parse": true
    }'

我们使用同步的 Realtime 集成方法作为示例。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Google Shopping 商品页面的基础设置和自定义选项。

参数
说明
默认值

source

设置爬虫。

google_shopping_product

query

来自的 product token google_shopping_search

-

render

设置为 html. 必需 以便从 "More stores" 部分获取额外的价格结果。 更多信息.

-

parse

设置为 true时返回解析后的数据。查看输出 数据字典.

false

callback_url

您的回调端点 URL。 更多信息

-

user_agent_type

设备类型和浏览器。完整列表可在 这里.

desktop

- 必填参数

本地化

将结果适配到特定的地理位置、域名和语言。

参数
说明
默认值

geo_location

结果应适配的地理位置。正确使用此参数对于获取正确数据极其重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 这里.

-

locale

Accept-Language 用于界面语言更改的 header 值。 更多信息.

-

结构化数据

下面可以找到一个 结构化输出示例 用于 google_shopping_product.

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个商品页面元素的详细列表,以及它们的描述和数据类型。表中还包括一些元数据。

说明
类型

url

Google Shopping 商品页面的 URL。

字符串

title (可选)

商品列表的标题。

字符串

描述

商品的详细描述。

字符串

images

包含商品图片的 object。

对象

images.full_size

包含商品全尺寸图片 URL 的 array。

数组

images.thumbnails

包含商品缩略图 URL 的 array。

数组

pricing

包含所有在线价格信息的 array。

数组

reviews

包含评论信息的 object。(仅限美国)

对象

variants

包含商品变体(颜色、尺寸等)的 object array。

数组

related_items

包含相关商品的 object array。

数组

specifications

包含商品规格的 object array。

数组

parse_status_code

解析任务的状态码。你可以查看所描述的解析器状态码 这里.

整数

created_at

抓取任务创建时的时间戳。

timestamp

updated_at

抓取任务完成时的时间戳。

timestamp

status_code

抓取任务的状态码。你可以查看所描述的抓取器状态码 这里.

整数

job_id

与抓取任务关联的任务 ID。

字符串

在以下部分中,当某种结果类型包含多个项目时,解析后的 JSON 代码片段会被缩短。

价格信息

包含商品价格信息的 object。

键(pricing[])
说明
类型

online

包含该商品价格详情的 object array。

数组

online.price

指定货币中的商品价格。

浮点数

online.seller

提供该商品的卖家或商家名称。

字符串

online.details

关于商品购买的附加信息,如配送和退货政策。

字符串

online.currency

商品价格的货币代码。

字符串

online.condition

商品状况。

字符串

online.price_tax

应用于商品价格的税额。

浮点数

online.price_total (可选)

包含税费在内的商品总价。

浮点数

online.seller_link

卖家该商品页面的 URL。

字符串

online.price_shipping

商品的运费。

浮点数

评论

包含该商品评论和评分信息的 object。

目前,评论仅适用于美国 locale。

键(reviews[])
说明
类型

rating

商品的平均评分,通常满分为 5。

浮点数

top_review (可选)

包含该商品顶级评论详情的 object。

对象

top_review.text (可选)

顶级评论的文本内容

字符串

top_review.title (可选)

顶级评论的标题。

字符串

top_review.author (可选)

顶级评论作者。

字符串

top_review.rating (可选)

顶级评论作者给出的评分,通常满分为 5。

浮点数

top_review.source (可选)

发布顶级评论的网站或来源。

字符串

rating_stars

商品的平均评分,通常满分为 5 星。

浮点数

reviews_count (可选)

商品的评论总数。

整数

reviews_by_stars

包含各星级评论数量的 object。

对象

reviews_by_stars.url (可选)

包含 X 星评论详情的 object。

字符串

reviews_by_stars.reviews_count

X 星评论的数量。

整数

相关商品(更多选项)

包含目标商品相关商品的 object array。

键(related_items[])
说明
类型

项目

包含每个相关商品详情的 object array。

数组

items.url

相关商品页面的 URL。

字符串

items.image

相关商品图片的 URL。

字符串

items.price

指定货币中的相关商品价格。

浮点数

items.title (可选)

相关商品列表的标题。

字符串

items.rating (可选)

相关商品的平均用户评分,通常满分为 5。

整数

items.store (可选)

提供相关商品的商店或商家名称。

字符串

items.currency

商品价格的货币代码。

字符串

items.reviews_count

相关商品的评论总数。

整数

title

相关商品部分的标题或表头

字符串

规格

包含商品规格详情的 object array。

键 (specifications[])
说明
类型

项目

包含各项单独规格详情的 object array。

数组

items.title

规格的标题。

字符串

items.value

规格的值。

字符串

section_title

规格部分的标题或表头。

字符串

最后更新于

这有帮助吗?