Documentation has been updated: see help center and changelog in one place.

购物商品

使用 Web Scraper API 检索详细的 Google Shopping 商品数据,包括价格、评论、规格和变体。

google_shopping_product source 使用一个从 Google Shopping 获取的详细产品信息(标题、描述、价格、卖家、相关商品、评论等)的 产品令牌 从…获取 google_shopping_search source.

请求示例

在下面的代码示例中,我们使用有效令牌发起请求以检索 Google Shopping 产品的商品页面。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
       "source": "google_shopping_product",
       "query": "<PRODUCT_TOKEN>",
       "render": "html",
       "parse": true
    }'

重要:query 参数必须包含通过以下方式生成的有效令牌 google_shopping_search source.

在我们的示例中,我们使用同步的 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步的 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Google Shopping 产品页面的基本设置和自定义选项。

参数
说明
默认值

source

设置抓取器。

google_shopping_product

query

来自的产品令牌 google_shopping_search

-

render

启用 JavaScript 渲染,当设置为 html. 必需 以从“更多商店”部分接收额外的价格结果。 更多信息.

-

parse

当设置为以下值时返回解析后的数据 true。 查看输出 数据字典.

false

callback_url

回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 必填参数

本地化

将结果适配到特定的地理位置、域名和语言。

参数
说明
默认值

geo_location

应为其适配结果的地理位置。正确使用此参数对于获取正确数据非常重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 此处.

-

domain

Google 域名本地化。可用域名的完整列表可在此找到 此处.

com

locale

Accept-Language 用于界面语言更改的头部值。 更多信息.

-

context: results_language

结果语言。支持的 Google 语言列表可在此处找到 此处.

-

结构化数据

下面您可以找到一个 结构化输出示例 用于 google_shopping_product.

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个产品页面元素的详细清单、说明和数据类型。表中还包括一些元数据。

说明
类型

url

指向 Google Shopping 产品页面的 URL。

字符串

title

商品列表的标题。

字符串

description

产品的详细描述。

字符串

images

包含产品图片的对象。

对象

images.full_size

产品全尺寸图片 URL 的数组。

数组

images.thumbnails

产品缩略图 URL 的数组。

数组

pricing

包含所有在线定价信息的数组。

数组

评价

包含评论信息的对象。(仅限美国)

对象

variants

包含产品变体的对象数组。(颜色、尺寸等)

数组

related_items

包含相关商品的对象数组。

数组

specifications

包含产品规格的对象数组。

数组

parse_status_code

解析任务的状态代码。您可以在此处查看解析器状态代码说明 此处.

整数

created_at

抓取任务创建的时间戳。

时间戳

updated_at

抓取任务完成的时间戳。

时间戳

status_code

抓取任务的状态代码。您可以在此处查看爬虫状态代码说明 此处.

整数

job_id

与抓取任务关联的作业 ID。

字符串

在下列部分,当某个结果类型有多于一项时,解析后的 JSON 代码片段将被简短化。

定价

包含产品定价信息的对象。

...
   "pricing": {
    "online": [
        {
          "price": 559,
          "seller": "Walmart - Seller",
          "details": "Pny GeForce RTX 4070 GPU 12gb Xlr8 Gaming Verto Epic-x RGB Triple Fan Dlss 3 Graphics Card",
          "currency": "USD",
          "condition": "New",
          "seller_link": "https://www.walmart.com/ip/PNY-GeForce-RTX-4070-GPU-12GB-XLR8-Gaming-VERTO-EPIC-X-RGB-Triple-Fan-DLSS-3-Graphics-Card/1396859462?wmlspartner=wlpa&selectedSellerId=101035116&selectedOfferId=159733DADC653E1891C050148D16D747&conditionGroupCode=1",
          "price_shipping": 22.05
        },
...
    ]
},
...
键 (pricing[])
说明
类型

online

包含产品定价详情的对象数组。

数组

online.price

以指定货币表示的产品价格。

float

online.seller

提供该产品的卖家或商家的名称。

字符串

online.details

关于产品或购买的附加信息,例如交付和退货政策。

字符串

online.currency

产品价格的货币代码。

字符串

online.condition

商品的状态或成色。

字符串

online.price_tax

应用于产品价格的税额。

float

online.price_total (可选)

包括税费在内的产品总价。

float

online.seller_link

指向该产品卖家页面的 URL。

字符串

online.price_shipping

产品的运费。

float

评论

包含产品评论和评分信息的对象。

目前,评论仅在美国区域可用。

...       
       "reviews": {
    "rating": 4.7,
    "top_review": {
        "text": "我的电脑是 Dell Optiplex 9020,i7-4770,32mb,500gb SSD。三风扇显卡较长,必须移除硬盘笼才能安装进 Optiplex 机箱。电源升级到 750 瓦,这需要为 Dell 主板使用适配器。完成这些修改后,安装显卡没有问题,但需要通过 Google 在 Nvidia 网站上找到驱动。我在 Blender 中将此 GPU 用于 3D 动画。对在 EEVEE 和 Cycles 中使用光线追踪渲染的速度非常满意。由于这是台较旧的电脑,CPU 从未达到 100%,我还未能完全发挥此显卡的性能。我没有听到风扇运转的声音,但我还没有给它施加足够高的负载,估计会有。渲染时会有轻微的电子嗡嗡声。\u00a0更少",
        "author": "walmart.com Shopper",
        "rating": 5,
        "source": "Reviewed on walmart.com"
      },
      "rating_stars": 4.7,
      "reviews_count": 51,
      "reviews_by_stars": {
        "1": {
          "reviews_count": 2
        },
        "2": {
          "reviews_count": 0
        },
        "3": {
          "reviews_count": 2
        },
        "4": {
          "reviews_count": 3
        },
        "5": {
          "reviews_count": 44
        }
    },
},
...
键(reviews[])
说明
类型

rating

产品的平均评分,通常以 5 分为满分。

float

top_review

包含产品最有代表性评论详情的对象。

对象

top_review.text (可选)

最有代表性评论的文本内容。

字符串

top_review.title (可选)

最有代表性评论的标题。

字符串

top_review.author

最有代表性评论的作者。

字符串

top_review.rating

最有代表性评论作者给出的评分,通常以 5 分为满分。

float

top_review.source

最有代表性评论发布的来源或网站。

字符串

rating_stars

产品的平均评分,通常以 5 星为满分。

float

reviews_count (可选)

该产品的评论总数。

整数

reviews_by_stars

包含每个星级评分评论计数的对象。

对象

reviews_by_stars.url (可选)

包含 X 星评论详情的对象。

字符串

reviews_by_stars.reviews_count

X 星评论的数量。

整数

相关商品(更多选项)

包含目标产品相关商品的对象数组。

...             
   "related_items": [
      {
        "items": [
          {
            "url": "/search?ibp=oshop&prds=catalogid:1368129371371338580,gpcid:14975392695437189622,headlineOfferDocid:2388507960063782588,imageDocid:1618178582933849531,productid:7780474142858650836,pvo:2,pvt:hg,rds:PC_14975392695437189622%7CPROD_PC_14975392695437189622&q=nvidia+rtx&gl=us&hl=en&pvorigin=2",
            "image": "https://encrypted-tbn3.gstatic.com/shopping?q=tbn:ANd9GcScO-LIdlqj1WjcLznMECFXNo4qbZ1TRbkfHdDsDPoIYxx7S9TjKhnQX7Ah6QsKI-zPBKFrC54H0wGZC60Q_NdRebesvYUXwRhQFuZRwvtWmx4_0xoxbylM",
            "price": 639.99,
            "title": "NVIDIA GeForce RTX 5070 12GB GDDR7 Graphics Card",
            "currency": "USD",
            "reviews_count": 228
          },
...
        ],
        "title": "More options"
     }
],
...
键(related_items[])
说明
类型

items

包含每个相关商品详情的对象数组。

数组

items.url

相关产品页面的 URL。

字符串

items.image

相关产品图片的 URL。

字符串

items.price

相关产品以指定货币表示的价格。

float

items.title (可选)

相关产品列表的标题。

字符串

items.rating (可选)

相关产品的平均用户评分,通常以 5 分为满分。

整数

items.store (可选)

提供相关产品的商店或商家的名称。

字符串

items.currency

产品价格的货币代码。

字符串

items.reviews_count

相关产品的评论总数。

整数

title

相关商品部分的标题或标题。

字符串

规格

包含产品规格详情的对象数组。

...
"specifications": [
    {
        "items": [
          {
            "title": "Manufacturer",
            "value": "PNY"
          },
          {
            "title": "Output",
            "value": "HDMI, DisplayPort"
          },
          {
            "title": "Interface",
            "value": "PCI Express"
          },
          {
            "title": "Brand",
            "value": "PNY"
          },
...
        ],
        "section_title": "attributes"
      }
],
...
键 (specifications[])
说明
类型

items

包含单个规格详情的对象数组。

数组

items.title

规格的标题。

字符串

items.value

规格的数值或内容。

字符串

section_title

规格部分的标题或标题。

字符串

最后更新于

这有帮助吗?