产品

使用 Web Scraper API 轻松提取 Amazon 产品数据。通过自定义参数和示例访问标题、价格、评价和详情。

amazon_product 数据源用于检索 Amazon 产品页面。

请求示例

在下面的示例中,我们发出请求以检索 ASIN 的产品页面 B08Y72CH1Famazon.nl marketplace。如果提供的 ASIN 是父 ASIN,我们会要求 Amazon 返回自动选择的某个变体的产品页面。API 将返回已解析的结果。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "amazon_product",
        "domain": "nl",
        "query": "B08Y72CH1F",
        "parse": true,
        "context": [
            {
                "key": "autoselect_variant",
                "value": true
            }
        ]
    }'

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Amazon 产品页面的基本设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

amazon_product

query

10 位 ASIN 代码。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析数据 true。探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 强制参数

本地化

将结果适配到特定地理位置、域名、语言。

参数
说明
默认值

geo_location

配送至 位置。参阅我们关于使用此参数的指南 此处.

-

domain

Amazon 的域名本地化。可用域的完整列表可在此处找到 此处.

com

locale

Accept-Language 头部值,用于设置 Amazon 页面界面的语言。 更多信息.

-

其他

用于专门需求的其他高级设置和控制。

参数
说明
默认值

context: autoselect_variant

要获取准确的价格/Buybox 数据,请将此参数设置为 true (它告诉我们在产品 URL 末尾追加 th=1&psc=1 URL 参数)。要获取父 ASIN 产品页面的准确表示,请省略此参数或将其设置为 false.

false

context: 货币

设置货币。检查可用值 此处.

取决于市场。检查默认值 此处.

代码示例

结构化数据

Web Scraper API 能够提取包含 Amazon 产品结果的 HTML 或 JSON 对象,为结果页面的各个元素提供结构化数据。

amazon_product 结构化输出

输出数据字典

使用右侧导航或向下滚动页面浏览详细信息。

在下列部分,当结果类型存在多个项时,解析后的 JSON 代码片段会被缩短。

HTML 示例

JSON 结构

下表列出我们解析的每个 Amazon 产品页面元素的详细清单,包括其描述、数据类型,以及该元素在布局中是始终存在还是可选(取决于您抓取的产品)。表中还包含一些元数据。

说明
类型
布局

url

Amazon 产品的 URL。

字符串

page

当前页码。

整数

page_type

标识 Amazon 页面类型。

字符串

asin

Amazon 标准识别号(ASIN)。

字符串

asin_in_url

从 URL 中提取 Amazon 标准识别号(ASIN)。

字符串

title

产品标题。

字符串

manufacturer

产品制造商的名称。

字符串

product_name

产品名称。

字符串

description

从“产品描述”部分解析的产品描述。

字符串

bullet_points

从“关于此产品”部分解析出的要点项目。

字符串

optional

类别

包含有关 Amazon 产品类别的更详细信息的列表。

数组

optional

variation

包含有关 Amazon 产品变体的更多详细信息的列表。

数组

optional

rating

产品评分。

整数

价格

产品价格。

float

price_upper

价格的上限。

float

optional

price_sns

标识产品是否属于“Subscribe & Save”(订阅并省)计划的一部分。

float

price_initial

产品的原始未折扣价格。

float

price_shipping

运费价格。

float

optional

price_buybox

Buybox 中显示的产品价格。

float

deal_type

标识促销优惠的类别。

字符串

optional

coupon

表示任何可用的数字折扣。

字符串

optional

is_prime_eligible

指示该商品是否有资格享受 Amazon Prime。

布尔

is_addon_item

指示产品是否仅在订单达到最低金额阈值时可作为附加购买项购买。

布尔

optional

货币

价格所使用的货币。

字符串

discount_end

指示 Amazon 产品促销折扣有效的截止日期。

字符串

optional

stock

指示产品的库存水平。

字符串

reviews_count

该产品的评论数量。

整数

评论

包含评论及其各自详细信息的列表。

数组

answered_questions_count

有关 Amazon 产品的客户问题中已被回答的问题总数。

整数

optional

pricing_count

该产品的报价数量。

整数

optional

pricing_url

检索 Amazon 产品报价列表的 URL。

字符串

optional

pricing_str

Amazon 产品定价详情的字符串表示。此属性包括当前价格、任何折扣、促销和特别优惠的信息。

字符串

optional

featured_merchant

有关为某 Amazon 产品突出的主要卖家或供应商的详细信息列表。

对象

optional

sales_rank

有关 Amazon 产品在其所属类别中基于销售表现的排名位置的信息列表。

数组

optional

sns_discounts

指示作为“Subscribe & Save”计划一部分提供的任何折扣。

数组

developer_info

与 Amazon 产品的开发者或制造商相关的信息。

对象

optional

images

指示产品图片的 URL 列表。

数组

product_overview

产品的关键属性及其描述的列表,提供有关产品特性的重要细节。

数组

optional

store_url

卖家商店网页的 URL。

字符串

optional

has_videos

指示产品是否具有任何视频。

布尔

delivery

有关交付选项的信息列表。

对象

optional

brand

产品的品牌。

字符串

optional

item_form

指定产品的物理形式或类型,说明其如何包装或交付以供使用。

字符串

optional

sales_volume

特定时间段内售出的单位数量。

字符串

optional

other_sellers

列出其他卖家销售该产品的详细信息,包括卖家数量、其中的起始价格和基本运输信息。

字符串

optional

rating_stars_distribution

有关产品评分的详细分布信息的列表。

数组

optional

buybox

有关产品定价的详细信息列表。

数组

optional

lightning_deal

指示产品是否有限时促销优惠。

对象

optional

product_details

有关产品详细信息的信息列表。

对象

optional

product_dimensions

产品的尺寸。

字符串

optional

max_quantity

客户在单笔订单中被允许购买的某 Amazon 产品的最大数量。

整数

optional

warranty_and_support

有关产品保修的详细信息列表。

对象

optional

discount.percentage

应用于产品原价的降价百分比。

整数

optional

amazon_choice

指示产品是否具有 Amazon's Choice 徽章。

布尔

optional

coupon_discount_percentage

指示凭优惠券适用的折扣百分比。

整数

optional

parent_asin

产品所属的 Amazon 产品系列的主要标识符。

字符串

optional

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

job_id

与抓取作业关联的作业 ID。

字符串

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

Category

此字段显示 Amazon 产品的类别层级结构。层级中的每个类别都是一个具有名称和 URL 的对象,表示从最广泛类别到最具体子类别的路径。

Key (category)
说明
类型

ladder

包含 Amazon 产品面包屑的列表。

数组

ladder.name

Amazon 产品的面包屑/类别名称。

字符串

ladder.url

面包屑/类别的 URL。

字符串

广告

此字段包含有关在 Amazon 产品页面上显示的广告的信息。每个广告表示为一个对象,包含类型、位置、标题、ASIN、图片、位置索引、评分、评论数、Prime 资格和价格等详细信息。

Key (ads)
说明
类型

type

Amazon 广告的类型。

字符串

location

Amazon 广告位的名称。

字符串

title

产品标题。

字符串

asin

Amazon 标准识别号(ASIN)。

字符串

images

产品图片的 URL。

字符串

pos

表示广告在所有可用广告结果中的位置的唯一指示符。

整数

rating

产品评分。

整数

reviews_count

该产品的评论数量。

整数

is_prime_eligible

指示该商品是否有资格享受 Amazon Prime。

布尔

价格

产品价格。

float

price_upper

如适用,价格的上限。

float

Rating Stars Distribution

此字段包含产品星级评分的分布。每个对象表示一个星级评分及给出该评分的评论所占的百分比。

Key (rating_stars_distribution)
说明
类型

rating

指示评分数(从 5 到 1 的刻度)。

整数

percentage

指示特定评分的百分比比率。

字符串

评论

包含产品客户评论的字段,每条评论以对象形式包含相关详细信息。

Key (reviews)
说明
类型

id

Amazon 评论的字母数字标识符。

字符串

title

评论的评分和标题。

字符串

author

提交评论的用户。

字符串

rating

提交评论时打的星级,通常在 1 到 5 之间。

整数

内容

评论内容的完整文本。

字符串

timestamp

评论的日期和地点,按 Amazon 提供的格式。

字符串

profile_id

评论作者档案的唯一标识符,用于链接到其 Amazon 个人资料。

字符串

is_verified

指示评论是否来自已验证的购买。

布尔

review_from

提供有关评论来源的补充上下文(例如,特定地区的评论或精选评论)。

字符串

helpful_count (可选)

评论收到的有用投票数量。

整数

product_attributes (可选)

标识产品的特性。

字符串

Variations

此字段包含有关产品不同变体的信息,例如颜色、尺寸、款式等。每个变体表示为一个对象,包含 ASIN、是否被选中、尺寸属性(如颜色、尺寸、款式)以及工具提示图片 URL 等详细信息。

Key (variations)
说明
类型
布局

asin

产品变体的 Amazon 标准识别号(ASIN)。

数组

selected

标识所选的产品变体。

布尔

dimensions

变体产品的维度/属性。

对象

optional

dimensions.size

变体产品的尺寸。

字符串

optional

dimensions.color

变体产品的颜色。

字符串

optional

dimensions.style

变体产品的款式。

字符串

optional

dimensions.unit count

变体产品的标准单位数量。

字符串

optional

tooltip_image

变体图片的 URL。

字符串

optional

Warranty and Support

此字段包含有关产品保修和支持选项的信息。包括产品保修的描述和获取保修信息的链接。

Key (warranty_and_support)
说明
类型

description

可用产品保修的描述。

字符串

链接

包含有关产品保修的更多信息的列表。

数组

links.title

保修的标题。

字符串

links.url

包含有关产品保修更多信息的 URL。

字符串

此字段提供有关销售该产品的推荐商家的信息。包括商家名称、卖家 ID、商家页面链接、是否由 Amazon 履单以及发货来源等详细信息。

Key(featured_merchant)
说明
类型

name

主要卖家的名称。

字符串

seller_id

卖家 ID。

字符串

link

Amazon 卖家页面的 URL。

字符串

is_amazon_fulfilled

指示产品是否由 Amazon 自有物流网络履单。

布尔

shipped_from (可选)

指示发货地点。

字符串

Sales Rank

此字段提供有关产品在 Amazon 特定类别中的销售排名信息。每个对象表示一个销售排名条目,包括排名本身和类别层级,显示通向排名类别的类别层级结构。

Key(sales_rank)
说明
类型

rank

指示排名位置。

整数

ladder

包含有关产品被排名的类别的更详细信息的列表。

数组

ladder.url

相关畅销榜类别页面的 URL。

字符串

ladder.name

指示产品被排名的类别。

字符串

Delivery

此字段提供有关产品交付选项的信息,例如最快的交付方式和预计到达日期。

Key (delivery)
说明
类型

type

指示交付类型。

字符串

日期

有关交付日期的信息列表。

对象

date.from

发货地点。

字符串

date.by

预计交付日期。

字符串

Buy Box

Amazon 产品页面上的“buy box” 区域,客户可以在此直接购买商品。此字段为买家提供关键信息,包括产品价格、库存可用性、交付选项和预计到达日期。

Key (buybox)
说明
类型
布局

name

定价选项的名称。

字符串

optional

stock

产品的库存水平。

字符串

optional

delivery_type

指示交付类型。

字符串

optional

delivery_details

有关产品配送的详细信息列表。

数组

optional

日期

有关交付日期的详细信息列表。

对象

optional

delivery_details.by

预计交付日期。

字符串

optional

delivery_details.from

产品的发货地点。

字符串

optional

delivery_details.type

交付的类型。

字符串

optional

condition

产品的状况。

字符串

optional

价格

产品价格。

float

Lightning Deal

此字段提供有关 Amazon 限时闪购的信息,展示有限时间内的折扣价。闪购是对特定产品在有限时间段内提供的大幅折扣促销,通常仅持续几小时并且数量有限。由于时间或库存限制,顾客需迅速下单。详情包括已认领的百分比、折后价格和剩余时间。

Key(lightning_deal)
说明
类型

percent_claimed

与默认价格相比的折扣金额。

字符串

price_text

折扣后的产品价格。

字符串

expires

指示闪购优惠的结束时间。

字符串

Product Overview

本节提供有关产品各关键属性的结构化摘要。

Key(product_overview)
说明
类型

product_overview

产品的关键属性及其描述的列表。

Array

title

产品属性的标题。

字符串

description

产品属性的详细描述。

字符串

最后更新于

这有帮助吗?