商品

使用 Web Scraper API 轻松提取 Amazon 商品数据。通过自定义参数和示例获取标题、价格、评论和详情。

amazon_product 此数据源用于检索 Amazon 商品页面。

请求示例

在下面的示例中,我们发出请求以检索 ASIN 的商品页面 B08Y72CH1Famazon.nl 市场。若提供的 ASIN 为父 ASIN,我们会请求 Amazon 返回自动选择的变体的商品页面。API 将返回已解析的结果。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "amazon_product",
        "domain": "nl",
        "query": "B08Y72CH1F",
        "parse": true,
        "context": [
            {
                "key": "autoselect_variant",
                "value": true
            }
        ]
    }'

我们在示例中使用同步的 Realtime 集成方法。如果您希望使用 Proxy Endpoint 或异步的 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Amazon 商品页面的基础设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

amazon_product

query

10 位 ASIN 代码。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回已解析的数据 true. 探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 必填参数

本地化

将结果适配到特定地理位置、域名、语言。

参数
说明
默认值

geo_location

交付到 位置。有关使用此参数的指南,请参阅 此处.

-

domain

Amazon 的域名本地化。可用域名的完整列表可在 此处.

com

locale

Accept-Language 请求头的值,用于设置 Amazon 页面界面的语言。 更多信息.

-

circle-exclamation

其他

用于满足特殊需求的其他高级设置和控制项。

参数
说明
默认值

context: autoselect_variant

要获取准确的定价/Buy Box 数据,请将此参数设置为 true (这会指示我们在商品 URL 末尾追加 th=1&psc=1 URL 参数)。要获取父 ASIN 的商品页面的准确表示,请省略此参数或将其设置为 false.

false

context: 货币

设置货币。检查可用值 此处arrow-up-right.

取决于市场。检查默认值 此处arrow-up-right.

代码示例

结构化数据

Web Scraper API 能够提取包含 Amazon 商品结果的 HTML 或 JSON 对象,提供关于结果页各元素的结构化数据。

chevron-rightamazon_product 结构化输出hashtag

输出数据字典

使用右侧导航或向下滚动页面浏览详细信息。

circle-info

在以下各节中,如果结果类型有多于一项,解析后的 JSON 代码片段会被缩短。

HTML 示例

JSON 结构

下表列出了我们解析的每个 Amazon 商品页面元素的详细信息,包括其描述、数据类型,以及该元素在布局中是否始终存在或取决于所抓取的商品而可选。表中还包含一些元数据。

说明
类型
布局

url

Amazon 商品的 URL。

string

page

当前页码。

integer

page_type

标识 Amazon 页面类型。

string

asin

Amazon 标准识别号(ASIN)。

string

asin_in_url

从 URL 中提取 Amazon 标准识别号(ASIN)。

string

title

产品的标题。

string

manufacturer

产品制造商的名称。

string

product_name

产品名称。

string

description

从“产品描述”部分解析出的产品描述。

string

bullet_points

从“关于本产品”部分解析出的要点条目。

string

可选

category

包含有关 Amazon 产品类别的更多详细信息的列表。

array

可选

variation

包含有关 Amazon 产品变体的更多详细信息的列表。

array

可选

rating

产品的评分。

integer

price

产品的价格。

float

price_upper

价格的上限。

float

可选

price_sns

标识产品是否属于“Subscribe & Save” 订阅与省钱计划的一部分。

float

price_initial

产品的原始未折扣价格。

float

price_shipping

运费价格。

float

可选

price_buybox

Buy Box 中显示的产品价格。

float

deal_type

标识促销优惠的类别。

string

可选

coupon

指示任何可用的数字折扣。

string

可选

is_prime_eligible

指示产品是否符合 Amazon Prime 资格。

boolean

is_addon_item

指示产品是否仅在订单达到最低金额时才能购买。

boolean

可选

货币

价格所使用的货币。

string

discount_end

指示 Amazon 产品促销折扣有效的截止日期。

string

可选

stock

指示产品的库存状况。

string

reviews_count

产品的评论数量。

integer

reviews

包含带有各自详细信息的评论列表。

array

answered_questions_count

有关 Amazon 产品且已被回答的客户问题总数。

integer

可选

pricing_count

产品的报价数量。

integer

可选

pricing_url

检索 Amazon 产品报价列表的 URL。

string

可选

pricing_str

Amazon 产品定价详情的字符串表示。该属性包含当前价格、任何折扣、促销和特别优惠的信息。

string

可选

featured_merchant

有关为某 Amazon 产品突出显示的主要卖家或供应商的详细信息列表。

object

可选

sales_rank

关于 Amazon 产品在其所属类别中基于销售表现的排名位置的信息列表。

array

可选

sns_discounts

指示作为“Subscribe & Save” 计划一部分提供的任何折扣。

array

developer_info

与 Amazon 产品的开发者或制造商相关的信息。

object

可选

images

指示产品图片的 URL 列表。

array

product_overview

产品的关键属性及其描述的列表,提供有关产品特性的基本信息。

array

可选

store_url

卖家店铺网页的 URL。

string

可选

has_videos

指示产品是否包含任何视频。

boolean

delivery

关于配送选项的信息列表。

object

可选

brand

产品品牌。

string

可选

item_form

指定产品的物理形式或类型,说明其如何包装或交付以供使用。

string

可选

sales_volume

在特定时间范围内售出的单位数量。

string

可选

other_sellers

列出其他销售该产品的卖家的详细信息,包括卖家数量、起始价格及基本运费信息。

string

可选

rating_stars_distribution

关于产品评分分布的详细列表。

array

可选

buybox

关于产品定价的详细列表。

array

可选

lightning_deal

指示产品是否有时间限定的促销优惠。

object

可选

product_details

有关产品详情的信息列表。

object

可选

product_dimensions

产品的尺寸。

string

可选

max_quantity

客户在单次订单中允许购买的该 Amazon 产品的最大数量。

integer

可选

warranty_and_support

有关产品保修的详细信息列表。

object

可选

discount.percentage

对 Amazon 产品原价所应用的折扣百分比。

integer

可选

amazon_choice

指示产品是否具有 Amazon's Choice 徽章。

boolean

可选

coupon_discount_percentage

指示使用优惠券时适用的折扣百分比。

integer

可选

parent_asin

产品所属的 Amazon 产品家族的主要标识符。

string

可选

created_at

创建爬取作业的时间戳。

timestamp

updated_at

爬取作业完成的时间戳。

timestamp

job_id

与爬取作业关联的作业 ID。

string

status_code

爬取作业的状态代码。您可以查看爬虫状态代码的说明 此处.

integer

parse_status_code

解析作业的状态代码。您可以查看解析器状态代码的说明 此处.

integer

Category

此字段显示 Amazon 产品的类别层级结构。阶梯中的每个类别是包含名称和 URL 的对象,表示从最广泛类别到最具体子类别的路径。

键(category)
说明
类型

ladder

包含 Amazon 产品面包屑的列表。

array

ladder.name

Amazon 产品面包屑/类别的名称。

string

ladder.url

面包屑/类别的 URL。

string

广告(Ads)

此字段包含 Amazon 商品页面上展示的广告信息。每个广告表示为一个对象,包含类型、位置、标题、ASIN、图片、位置编号、评分、评论数、Prime 资格和价格等详细信息。

键(ads)
说明
类型

type

Amazon 广告的类型。

string

location

Amazon 广告位的名称。

string

title

产品的标题。

string

asin

Amazon 标准识别号(ASIN)。

string

images

产品图片的 URL。

string

pos

指示广告在所有可用广告结果中的唯一位置标识符。

integer

rating

产品的评分。

integer

reviews_count

产品的评论数量。

integer

is_prime_eligible

指示产品是否符合 Amazon Prime 资格。

boolean

price

产品的价格。

float

price_upper

(如适用)价格的上限。

float

评分星级分布(Rating Stars Distribution)

此字段包含产品星级评分的分布。每个对象代表一个星级评分及给出该评分的评论百分比。

键(rating_stars_distribution)
说明
类型

rating

表示评分数(从 5 到 1 的刻度)。

integer

percentage

表示特定评分的百分比。

string

评论(Reviews)

包含产品的客户评论,每条评论表示为包含相关详细信息的对象。

键(reviews)
说明
类型

id

Amazon 评论的字母数字标识。

string

title

评论的评分和标题。

string

author

提交评论的用户。

string

rating

提交评论时给出的星级评分,通常在 1 到 5 之间。

integer

content

评论内容的完整文本。

string

timestamp

评论的日期和地点,按 Amazon 提供的格式。

string

profile_id

评论作者个人资料的唯一标识符,用于链接到其 Amazon 个人资料。

string

is_verified

指示评论是否来自已验证购买。

boolean

review_from

提供关于评论来源的补充上下文(例如,按地区的热门评论或精选评论)。

string

helpful_count (可选)

该评论获得的有用票数。

integer

product_attributes (可选)

标识产品的特性。

string

Variations

此字段包含有关产品不同变体的信息,例如颜色、尺码、款式等。每个变体表示为一个对象,包含 ASIN、选择状态、尺寸(如颜色、尺码、款式)以及提示图像 URL 等详细信息。

键(variations)
说明
类型
布局

asin

产品变体的 Amazon 标准识别号(ASIN)。

array

selected

标识已选择的产品变体。

boolean

dimensions

变体产品的属性。

object

可选

dimensions.size

变体产品的尺寸。

string

可选

dimensions.color

变体产品的颜色。

string

可选

dimensions.style

变体产品的款式。

string

可选

dimensions.unit count

变体产品的标准单位数量。

string

可选

tooltip_image

变体图片的 URL。

string

可选

Warranty and Support

此字段包含有关产品保修和支持选项的信息。包括产品保修的描述以及获取保修信息的链接。

键(warranty_and_support)
说明
类型

description

产品可享保修的描述。

string

links

包含有关产品保修的更多信息的列表。

array

links.title

保修的标题。

string

links.url

包含有关产品保修的更多信息的 URL。

string

此字段提供有关出售该产品的特色商家的信息。包括商家名称、卖家 ID、商家页面链接、是否由 Amazon 履单以及发货来源等详细信息。

键(featured_merchant)
说明
类型

name

主要卖家的名称。

string

seller_id

卖家的 ID。

string

link

Amazon 卖家页面的 URL。

string

is_amazon_fulfilled

指示产品是否由 Amazon 自有物流网络履单。

boolean

shipped_from (可选)

指示发货地点。

string

Sales Rank

此字段提供有关产品在 Amazon 特定类别内的销售排名信息。每个对象表示一个销售排名条目,包括排名本身和类别阶梯,显示通向该排名类别的类别层级。

键(sales_rank)
说明
类型

排名

表示排名位置。

integer

ladder

关于产品所在排名类别的更详细信息列表。

array

ladder.url

相关畅销类别页面的 URL。

string

ladder.name

表示产品被排名的类别。

string

配送

此字段提供有关产品配送选项的信息,例如最快的配送方式和预计到达日期。

键(delivery)
说明
类型

type

表示配送的类型。

string

日期

有关配送日期的信息列表。

object

date.from

发货地点。

string

date.by

预计配送日期。

string

抢购框

亚马逊商品页面上的“buy box”部分,客户可以在此直接购买商品。该字段为买家提供关键信息,包括商品价格、库存可用性、配送选项和预计到达日期。

键(buybox)
说明
类型
布局

name

定价选项的名称。

string

可选

stock

产品的库存水平。

string

可选

delivery_type

表示配送的类型。

string

可选

delivery_details

关于产品配送的详情列表。

array

可选

日期

关于配送日期的详情列表。

object

可选

delivery_details.by

预计配送日期。

string

可选

delivery_details.from

产品的发货地点/配送信息。

string

可选

delivery_details.type

配送类型

string

可选

condition

产品的状况。

string

可选

price

产品的价格。

float

限时抢购

此字段提供有关亚马逊限时抢购的详细信息,限时抢购在有限时间内以折扣价销售商品。限时抢购是时限促销,对特定商品在短时间内提供大幅折扣,数量有限。客户需迅速行动,因为一旦时间或库存耗尽活动即结束。详情包括已申领百分比、折后价格和活动剩余时间。

键(lightning_deal)
说明
类型

percent_claimed

相对于原价的折扣幅度。

string

price_text

折后商品价格。

string

expires

表示限时抢购活动的结束日期。

string

产品概览

本节提供与产品相关的各种关键属性的结构化摘要。

键(product_overview)
说明
类型

product_overview

产品的关键属性及其描述列表。

数组

title

产品属性的标题。

string

description

产品属性的详细描述。

string

最后更新于

这有帮助吗?