For the complete documentation index, see llms.txt. This page is also available as Markdown.

产品

使用网页爬虫API 轻松提取 Amazon 产品数据。通过自定义参数和示例访问标题、价格、评论和详情。

amazon_product 数据源旨在检索 Amazon 产品页面。

请求示例

在下面的示例中,我们发起请求以检索 ASIN 为 B08Y72CH1Famazon.nl 市场的产品页面。如果提供的 ASIN 是父 ASIN,我们会要求 Amazon 返回一个自动选择的变体产品页面。API 将返回解析后的结果。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "amazon_product",
        "domain": "nl",
        "query": "B08Y72CH1F",
        "parse": true,
        "context": [
            {
                "key": "autoselect_variant",
                "value": true
            }
        ]
    }'

我们使用同步的 Realtime 集成方法作为示例。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

抓取 Amazon 产品页面的基本设置和自定义选项。

参数
说明
默认值

source

设置爬虫。

amazon_product

query

10 个字符的 ASIN 代码。

-

render

设置为 html. 更多信息.

-

parse

设置为 true时返回解析后的数据。查看输出 数据字典.

false

callback_url

您的回调端点 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 这里.

desktop

- 必填参数

本地化

将结果适配到特定地理位置、域名和语言。

参数
说明
默认值

geo_location

送达至 位置。请参阅我们关于使用此参数的指南 这里.

-

域名

Amazon 的域名本地化。可用域名完整列表见 这里.

com

locale

Accept-Language 标头值,用于设置 Amazon 页面界面语言。 更多信息.

-

其他

适用于专门需求的其他高级设置和控制项。

参数
说明
默认值

context: autoselect_variant

要获取准确的价格/buybox 数据,请将此参数设置为 true (这会告诉我们在产品 URL 末尾追加 th=1&psc=1 URL 参数)。要准确呈现父 ASIN 的产品页面,请省略此参数或将其设置为 false.

false

context: 货币

设置货币。查看可用值 这里.

取决于市场。查看默认值 这里.

代码示例

结构化数据

网页爬虫API 能够提取 HTML 或包含 Amazon 产品结果的 JSON 对象,提供结果页面中各个元素的结构化数据。

amazon_product 结构化输出

输出数据字典

可通过右侧导航或向下滚动页面来浏览详细信息。

在以下部分中,当某种结果类型包含多个项目时,解析后的 JSON 代码片段会被缩短。

HTML 示例

JSON 结构

下表展示了我们解析的每个 Amazon 产品页面元素的详细列表,包括其描述、数据类型,以及该元素在布局中是否始终存在,或根据您选择抓取的产品而为可选项。该表还包含一些元数据。

说明
类型
布局

url

Amazon 产品的 URL。

字符串

page

当前页码。

整数

page_type

标识 Amazon 页面类型。

字符串

asin

Amazon 标准识别号。

字符串

asin_in_url

从 URL 中提取 Amazon Standard Identification Number。

字符串

title

产品标题。

字符串

manufacturer

产品制造商名称。

字符串

product_name

产品名称。

字符串

描述

产品的描述,从“Product description”部分解析而来。

字符串

bullet_points

从“About this product”部分解析的项目符号条目。

字符串

可选

category

一个列表,包含有关 Amazon 产品类别的更多详细信息。

数组

可选

variation

一个列表,包含有关 Amazon 产品变体的更多详细信息。

数组

可选

rating

产品评分。

整数

价格

产品价格。

浮点数

price_upper

价格上限。

浮点数

可选

price_sns

标识产品是否属于“Subscribe & Save”计划的一部分。

浮点数

price_initial

产品的原始未折扣价格。

浮点数

price_shipping

运费价格。

浮点数

可选

price_buybox

产品在 buybox 中显示的价格。

浮点数

deal_type

标识促销优惠的类别。

字符串

可选

coupon

指示任何可用的数字折扣。

字符串

可选

is_prime_eligible

指示该产品是否符合 Amazon Prime 资格。

boolean

is_addon_item

指示产品是否仅可在订单达到最低金额门槛时作为附加商品购买。

boolean

可选

货币

价格所使用的货币。

字符串

discount_end

指示 Amazon 产品促销折扣有效截止的最终日期。

字符串

可选

stock

指示产品的库存水平。

字符串

reviews_count

产品的评论数量。

整数

reviews

一个评论列表及其各自的详细信息。

数组

answered_questions_count

关于 Amazon 产品且已获得回答的客户问题总数。

整数

可选

pricing_count

产品的报价数量。

整数

可选

pricing_url

用于检索 Amazon 产品报价列表的 URL。

字符串

可选

pricing_str

Amazon 产品定价详情的字符串表示。此属性包括当前价格、任何折扣、促销和特别优惠的信息

字符串

可选

featured_merchant

一个列表,包含 Amazon 产品重点展示的主要卖家或供应商的详细信息。

对象

可选

sales_rank

一个列表,包含 Amazon 产品基于销售表现,在各自类别中的排名位置信息。

数组

可选

sns_discounts

指示“Subscribe & Save”计划中可用的任何折扣。

数组

developer_info

与 Amazon 产品开发者或制造商相关的信息。

对象

可选

images

一个列表,包含表示产品图片的 URL。

数组

product_overview

一个列表,包含产品的关键属性及其描述,提供有关产品特征的基本详细信息。

数组

可选

store_url

卖家店铺网页的 URL。

字符串

可选

has_videos

指示产品是否有任何视频。

boolean

配送

一个列表,包含配送选项的信息。

对象

可选

brand

产品品牌。

字符串

可选

item_form

指定产品的物理形式或类型,说明其包装方式或交付使用方式。

字符串

可选

sales_volume

特定时间范围内售出的单位数量。

字符串

可选

other_sellers

列出该产品的其他卖家详情,包括卖家数量、其中的起始价格和基本配送信息。

字符串

可选

rating_stars_distribution

一个列表,包含产品评分的详细信息。

数组

可选

buybox

一个列表,包含产品定价的详细信息。

数组

可选

lightning_deal

指示该产品是否有可用的限时促销优惠。

对象

可选

product_details

一个列表,包含产品详细信息。

对象

可选

product_dimensions

产品尺寸。

字符串

可选

max_quantity

客户在单个订单中允许购买的 Amazon 产品最大件数。

整数

可选

warranty_and_support

一个列表,包含产品保修的详细信息。

对象

可选

discount.percentage

应用于 Amazon 产品原价的百分比降幅。

整数

可选

amazon_choice

指示产品是否带有 Amazon's Choice 徽章。

boolean

可选

coupon_discount_percentage

指示可通过优惠券享受的百分比减免。

整数

可选

parent_asin

产品所属 Amazon 产品家族的主要标识符。

字符串

可选

created_at

抓取任务创建时的时间戳。

timestamp

updated_at

抓取任务完成时的时间戳。

timestamp

job_id

与抓取任务关联的任务 ID。

字符串

status_code

抓取任务的状态码。你可以查看所描述的抓取器状态码 这里.

整数

parse_status_code

解析任务的状态码。你可以查看所描述的解析器状态码 这里.

整数

类别

此字段显示 Amazon 产品的产品类别层级结构。层级中的每个类别都是一个包含名称和 URL 的对象,表示从最广泛类别到最具体子类别的路径。

键(category)
说明
类型

ladder

一个列表,包含 Amazon 产品的面包屑导航。

数组

ladder.name

Amazon 产品的面包屑/类别名称。

字符串

ladder.url

面包屑/类别的 URL。

字符串

广告

此字段包含 Amazon 产品页面上显示的广告信息。每个广告表示为一个对象,包含类型、位置、标题、ASIN、图片、位置编号、评分、评论数、Prime 资格和价格等详细信息。

键(ads)
说明
类型

type

Amazon 广告的类型。

字符串

location

Amazon 广告位的名称。

字符串

title

产品标题。

字符串

asin

Amazon 标准识别号。

字符串

images

产品图片的 URL。

字符串

pos

表示广告在所有可用广告结果中的位置的唯一标识。

整数

rating

产品评分。

整数

reviews_count

产品的评论数量。

整数

is_prime_eligible

指示该产品是否符合 Amazon Prime 资格。

boolean

价格

产品价格。

浮点数

price_upper

适用时的价格上限。

浮点数

星级评分分布

此字段包含产品的星级评分分布。每个对象表示一个星级评分以及给予该评分的评论占总评论数的百分比。

键(rating_stars_distribution)
说明
类型

rating

指示评分数字(范围从 5 到 1)。

整数

百分比

指示特定评分的百分比。

字符串

评论

包含产品的客户评论,每条评论都表示为一个包含相关详细信息的对象。

键(reviews)
说明
类型

id

Amazon 评论的字母数字标识。

字符串

title

评分和评论标题。

字符串

author

提交该评论的用户。

字符串

rating

提交评论时给出的星级评分,通常在 1 到 5 之间。

整数

内容

评论内容的完整文本。

字符串

timestamp

评论的日期和地点,格式与 Amazon 提供的一致。

字符串

profile_id

评论作者资料的唯一标识符,用于链接到其 Amazon 个人资料。

字符串

is_verified

指示该评论是否来自已验证购买。

boolean

review_from

提供有关评论来源的额外上下文(例如特定地区评论或热门评论)。

字符串

helpful_count (可选)

该评论收到的有帮助投票数。

整数

product_attributes (可选)

标识产品的特征。

字符串

变体

此字段包含产品不同变体的信息,例如颜色、尺寸、样式等。每个变体都表示为一个对象,包含 ASIN、选择状态、维度(如颜色、尺寸、样式等属性)以及提示图像 URL 等详细信息。

键(variations)
说明
类型
布局

asin

产品变体的 Amazon Standard Identification Number。

数组

selected

标识所选的产品变体。

boolean

dimensions

变体产品的维度。

对象

可选

dimensions.size

变体产品的尺寸。

字符串

可选

dimensions.color

变体产品的颜色。

字符串

可选

dimensions.style

变体产品的样式。

字符串

可选

dimensions.unit count

变体产品的标准单位数量。

字符串

可选

tooltip_image

变体图片的 URL。

字符串

可选

保修和支持

此字段包含产品的保修和支持选项信息。它包括产品保修的描述以及用于获取保修信息的链接。

键(warranty_and_support)
说明
类型

描述

产品可用保修的描述。

字符串

links

一个列表,包含有关产品保修的更多信息。

数组

links.title

保修的标题。

字符串

links.url

包含有关产品保修更多信息的 URL。

字符串

精选卖家

此字段提供销售该产品的精选卖家信息。包括卖家名称、卖家 ID、卖家页面链接、产品是否由 Amazon 配送以及发货来源等详细信息。

键(featured_merchant)
说明
类型

name

主要卖家的名称。

字符串

seller_id

卖家的 ID。

字符串

link

Amazon 卖家页面的 URL。

字符串

is_amazon_fulfilled

指示产品是否由 Amazon 自有物流网络履约配送

boolean

shipped_from (可选)

指示发货地点。

字符串

销售排名

此字段提供产品在 Amazon 特定类别中的销售排名信息。每个对象表示一个销售排名条目,包括排名本身以及类别层级,显示通向该排名类别的类别层次结构。

键(sales_rank)
说明
类型

rank

指示排名位置。

整数

ladder

一个列表,包含产品所在排名类别的更详细信息。

数组

ladder.url

相关畅销榜类别页面的 URL。

字符串

ladder.name

指示产品所在的排名类别。

字符串

配送

此字段提供产品配送选项的信息,例如最快配送方式和预计送达日期。

键(delivery)
说明
类型

type

指示配送类型。

字符串

date

一个列表,包含配送日期信息。

对象

date.from

发货地点。

字符串

date.by

预计送达日期。

字符串

购买框

Amazon 产品页面上的“buy box”部分,客户可在此直接购买商品。此字段为买家提供关键信息,包括产品价格、库存情况、配送选项和预计送达日期。

键(buybox)
说明
类型
布局

name

定价选项的名称。

字符串

可选

stock

产品的库存水平。

字符串

可选

delivery_type

指示配送类型。

字符串

可选

delivery_details

一个列表,包含产品配送的详细信息。

数组

可选

date

一个列表,包含配送日期的详细信息。

对象

可选

delivery_details.by

预计送达日期。

字符串

可选

delivery_details.from

商品的发货地点。

字符串

可选

delivery_details.type

配送类型

字符串

可选

condition

商品状况。

字符串

可选

价格

产品价格。

浮点数

限时抢购

此字段提供 Amazon 限时抢购的详细信息,在有限时间内提供折扣价格。限时抢购是对特定产品提供大幅折扣的限时促销,通常仅在数小时内且数量有限。客户必须迅速行动,因为一旦分配的时间结束或库存售罄,优惠即告失效。详细信息包括已抢购百分比、折后价格以及优惠到期前的剩余时间。

键(lightning_deal)
说明
类型

percent_claimed

相对于默认价格的折扣金额。

字符串

price_text

折后产品价格。

字符串

expires

指示限时抢购优惠的结束日期。

字符串

产品概览

本节提供与产品相关的各种关键属性的结构化摘要。

Key(product_overview)
说明
类型

product_overview

产品关键属性及其描述列表。

数组

title

产品属性的标题。

字符串

描述

产品属性的详细描述。

字符串

最后更新于

这有帮助吗?