搜索

使用网页爬虫API 抓取 Amazon 搜索结果。结合 JS 渲染、地理位置和示例,获取产品标题、价格、评分等。

amazon_search 源用于检索 Amazon 搜索结果页。要查看包含检索数据的响应示例,请下载 示例输出 HTML 格式的文件,或查看结构化数据输出 这里.

查看输出 数据字典 适用于每个 Amazon Search 功能,提供简要说明、截图、已解析的 JSON 代码片段,以及定义每个已解析字段的表格。可使用右侧导航或向下滚动页面查看详细信息。

请求示例

在下面的代码示例中,我们发起请求以从以下来源检索结果 amazon.com,其中包括 2 搜索结果页,从第 #2 页开始,搜索词为 nirvana tshirt。此外,搜索将限制为类别 ID: 16391693031 ,价格将以 USD 货币显示。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "amazon_search",
        "domain": "com",
        "query": "nirvana tshirt",
        "start_page": 2,
        "pages": 2,
        "parse": true,
        "context": [
                {"key": "category_id", "value": "16391693031"},
                {"key": "currency", "value": "USD"},
                {"key": "refinements", "value": ["p_123:256097"]},
                {"key": "sort_by", "value": "featured"}
        ]
    }'

我们使用同步的 Realtime 集成方法作为示例。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

抓取 Amazon 搜索结果的基础设置和自定义选项。

参数
说明
默认值

source

设置爬虫。

amazon_search

query

要搜索的关键词或短语。

-

render

设置为 html. 更多信息.

-

parse

设置为 true时返回解析后的数据。查看输出 数据字典.

false

callback_url

您的回调端点 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 这里.

desktop

context: 货币

设置货币。查看可用值 这里.

-

- 必填参数

本地化

将结果适配到特定地理位置、域名和语言。

参数
说明
默认值

geo_location

送达至 位置。请参阅我们关于使用此参数的指南 这里.

-

域名

Amazon 的域名本地化。可用域名完整列表见 这里.

com

locale

Accept-Language 标头值,用于设置 Amazon 页面界面语言。 更多信息.

-

分页

用于管理分页和检索搜索结果的控制项。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页数。

1

排序和筛选

搜索结果页的排序和筛选控制。

参数
说明
默认值

sort_by

根据 Amazon 中可用的某个值设置搜索结果页的排序类型: "most_recent", "price_low_to_high", "price_high_to_low", "featured", "average_review", "bestsellers".

-

refinements

一个 列表 Amazon 搜索细化参数列表,用于对搜索结果应用特定筛选。这些参数对应 Amazon 的动态筛选选项(例如品牌、价格区间、特性),并遵循 Amazon 的内部参数格式,例如 p_123:256097p_n_feature_twenty-eight_browse-bin:98209020031.

由于筛选选项会因类别而异,并由 Amazon 动态生成,推荐工作流如下:

  1. 首先,使用 parse: true 抓取目标 Amazon 搜索页,以发现可用的细化选项

  2. 从已解析的响应中提取所需的筛选参数

  3. 在后续请求中通过 refinements 字段使用这些参数来应用特定筛选

-

context: category_id

在特定 Amazon 节点(商品类别)中搜索商品。

-

context: merchant_id

搜索由特定卖家销售的商品。

-

结构化数据

amazon_search 结构化输出

输出示例已缩短。

输出数据字典

API 返回一个包含从 Amazon 检索到的搜索结果的 HTML 或 JSON 对象。

HTML 示例

JSON 结构

所有搜索结果都包含在 results JSON 数组中。每个搜索结果都包括以下内容的组合: paid, organic, 建议的, amazons_choices,instant_recommendations 列表。此外,可能还会存在变体,并且它们会被捕获在 variations 键中,提供不同类型或类别产品的详细信息,例如不同的型号、版本或款式。

说明
类型

url

Amazon 搜索页面的 URL。

字符串

page

当前页码。

整数

pages

总页数。

整数

query

所使用的搜索查询。

字符串

results

包含搜索结果的字典。

对象

results.paid

赞助产品及其各自详细信息的列表。

数组

results.organic

自然产品及其各自详细信息的列表。

数组

results.suggested

建议产品及其各自详细信息的列表。

数组

results.amazons_choices

Amazon’s Choice 及其各自详细信息的列表。

数组

refinements

此搜索页面上可用的筛选条件列表。

数组

parse_status_code

解析任务的状态码。你可以查看所描述的解析器状态码 这里.

整数

total_results_count

该搜索查询找到的结果总数。

整数

created_at

抓取任务创建时的时间戳。

字符串

updated_at

抓取任务完成时的时间戳。

字符串

job_id

与抓取任务关联的任务 ID。

字符串

status_code

抓取任务的状态码。你可以查看所描述的抓取器状态码 这里.

整数

parser_type

用于解析数据的解析器类型。

字符串

在以下部分中,当某种结果类型包含多个项目时,解析后的 JSON 代码片段会被缩短。

付费

paid 搜索结果部分指的是显示在 Amazon 搜索结果中的内嵌广告内容。

说明
类型

url

商品的 URL。

字符串

asin

Amazon 标准识别号。

字符串

价格

产品价格。

浮点数

title

产品标题。

字符串

rating

产品评分。

浮点数

rel_pos

产品在搜索结果中的相对位置。

(以下任一 posrel_pos 存在)

整数

pos

表示列表中位置的唯一标识。(以下任一 posrel_pos 存在)

整数

货币

价格所使用的货币。

字符串

url_image

商品图片的 URL。

字符串

best_seller

表示该产品是否为畅销商品。

boolean

price_upper

适用时的价格上限。

浮点数

is_sponsored

表示该产品是否为赞助商品。

boolean

manufacturer

产品制造商名称。

字符串

pricing_count

产品的报价数量。

整数

reviews_count

产品的评论数量。

整数

coupon_discount

折扣金额。

整数(可选)

coupon_discount_type

折扣类型: 固定金额百分比.

字符串(可选)

is_amazons_choice

表示该产品是否被标记为“Amazon’s Choice”。

boolean

no_price_reason

表示价格不存在的原因,如果其等于 0.0

字符串(可选)

sales_volume

某个特定产品的销售量或售出数量。

字符串(可选)

is_prime

指示该产品是否符合 Amazon Prime 资格。

boolean

shipping_information

关于产品配送详情的信息

字符串

自然

organic 搜索结果部分指的是根据 Amazon 的搜索算法自然显示的非赞助内容。

名称
说明
类型

pos

表示列表中位置的唯一标识。

整数

url

商品的 URL。

字符串

asin

Amazon 标准识别号。

字符串

价格

产品价格。

浮点数

title

产品标题。

字符串

rating

产品评分。

浮点数

货币

价格所使用的货币。

字符串

is_prime

指示该产品是否符合 Amazon Prime 资格。

boolean

url_image

商品图片的 URL。

字符串

best_seller

表示该产品是否为畅销商品。

boolean

price_upper

适用时的价格上限。

浮点数

is_sponsored

表示该产品是否为赞助商品。

boolean

manufacturer

产品制造商名称。

字符串

sales_volume

某个特定产品的销售量或售出数量。

字符串(可选)

pricing_count

产品的价格数量。

整数

reviews_count

产品的评论数量。

整数

coupon_discount

折扣金额。

整数(可选)

coupon_discount_type

折扣类型: 固定金额百分比.

字符串(可选)

is_amazons_choice

表示该产品是否为 Amazon’s Choice。

boolean

price_strikethrough

任何折扣前的原价。

浮点数

shipping_information

配送日期和运费详情。

字符串

no_price_reason

表示价格不存在的原因,如果其等于 0.0

字符串(可选)

variations

产品的不同版本或型号列表

数组

建议的

建议的 搜索结果中的该部分通常包含平台根据用户的搜索查询、浏览历史或购买行为推荐的产品列表。

说明
类型

url

商品的 URL。

字符串

asin

Amazon 标准识别号。

字符串

价格

产品价格。

浮点数

title

产品标题。

字符串

rating

产品评分。

浮点数

货币

价格所使用的货币。

字符串

url_image

商品图片的 URL。

字符串

best_seller

表示该产品是否为畅销商品。

boolean

price_upper

适用时的价格上限。

浮点数

is_sponsored

表示该产品是否为赞助商品。

boolean

manufacturer

产品制造商名称。

字符串

pricing_count

产品的价格数量。

整数

reviews_count

产品的评论数量。

整数

coupon_discount

折扣金额。

整数(可选)

coupon_discount_type

折扣类型: 固定金额百分比.

字符串(可选)

is_amazons_choice

表示该产品是否为 Amazon’s Choice。

boolean

pos

表示列表中位置的唯一标识。

整数

is_prime

指示该产品是否符合 Amazon Prime 资格。

boolean

shipping_information

关于产品配送详情的信息。

字符串

sales_volume

某个特定产品的销售量或售出数量。

字符串(可选)

no_price_reason

表示价格不存在的原因,如果其等于 0.0

字符串(可选)

suggested_query

Amazon 作为搜索结果一部分提供的建议查询。

字符串

Amazon's Choices

amazons_choices 该部分展示带有“Amazon’s Choice”徽章的产品,并因其被认为具有较高质量和价值而受到平台推荐。

说明
类型

url

商品的 URL。

字符串

asin

Amazon 标准识别号。

字符串

价格

产品价格。

浮点数

title

产品标题。

字符串

rating

产品评分。

浮点数

货币

价格所使用的货币。

字符串

url_image

商品图片的 URL。

字符串

best_seller

表示该产品是否为畅销商品。

boolean

price_upper

适用时的价格上限。

浮点数

is_sponsored

表示该产品是否为赞助商品。

boolean

manufacturer

产品制造商名称。

字符串

pricing_count

产品的价格数量。

整数

reviews_count

产品的评论数量。

整数

coupon_discount

折扣金额。

整数(可选)

coupon_discount_type

折扣类型: 固定金额百分比.

字符串(可选)

is_amazons_choice

表示该产品是否为 Amazon’s Choice。

boolean

pos

表示列表中位置的唯一标识。

整数

is_prime

指示该产品是否符合 Amazon Prime 资格。

boolean

shipping_information

关于产品配送详情的信息。

字符串

sales_volume

某个特定产品的销售量或售出数量。

字符串(可选)

no_price_reason

表示价格不存在的原因,如果其等于 0.0

字符串(可选)

variations

产品的不同版本或型号列表

数组

变体

variations 该部分列出产品的不同版本或型号,并提供指定类别中可用选项的详细概览。

说明
类型

asin

Amazon 标准识别号

字符串

title

变体标题

字符串

价格

变体价格

浮点数

price_strikethrough

折扣或促销前的原价

浮点数

not_available

表示该变体当前是否不可用

boolean

最后更新于

这有帮助吗?