搜索

使用 Web Scraper API 抓取 Amazon 搜索结果。通过 JS 渲染、地理定位及示例检索产品标题、价格、评分等。

amazon_search 该 source 旨在检索 Amazon 搜索结果页面。要查看包含检索数据的响应示例,请下载 示例输出 HTML 格式的文件或查看结构化数据输出 此处.

查看输出 数据字典 针对每个 Amazon Search 功能,提供简短描述、截图、解析后的 JSON 代码片段,以及定义每个解析字段的表格。使用右侧导航或向下滚动页面浏览详细信息。

请求示例

在下面的代码示例中,我们发出请求以从 检索结果 amazon.com,其中包括 2 搜索结果页面,从 页 开始 #2 ,针对搜索词 nirvana tshirt。此外,搜索将限制在类别 ID: 16391693031 并且价格以 USD 货币显示。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "amazon_search",
        "domain": "com",
        "query": "nirvana tshirt",
        "start_page": 2,
        "pages": 2,
        "parse": true,
        "context": [
                {"key": "category_id", "value": "16391693031"},
                {"key": "currency", "value": "USD"},
                {"key": "refinements", "value": ["p_123:256097"]},
                {"key": "sort_by", "value": "featured"}
        ]
    }'

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Amazon 搜索结果的基本设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

amazon_search

query

要搜索的关键字或短语。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析数据 true。探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

context: 货币

设置货币。检查可用值 此处.

-

- 强制参数

本地化

将结果适配到特定地理位置、域名、语言。

参数
说明
默认值

geo_location

配送至 位置。参阅我们关于使用此参数的指南 此处.

-

domain

Bestbuy 的域本地化。可用域的完整列表可在 此处 找到 此处.

com

locale

Accept-Language 头部值,用于设置 Amazon 页面界面的语言。 更多信息.

-

分页

用于管理搜索结果分页和检索的控制。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页面数量。

1

排序和过滤

搜索结果页面的排序和过滤控制。

参数
说明
默认值

排序方式

根据 Amazon 的可选值之一设置搜索结果页面的排序类型: "most_recent", "price_low_to_high", "price_high_to_low", "featured", "average_review", "bestsellers".

-

refinements

一个 列表 用于对搜索结果应用特定过滤器的 Amazon 搜索细化参数。这些参数对应 Amazon 的动态过滤选项(例如品牌、价格范围、功能),并遵循 Amazon 的内部参数格式,例如 p_123:256097p_n_feature_twenty-eight_browse-bin:98209020031.

由于过滤选项因类别而异且由 Amazon 动态生成,推荐的工作流程是:

  1. 首先,使用 抓取目标 Amazon 搜索页面 以发现可用的细化选项 parse: true 以发现可用的细化选项

  2. 从解析的响应中提取所需的过滤参数

  3. 在后续请求中通过 字段 使用这些参数以应用特定过滤器 refinements 字段以应用特定过滤器

-

context: category_id

在特定 Amazon 节点(产品类别)中搜索商品。

-

context: merchant_id

搜索特定卖家销售的商品。

-

结构化数据

amazon_search 结构化输出

输出示例已被简化。

输出数据字典

API 返回包含从 Amazon 检索到的搜索结果的 HTML 或 JSON 对象。

HTML 示例

JSON 结构

所有搜索结果都包含在 results JSON 数组中。每个搜索结果包含以下组合的若干项 paid, organic, 建议的, amazons_choices,instant_recommendations 列表。此外,可能存在变体,它们包含在 variations 键中,提供有关不同类型或类别产品的详细信息,例如不同型号、版本或版本号。

说明
类型

url

Amazon 搜索页面的 URL。

字符串

page

当前页码。

整数

pages

总页数。

整数

query

使用的搜索查询。

字符串

results

包含搜索结果的字典。

对象

results.paid

包含其各自详细信息的赞助产品列表。

数组

results.organic

包含其各自详细信息的自然排名产品列表。

数组

results.suggested

包含其各自详细信息的建议产品列表。

数组

results.amazons_choices

包含其各自详细信息的 Amazon's Choice 列表。

数组

refinements

此搜索页面上可用的筛选条件列表。

数组

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

total_results_count

为搜索查询找到的结果总数。

整数

created_at

抓取作业创建的时间戳。

字符串

updated_at

抓取作业完成的时间戳。

字符串

job_id

与抓取作业关联的作业 ID。

字符串

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

parser_type

用于解析数据的解析器类型。

字符串

在下列部分,当结果类型存在多个项时,解析后的 JSON 代码片段会被缩短。

付费

paid 搜索结果的该部分指在 Amazon 搜索结果中显示的内联广告内容。

说明
类型

url

产品的 URL。

字符串

asin

Amazon 标准识别号(ASIN)。

字符串

价格

产品价格。

float

title

产品标题。

字符串

rating

产品评分。

float

rel_pos

产品在搜索结果中的相对位置。

(要么 posrel_pos 存在)

整数

pos

表示列表中位置的唯一标识符。(要么 posrel_pos 存在)

整数

货币

价格所使用的货币。

字符串

url_image

产品图片的 URL。

字符串

best_seller

指示该产品是否为畅销商品。

布尔

price_upper

如适用,价格的上限。

float

is_sponsored

指示该产品是否为赞助商品。

布尔

manufacturer

产品制造商的名称。

字符串

pricing_count

该产品的报价数量。

整数

reviews_count

该产品的评论数量。

整数

coupon_discount

折扣金额。

integer (optional)

coupon_discount_type

折扣类型: nominalpercentage.

string (optional)

is_amazons_choice

指示该产品是否被标记为“Amazon's choice”。

布尔

no_price_reason

当价格为 0.0 时,指示价格缺失的原因。

string (optional)

sales_volume

特定产品的销量或已售出单位数。

string (optional)

is_prime

指示该商品是否有资格享受 Amazon Prime。

布尔

shipping_information

有关产品运输详情的信息。

字符串

自然

organic 搜索结果的该部分指基于 Amazon 搜索算法自然出现的非赞助内容。

名称
说明
类型

pos

表示列表中位置的唯一标识符。

整数

url

产品的 URL。

字符串

asin

Amazon 标准识别号(ASIN)。

字符串

价格

产品价格。

float

title

产品标题。

字符串

rating

产品评分。

float

货币

价格所使用的货币。

字符串

is_prime

指示该商品是否有资格享受 Amazon Prime。

布尔

url_image

产品图片的 URL。

字符串

best_seller

指示该产品是否为畅销商品。

布尔

price_upper

如适用,价格的上限。

float

is_sponsored

指示该产品是否为赞助商品。

布尔

manufacturer

产品制造商的名称。

字符串

sales_volume

特定产品的销量或已售出单位数。

string (optional)

pricing_count

该产品的定价数量。

整数

reviews_count

该产品的评论数量。

整数

coupon_discount

折扣金额。

integer (optional)

coupon_discount_type

折扣类型: nominalpercentage.

string (optional)

is_amazons_choice

指示该产品是否为 Amazon's choice。

布尔

price_strikethrough

任何折扣前的原价。

float

shipping_information

交货日期和运费详情。

字符串

no_price_reason

当价格为 0.0 时,指示价格缺失的原因。

string (optional)

variations

产品不同版本或型号的列表

Array

Suggested

建议的 搜索结果中的 Suggested 部分通常包含基于用户的搜索查询、浏览历史或购买行为由平台推荐的产品列表。

说明
类型

url

产品的 URL。

字符串

asin

Amazon 标准识别号(ASIN)。

字符串

价格

产品价格。

float

title

产品标题。

字符串

rating

产品评分。

float

货币

价格所使用的货币。

字符串

url_image

产品图片的 URL。

字符串

best_seller

指示该产品是否为畅销商品。

布尔

price_upper

如适用,价格的上限。

float

is_sponsored

指示该产品是否为赞助商品。

布尔

manufacturer

产品制造商的名称。

字符串

pricing_count

该产品的定价数量。

整数

reviews_count

该产品的评论数量。

整数

coupon_discount

折扣金额。

integer (optional)

coupon_discount_type

折扣类型: nominalpercentage.

string (optional)

is_amazons_choice

指示该产品是否为 Amazon's choice。

布尔

pos

表示列表中位置的唯一标识符。

整数

is_prime

指示该商品是否有资格享受 Amazon Prime。

布尔

shipping_information

有关产品运输详情的信息。

字符串

sales_volume

特定产品的销量或已售出单位数。

string (optional)

no_price_reason

当价格为 0.0 时,指示价格缺失的原因。

string (optional)

suggested_query

Amazon 在搜索结果中提供的建议查询。

字符串

Amazon 的精选

amazons_choices 该部分包含带有“Amazon's Choice”徽章的产品,平台基于其质量和性价比进行推荐。

说明
类型

url

产品的 URL。

字符串

asin

Amazon 标准识别号(ASIN)。

字符串

价格

产品价格。

float

title

产品标题。

字符串

rating

产品评分。

float

货币

价格所使用的货币。

字符串

url_image

产品图片的 URL。

字符串

best_seller

指示该产品是否为畅销商品。

布尔

price_upper

如适用,价格的上限。

float

is_sponsored

指示该产品是否为赞助商品。

布尔

manufacturer

产品制造商的名称。

字符串

pricing_count

该产品的定价数量。

整数

reviews_count

该产品的评论数量。

整数

coupon_discount

折扣金额。

integer (optional)

coupon_discount_type

折扣类型: nominalpercentage.

string (optional)

is_amazons_choice

指示该产品是否为 Amazon's choice。

布尔

pos

表示列表中位置的唯一标识符。

整数

is_prime

指示该商品是否有资格享受 Amazon Prime。

布尔

shipping_information

有关产品运输详情的信息。

字符串

sales_volume

特定产品的销量或已售出单位数。

string (optional)

no_price_reason

当价格为 0.0 时,指示价格缺失的原因。

string (optional)

variations

产品不同版本或型号的列表

Array

Variations

variations 该部分列出产品的不同版本或型号,提供该类别可用选项的详细概览。

说明
类型

asin

Amazon 标准识别码

字符串

title

变体的标题

字符串

价格

该变体的价格

float

price_strikethrough

任何折扣或促销前的原始价格

float

not_available

指示该变体是否当前不可用

布尔

最后更新于

这有帮助吗?