畅销榜

使用 Web Scraper API 发现 Amazon 畅销商品数据。收集排名靠前的产品详情、分类和价格,参数可定制。

amazon_bestsellers 数据源用于检索 Amazon 畅销榜页面。要查看带有检索数据的响应示例,请下载此 示例输出 HTML 格式的文件或查看结构化数据输出 此处.

查看输出 数据字典 的畅销榜,提供简要描述、截图、解析的 JSON 代码片段以及定义每个解析字段的表格。使用右侧导航或向下滚动页面浏览详细信息。

请求示例

在下面的代码示例中,我们发出请求以检索 2类别的第 nd 页畅销榜,其 ID 为 172541,在 amazon.com 市场。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "amazon_bestsellers",
        "domain": "com", 
        "query": "172541", 
        "render": "html",
        "start_page": 2, 
        "parse": true
    }'

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Amazon 畅销榜页面的基本设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

amazon_bestsellers

query

浏览节点 ID。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析数据 true。探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 强制参数

本地化

将结果适配到特定地理位置、域名、语言。

参数
说明
默认值

geo_location

配送至 位置。参阅我们关于使用此参数的指南 此处.

-

domain

Amazon 的域名本地化。可用域的完整列表可在此处找到 此处.

com

locale

Accept-Language 头部值,用于设置 Amazon 页面界面的语言。 更多信息.

-

分页

用于管理搜索结果分页和检索的控制。

参数
说明
默认值

start_page

起始页码。

1

pages

要检索的页面数量。

1

其他

用于专门需求的其他高级设置和控制。

参数
说明
默认值

context: 货币

设置货币。检查可用值 此处.

取决于市场。检查默认值 此处.

代码示例

结构化数据

下面您可以找到一个 结构化输出示例 用于 amazon_bestsellers.

Amazon_bestsellers 输出示例

数据字典

HTML 示例

JSON 结构

amazon_bestsellers 提供有关 Amazon 畅销产品的全面数据。下表列出我们解析的每个字段的详细清单,以及其描述和数据类型。表中还包含一些元数据。

说明
类型

url

Amazon 畅销榜页面的 URL。

字符串

page

当前页码。

整数

pages

总页数。

整数

query

原始搜索词。

字符串

results

包含搜索结果的字典。

对象

results.pos

表示畅销商品位置的指示器。

整数

results.url

畅销商品的 URL。

字符串

results.asin

Amazon 标准识别号(ASIN)。

字符串

results.price

产品价格。

字符串

results.title

产品标题。

字符串

results.rating

产品评分。

float

results.currency

价格所使用的货币。

字符串

results.is_prime

指示该商品是否有资格享受 Amazon Prime。

布尔

results.price_str

任何折扣或促销前的原始价格

float

results.price_upper

如适用,价格的上限。

float

results_ratings_count

对该产品的评分总数。

整数

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

job_id

与抓取作业关联的作业 ID。

字符串

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

parser_type

用于解析数据的解析器类型。

字符串

最后更新于

这有帮助吗?