产品

了解如何开始抓取 Etsy 产品结果页面。

etsy_product source 旨在检索 Etsy 产品结果页面。我们可以返回任何你想要的 Etsy 页面 HTML。此外,我们还可以提供 Etsy 产品页面的结构化(解析后)输出.

请求示例

下面的示例说明如何获取解析后的 Best Buy 产品结果。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "etsy_product", 
        "product_id": "1858266469",
        "parse": true
    }'

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

参数
说明
默认值

source

设置要使用的爬虫。

etsy_product

product_id

10 位符号的产品 ID。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析数据 true。探索输出 数据字典.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 强制参数

结构化数据

etsy_product source 可以以 HTML 或 JSON 格式提取 Etsy 产品结果,提供页面各元素的结构化数据。

输出示例

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个产品页面元素的详细清单,包含其描述和数据类型。表中还包括一些元数据。

说明
类型

url

Etsy 产品页面的 URL。

字符串

价格

产品价格。

float

title

产品标题。

字符串

images

产品图片 URL 数组。

数组

卖家

卖家对象,包含卖家详细信息。

对象

评论

评论对象,包含评论详细信息。

对象

reviews.count

该产品收到的评论数量。

整数

货币

价格所使用的货币。

字符串

运输

运输对象,包含运输详细信息。

对象

shipping.from

运输起始国家。

字符串

原价

商品折扣前的原始价格。

整数

类别

产品所属的类别对象数组。

数组

categories.title

类别的标题。

字符串

是否可定制

指示产品是否可以定制。

布尔

product_id

产品的唯一标识符。

字符串

variation_count

该产品可用的变体数量。

整数

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

page

结果分页中的页码。

整数

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

parser_type

用于提取数据的解析器类型。

整数

job_id

与抓取作业关联的作业 ID。

字符串

卖家

卖家对象,包含卖家的详细信息。

键(卖家)
说明
类型

url

卖家页面的 URL。

字符串

title

卖家名称。

字符串

rating

卖家的评分分数。

整数

best_seller

指示卖家是否为畅销卖家。

布尔

star_seller

指示卖家是否为星级卖家。

布尔

reviews_count

(可选)

卖家的评论数量。

整数

最后更新于

这有帮助吗?