产品
了解如何开始抓取 Etsy 产品结果页面。
该 etsy_product source 旨在检索 Etsy 产品结果页面。我们可以返回任何你想要的 Etsy 页面 HTML。此外,我们还可以提供 Etsy 产品页面的结构化(解析后)输出.
请求示例
下面的示例说明如何获取解析后的 Best Buy 产品结果。
curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
"source": "etsy_product",
"product_id": "1858266469",
"parse": true
}'import requests
from pprint import pprint
# 构建负载。
payload = {
'source': 'etsy_product',
'product_id': '1858266469',
'parse': True
}
# 获取响应。
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('USERNAME', 'PASSWORD'),
json=payload,
)
# 该请求不会返回带有作业状态和结果 URL 的响应,而是返回
# 包含结果的 JSON 响应。
pprint(response.json())我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。
请求参数值
通用
- 强制参数
结构化数据
etsy_product source 可以以 HTML 或 JSON 格式提取 Etsy 产品结果,提供页面各元素的结构化数据。
输出示例
输出数据字典
HTML 示例

JSON 结构
下表列出了我们解析的每个产品页面元素的详细清单,包含其描述和数据类型。表中还包括一些元数据。
url
Etsy 产品页面的 URL。
字符串
价格
产品价格。
float
title
产品标题。
字符串
images
产品图片 URL 数组。
数组
卖家
卖家对象,包含卖家详细信息。
对象
评论
评论对象,包含评论详细信息。
对象
reviews.count
该产品收到的评论数量。
整数
货币
价格所使用的货币。
字符串
运输
运输对象,包含运输详细信息。
对象
shipping.from
运输起始国家。
字符串
原价
商品折扣前的原始价格。
整数
类别
产品所属的类别对象数组。
数组
categories.title
类别的标题。
字符串
是否可定制
指示产品是否可以定制。
布尔
product_id
产品的唯一标识符。
字符串
variation_count
该产品可用的变体数量。
整数
created_at
抓取作业创建的时间戳。
timestamp
updated_at
抓取作业完成的时间戳。
timestamp
page
结果分页中的页码。
整数
parser_type
用于提取数据的解析器类型。
整数
job_id
与抓取作业关联的作业 ID。
字符串
卖家
卖家对象,包含卖家的详细信息。
url
卖家页面的 URL。
字符串
title
卖家名称。
字符串
rating
卖家的评分分数。
整数
best_seller
指示卖家是否为畅销卖家。
布尔
star_seller
指示卖家是否为星级卖家。
布尔
reviews_count
(可选)
卖家的评论数量。
整数
最后更新于
这有帮助吗?

