搜索
了解如何使用 Web Scraper API 获取 Walmart 搜索结果。了解其请求参数和结构化数据输出。
该 walmart_search source 旨在检索 Walmart 搜索结果页面。我们可以返回任何 Walmart 页面所对应的 HTML。此外,我们还可以提供 针对 Walmart 搜索页面的结构化(已解析)输出.
请求示例
下面的示例说明如何获取解析后的 Walmart 搜索页面结果。
curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
"source": "walmart_search",
"query": "iphone",
"parse": true
}'import requests
from pprint import pprint
# 构建负载。
payload = {
'source': 'walmart_search',
'query': 'iphone',
'parse': True,
}
# 获取响应。
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('USERNAME', 'PASSWORD'),
json=payload,
)
# 该请求不会返回带有作业状态和结果 URL 的响应,而是返回
# 包含结果的 JSON 响应。
pprint(response.json())我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。
请求参数值
通用
- 强制参数
本地化
将结果适配到特定门店、配送地点等。Walmart 商店 ID 的 JSON 列表请在此处查找:
您也可以找到 Walmart 门店的官方页面 此处.
domain
Walmart 的域名本地化。
字符串
fulfillment_speed
设置履约速度。可用值为: 今天, 2_days, anytime, tomorrow.
字符串
fulfillment_type
设置履约类型。可用值为: in_store.
字符串
delivery_zip
设置收货邮编。
字符串
store_id
设置门店位置。
字符串
分页
start_page
起始页码。
1
结构化数据
输出数据字典
HTML 示例
JSON 结构
下表列出我们解析的每个搜索页面元素的详细清单,以及其描述和数据类型。表中还包含一些元数据。
url
搜索页面的 URL。
字符串
facets
包含搜索结果页面上显示的任何可用搜索分面(筛选)的详情的数组。
数组
results
搜索页面结果。
数组
results.general
包含一般产品详情的对象。
对象
results.price
包含产品价格详情的对象。
对象
results.rating
对象包含有关产品评分的详细信息。
对象
results.seller
对象包含卖家信息。
对象
results.variants (可选)
数组包含产品变体的列表。
数组
results.fulfillment
对象包含有关产品履约选项的详细信息。
对象
location
提供请求运行时所在位置的信息。
对象
page_details
对象包含搜索查询结果页面的数据。
对象
created_at
抓取作业创建的时间戳。
timestamp
updated_at
抓取作业完成的时间戳。
timestamp
page
提取数据时所在的页码
整数
url
搜索页面的 URL。
字符串
job_id
与抓取作业关联的作业 ID。
字符串
is_render_forced
标识是否对该请求强制进行了渲染。
布尔
parser_type
用于提取数据的解析器类型(例如,"walmart_search_new")。
字符串
General

pos
指示给定商品在所属区块中所处位置的标识符。
整数
url
产品的 URL。
字符串
image
主产品图片的 URL。
字符串
title
产品的标题或名称。
字符串
product_id
产品的 ID。
字符串
sponsored
标识产品是否为赞助商品。
布尔
badge (可选)
促销、热门选择、畅销品、昨日以来已售 100+ 件
字符串列表
section_title
产品在搜索页面中所属区块的名称。
字符串
out_of_stock
指示商品是否缺货。
布尔
Price

价格
产品当前价格(未做任何扣减)。
float
price_strikethrough(可选)
划线价可能为原价、组合价或标价。
float
货币
货币的 ISO 4217 三字代码。
字符串
price_min(可选)
在区间定价情况下的最低价格。
float
price_max(可选)
在区间定价情况下的最高价格。
float
Rating

rating
产品的平均评分。
float
count
产品评分的数量。
整数
Seller
数据未以可视方式展示。
name
卖家的名称。
字符串
id
ID of the seller.
字符串
Variants

url
产品变体的 URL。
字符串
title
产品变体的标题。
字符串
product_id
产品变体的 ID。
字符串
image
产品变体的图片。
字符串
Fulfillment

pickup
指示商品是否可通过门店自提完成履约。
布尔
delivery
指示商品是否可通过门店配送完成履约。
如有可用,配送将由本地门店发出。
布尔
运输
指示商品是否可通过送货到家完成履约。
布尔
free_shipping
指示运输是否免运费。
布尔
Facets
display_name
分面的显示名称(即面向用户的名称)。
字符串
type
分面类型。
字符串
values
分面值数组显示给定分面的各个值。
数组
values.name
分面值的名称。
字符串
values.item_count (可选)
特定分面下可用商品的数量。
整数
Location

city
请求运行时所在的城市。
字符串
state(州)
请求运行时所在的州/省缩写。
字符串
zip_code
请求运行时使用的邮政编码。
字符串
store_id
请求运行时使用的门店 ID。
字符串
Page details
total_results
显示为可用的搜索结果总数。
整数
last_visible_page
搜索结果的最后一页页码。
整数
page
提取产品数据时所在的页码
整数
最后更新于
这有帮助吗?

