For the complete documentation index, see llms.txt. This page is also available as Markdown.

搜索

提取 Walmart 搜索结果及其解析数据,包括价格、评分、卖家信息、变体、履约选项和分面,并支持价格范围和排序筛选。

walmart_search source 旨在检索 Walmart 搜索结果页面。我们可以返回你想要的任何 Walmart 页面 的 HTML。此外,我们还可以提供 Walmart 搜索页面的结构化(解析后)输出.

请求示例

下面的示例说明如何获取已解析的 Walmart 搜索页面结果。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "walmart_search", 
        "query": "iphone", 
        "parse": true
    }'

我们使用同步的 Realtime 集成方法作为示例。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

参数
说明
默认值

source

设置爬虫。

walmart_search

query

用于搜索商品的关键词或短语。

-

最低价格

设置最低价格。

-

最高价格

设置最高价格。

-

sort_by

选择产品排序方式。可用值: price_low, price_high, best_seller, best_match.

best_match

render

设置为 html. 更多信息.

-

parse

设置为 true.

false

callback_url

您的回调端点 URL。 更多信息

-

user_agent_type

设备类型和浏览器。完整列表可在 这里.

desktop

- 必填参数

本地化

按特定商店、配送地点等调整结果。Walmart 商店 ID 列表请见:

你也可以在这里找到 Walmart 商店的官方页面 这里.

参数
说明
类型

域名

Walmart 的域名本地化。可用值: com, com.mx, ca, co.cr. 默认: com.

字符串

fulfillment_speed

设置履约速度。可用值: 今天, 2_days, anytime, tomorrow.

字符串

fulfillment_type

设置履约类型。支持的值: 自提, 配送, shipping.

字符串

delivery_zip

设置配送到的位置。

字符串

store_id

设置门店位置。

字符串

履约类型参数的可用性因 Walmart 域名而异:

域名
支持的履约类型

walmart.com

自提, 配送, shipping

walmart.com.mx

自提, 配送

walmart.ca

自提, 配送

walmart.co.cr

自提

关于国际 store_id 列表,请参见下面的文件:

如果目标商店距离给定邮政编码太远,我们将尝试使用目标商店的邮政编码,否则位置将无法正确设置。如果我们无法设置 delivery_zip - Walmart 将返回其默认结果,不进行商店定向。

分页

参数
说明
默认值

start_page

起始页码。

1

结构化数据

在以下部分中,当某种结果类型包含多个项目时,解析后的 JSON 代码片段会被缩短。

Walmart 搜索页面结构化输出

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个搜索页面元素的详细列表,以及其描述和数据类型。表中还包括一些元数据。

说明
类型

url

搜索页面 URL。

字符串

facets

一个数组,包含搜索结果页面上显示的任何可用搜索 facets(筛选项/细化项)的详情。

数组

results

搜索页面结果。

数组

results.general

包含通用产品详情的对象。

对象

results.price

包含产品价格详情的对象。

对象

results.rating

对象包含产品评分详情。

对象

results.seller

对象包含卖家信息。

对象

results.variants (可选)

数组包含产品变体列表。

数组

results.fulfillment

对象包含产品履约选项的详情。

对象

location

提供请求运行位置的信息。

对象

page_details

对象包含搜索查询结果页面的数据。

对象

parse_status_code

解析任务的状态码。你可以查看所描述的解析器状态码 这里.

整数

created_at

抓取任务创建时的时间戳。

timestamp

updated_at

抓取任务完成时的时间戳。

timestamp

page

提取数据的页码

整数

url

搜索页面 URL。

字符串

job_id

与抓取任务关联的任务 ID。

字符串

status_code

抓取任务的状态码。你可以查看所描述的抓取器状态码 这里.

整数

is_render_forced

标识此请求是否强制渲染。

boolean

parser_type

用于提取数据的解析器类型(例如,"walmart_search_new")。

字符串

通用

键(通用)
说明
类型

pos

表示某个项目在其所属商品区块中的位置。

整数

url

商品的 URL。

字符串

image

主产品图片的 URL。

字符串

title

产品的标题或名称。

字符串

product_id

产品的 ID。

字符串

sponsored

标识产品是否为赞助商品。

boolean

badge (可选)

优惠、热门推荐、畅销、昨天以来已购买 100+

字符串列表

section_title

搜索页面中该产品所属区块的名称。

字符串

out_of_stock

表示商品是否缺货。

boolean

价格

键(价格)
说明
类型

价格

产品的当前价格,不含任何折扣。

浮点数

price_strikethrough(可选)

划线价可以是原价、套装价或标价。

浮点数

货币

货币的 ISO 4217 三字母代码。

字符串

price_min(可选)

范围定价情况下产品的最低价格。

浮点数

price_max(可选)

范围定价情况下产品的最高价格。

浮点数

评分

键(评分)
说明
类型

rating

产品的平均评分。

浮点数

count

产品的评分数量。

整数

卖家

数据未以可视化方式显示。

键(卖家)
说明
类型

name

卖家的名称。

字符串

id

卖家的 ID。

字符串

变体

键(变体)
说明
类型

url

产品变体的 URL。

字符串

title

产品变体的标题。

字符串

product_id

产品变体的 Id。

字符串

image

产品变体的图片。

字符串

履约

键(履约)
说明
类型

自提

表示产品是否可通过门店自提履约。

boolean

配送

表示产品是否可通过门店配送履约。

如果可用,配送来自你的本地门店。

boolean

shipping

表示产品是否可通过送货上门履约。

boolean

free_shipping

表示是否免运费。

boolean

Facets

键(Facets)
说明
类型

display_name

facet 的显示名称(即面向用户显示的名称)。

字符串

type

facet 的类型。

字符串

values

facet values 数组显示给定 facet 的值。

数组

values.name

facet 值名称。

字符串

values.item_count (可选)

特定 facet 可用的商品数量。

整数

位置

键(位置)
说明
类型

city

请求运行所在的城市。

字符串

state

请求运行所在的州。

字符串

zip_code

请求运行所在的邮政编码。

字符串

store_id

请求运行所在门店的 ID。

字符串

页面详情

键(页面详情)
说明

total_results

显示为可用的搜索结果总数。

整数

last_visible_page

搜索结果的最后一页页码。

整数

page

提取产品数据的页码

整数

最后更新于

这有帮助吗?