搜索

提取 Walmart 搜索结果的解析数据,包括价格、评分、卖家信息、变体、履约选项和筛选项,并支持价格区间和排序过滤。

walmart_search 源用于检索沃尔玛搜索结果页面。我们可以返回任何您需要的沃尔玛页面的 HTML。此外,我们还可以提供 沃尔玛搜索页面的结构化(解析后)输出.

请求示例

下面的示例说明如何获取解析后的沃尔玛搜索页面结果。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "walmart_search", 
        "query": "iphone", 
        "parse": true
    }'

我们在示例中使用同步的 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步的 Push-Pull 集成,请参考 集成方法 部分。

请求参数值

通用

参数
描述
默认值

source

设置要使用的爬虫。

walmart_search

query

要搜索产品的关键词或短语。

-

min_price

设置最低价格。

-

max_price

设置最高价格。

-

sort_by

选择产品排序。可用值为: price_low, price_high, best_seller, best_match.

best_match

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析后的数据 true.

false

callback_url

回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在此处找到 here.

desktop

- 必填参数

本地化

将结果适配到特定门店、送货位置等。沃尔玛门店 ID 的 JSON 列表可在此处查找:

您也可以找到沃尔玛门店的官方页面 herearrow-up-right.

参数
描述
类型

domain

沃尔玛的域名本地化。

String

fulfillment_speed

设置履约速度。可用值为: today, 2_days, anytime, tomorrow.

String

fulfillment_type

设置履约类型。可用值为: in_store.

String

delivery_zip

设置送货到的邮编位置。

String

store_id

设置门店位置。

String

circle-info

如果目标门店与给定邮编相距过远——我们将尝试使用目标门店的邮编,否则位置将无法正确设置。如果我们无法设置 delivery_zip - 沃尔玛将返回其默认结果,不进行门店定位。

分页

参数
描述
默认值

start_page

起始页码。

1

结构化数据

circle-info

在下列部分中,当某类结果有多于一项时,解析后的 JSON 代码片段会被缩短。

chevron-right沃尔玛搜索页面结构化输出hashtag

输出数据字典

HTML 示例

JSON 结构

下表详细列出了我们解析的每个搜索页面元素,包含其描述和数据类型。表中还包括一些元数据。

描述
类型

url

搜索页面的 URL。

string

facets

包含搜索结果页面上显示的任何可用搜索分面(筛选项)详细信息的数组。

array

results

搜索页面结果。

array

results.general

包含通用产品详细信息的对象。

object

results.price

包含产品价格详细信息的对象。

object

results.rating

对象包含有关产品评分的详细信息。

object

results.seller

对象包含卖家信息。

object

results.variants (可选)

数组包含产品变体列表。

array

results.fulfillment

对象包含有关产品履约选项的详细信息。

object

location

提供请求运行时所在位置的信息。

object

page_details

对象包含有关搜索查询结果页面的数据。

object

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码的说明 herearrow-up-right.

integer

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

page

提取数据时所处的页码

integer

url

搜索页面的 URL。

string

job_id

与抓取作业关联的任务 ID。

string

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码的说明 herearrow-up-right.

integer

is_render_forced

标识是否对该请求强制启用了渲染。

boolean

parser_type

用于提取数据的解析器类型(例如,"walmart_search_new")。

string

通用

键(通用)
描述
类型

pos

表示给定条目在所属分区中的位置指标。

integer

url

产品的 URL。

string

image

主产品图片的 URL。

string

title

产品的标题或名称。

string

product_id

产品的 ID。

string

sponsored

标识产品是否为赞助商品。

boolean

badge (可选)

促销、热门推荐、畅销、昨日已售 100+ 等

list of strings

section_title

产品在搜索页面中所属分区的名称。

string

out_of_stock

指示商品是否售罄。

boolean

价格

键(价格)
描述
类型

price

产品当前价格(未扣减)。

float

price_strikethrough(可选)

被划线的价格可能为原价、捆绑价或目录价。

float

currency

货币的 ISO 4217 三字代码。

string

price_min(可选)

在区间定价的情况下产品的最低价格。

float

price_max(可选)

在区间定价的情况下产品的最高价格。

float

评分

键(评分)
描述
类型

rating

产品的平均评分。

float

count

产品评分的数量。

integer

卖家

数据未在视觉上显示。

Key(卖家)
描述
类型

名称

卖家的名称。

string

id

卖家的 ID。

string

变体

Key(变体)
描述
类型

url

产品变体的 URL。

string

title

产品变体的标题。

string

product_id

产品变体的 Id。

string

image

产品变体的图片。

string

履约

Key(履约)
描述
类型

店内自取

指示产品是否可通过店内自取方式履约。

boolean

送货

指示产品是否可通过门店配送方式履约。

送货由您当地的门店发出(如有)。

boolean

运输

指示产品是否可通过送货到家的方式履约。

boolean

免运费

指示运费是否免费。

boolean

筛选项

Key(筛选项)
描述
类型

显示名称

筛选项的显示名称(例如面向用户的名称)。

string

类型

筛选项的类型。

string

筛选项值数组显示给定筛选项的可选值。

array

values.name

筛选项值的名称。

string

values.item_count (可选)

特定筛选项对应的可用商品数量。

integer

位置

Key(位置)
描述
类型

城市

请求运行时所在的城市。

string

州/省

请求运行时所在的州/省。

string

邮编

请求运行时使用的邮政编码。

string

store_id

请求运行时使用的门店 ID。

string

页面详情

Key(page_details)
描述

总结果数

显示为可用的搜索结果总数。

integer

last_visible_page

搜索结果的最后一页页码。

integer

page

提取产品数据的页码

integer

最后更新于

这有帮助吗?