搜索

提取 Walmart 搜索结果中的解析数据,包括价格、评分、卖家信息、变体、履约选项和筛选项,并支持价格范围和排序过滤。

walmart_search 源旨在检索 Walmart 搜索结果页面。我们可以返回您想要的任何 Walmart 页面 的 HTML。此外,我们还可以提供 Walmart 搜索页面的结构化(已解析)输出.

请求示例

下面的示例说明如何获取已解析的 Walmart 搜索页面结果。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "walmart_search", 
        "query": "iphone", 
        "parse": true
    }'

我们在示例中使用同步的 Realtime 集成方法。如果您希望使用 Proxy Endpoint 或异步的 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

参数
说明
默认值

source

设置要使用的爬虫。

walmart_search

query

要搜索产品的关键字或短语。

-

min_price

设置最低价格。

-

max_price

设置最高价格。

-

sort_by

选择产品排序。可用值为: price_low, price_high, best_seller, best_match.

best_match

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回已解析的数据 true.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 必填参数

本地化

将结果适配到特定门店、发货位置等。Walmart 门店 ID 列表请参见:

您还可以找到 Walmart 门店的官方页面 此处arrow-up-right.

参数
说明
类型

domain

Walmart 的域名本地化。可用值: com, com.mx, ca, co.cr. 默认: com.

String

fulfillment_speed

设置履约速度。可用值为: today, 2_days, anytime, tomorrow.

String

fulfillment_type

设置履约类型。支持的值: pickup, delivery, shipping.

String

delivery_zip

设置发货至的位置邮编。

String

store_id

设置门店位置。

String

履约类型参数的可用性因 Walmart 域而异:

域名
支持的履约类型

walmart.com

pickup, delivery, shipping

walmart.com.mx

pickup, delivery

walmart.ca

pickup, delivery

walmart.co.cr

pickup

有关国际 store_id 列表,请参阅以下文件:

circle-info

如果目标门店与给定邮政编码相距过远——我们将尝试使用目标门店的邮政编码,否则位置将无法正确设置。在无法设置 delivery_zip - Walmart 将返回其默认结果,而不进行门店定位。

分页

参数
说明
默认值

start_page

起始页码。

1

结构化数据

circle-info

在以下各节中,如果结果类型有多于一项,解析后的 JSON 代码片段会被缩短。

chevron-rightWalmart 搜索页面结构化输出hashtag

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个搜索页面元素的详细清单,以及其说明和数据类型。表中还包含一些元数据。

说明
类型

url

搜索页面的 URL。

string

facets

一个数组,包含搜索结果页面上显示的任何可用搜索筛选(细化) 的详细信息。

array

results

搜索页面结果。

array

results.general

包含通用产品详细信息的对象。

object

results.price

包含产品定价详细信息的对象。

object

results.rating

对象包含有关产品评分的详细信息。

object

results.seller

对象包含卖家信息。

object

results.variants (可选)

数组包含产品变体列表。

array

results.fulfillment

对象包含有关产品履约选项的详细信息。

object

location

提供有关运行该请求时所处位置的信息。

object

page_details

对象包含有关搜索查询结果页面的数据。

object

parse_status_code

解析作业的状态代码。您可以查看解析器状态代码的说明 此处arrow-up-right.

integer

created_at

创建爬取作业的时间戳。

timestamp

updated_at

爬取作业完成的时间戳。

timestamp

page

提取数据的页码

integer

url

搜索页面的 URL。

string

job_id

与爬取作业关联的作业 ID。

string

status_code

爬取作业的状态代码。您可以查看爬虫状态代码的说明 此处arrow-up-right.

integer

is_render_forced

标识是否对该请求强制启用了渲染。

boolean

parser_type

用于提取数据的解析器类型(例如,"walmart_search_new")。

string

通用

键(通用)
说明
类型

pos

标示给定商品在其所属分区中的位置。

integer

url

产品的 URL。

string

image

主产品图片的 URL。

string

title

产品的标题或名称。

string

product_id

产品的 ID。

string

sponsored

标识该产品是否为赞助商品。

boolean

badge (可选)

促销、热门推荐、畅销、过去 24 小时内已售出 100+ 等

list of strings

section_title

产品在搜索页面所属分区的名称。

string

out_of_stock

指示商品是否缺货。

boolean

价格

键(价格)
说明
类型

price

产品当前价格(未扣减任何费用)。

float

price_strikethrough(可选)

划线价格可以是原价、捆绑价或标价。

float

货币

货币的 ISO 4217 三字代码。

string

price_min(可选)

在区间定价情况下产品的最低价格。

float

price_max(可选)

在区间定价情况下产品的最高价格。

float

评分

Key (rating)
说明
类型

rating

产品的平均评分。

float

count

产品的评分数量。

integer

卖家

数据未以可视方式显示。

Key (seller)
说明
类型

name

卖家名称。

string

id

卖家 ID。

string

变体

Key (variants)
说明
类型

url

产品变体的 URL。

string

title

产品变体的标题。

string

product_id

产品变体的 Id。

string

image

产品变体的图片。

string

履约

Key (fulfillment)
说明
类型

pickup

指示产品是否可通过到店自提履约。

boolean

delivery

指示产品是否可通过门店配送履约。

如可用,配送来自您本地的门店。

boolean

shipping

指示产品是否可通过送货上门履约。

boolean

free_shipping

指示运输是否免费。

boolean

分类项

Key (facets)
说明
类型

display_name

该分类项的显示名称(即面向用户的名称)。

string

type

该分类项的类型。

string

values

分类项值数组显示给定分类项的值。

array

values.name

分类项值名称。

string

values.item_count (可选)

特定分类项可用商品的数量。

integer

位置

Key (location)
说明
类型

city

请求运行时所在的城市。

string

state

请求运行时所在的州/省。

string

zip_code

请求运行时使用的邮政编码。

string

store_id

请求运行时所属门店的 ID。

string

页面详情

Key (page_details)
说明

total_results

显示为可用的搜索结果总数。

integer

last_visible_page

搜索结果的最后一页页码。

integer

page

提取产品数据所使用的页码

integer

最后更新于

这有帮助吗?