产品

了解如何使用 Web Scraper API 获取 Walmart 产品页面数据。了解其请求参数和结构化数据输出。

walmart_product 该 source 用于检索 Walmart 产品结果页面。我们可以返回任何 Walmart 页面 的 HTML。此外,我们还可以提供 Walmart 产品页面的结构化(已解析)输出.

请求示例

下面的示例说明如何获取解析后的 Walmart 产品页面结果。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "walmart_product", 
        "product_id": "15296401808",
        "parse": true
    }'

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

参数
说明
默认值

source

设置要使用的爬虫。

walmart_product

product_id

Walmart 产品 ID。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析数据 true.

false

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

- 强制参数

本地化

将结果适配到特定门店、送货地点。Walmart 门店 ID 的 JSON 列表在此处:

您也可以找到 Walmart 门店的官方页面 此处.

参数
说明
类型

domain

Walmart 的域名本地化。

字符串

delivery_zip

设置收货邮编。

字符串

store_id

设置门店位置。

字符串

如果目标门店距给定邮政编码过远——我们将尝试使用目标门店的邮政编码,否则位置将无法正确设置。如果我们无法设置 delivery_zip - Walmart 将返回其默认结果,不进行门店定向。

结构化数据

在下列部分,当结果类型存在多个项时,解析后的 JSON 代码片段会被缩短。

Walmart 产品页面结构化输出

输出数据字典

HTML 示例

JSON 结构

下表列出了我们解析的每个产品页面元素的详细清单,包含其描述和数据类型。表中还包括一些元数据。

说明
类型

general

包含通用产品页面结果详情的对象。

对象

价格

对象包含有关产品定价的详细信息。

对象

rating

产品的评分信息。

对象

卖家

有关卖家的信息。

对象

variations (可选)

产品的变体列表。

数组

breadcrumbs

指向产品的类别层级。

对象

location

提供请求运行时所在位置的信息。

对象

fulfillment

对象包含有关产品履约选项的信息。

对象

specifications

详细说明产品特定属性或功能的键值对数组。

数组

parse_status_code

解析作业的状态码。您可以在此处查看解析器状态码说明 此处.

整数

created_at

抓取作业创建的时间戳。

timestamp

updated_at

抓取作业完成的时间戳。

timestamp

page

提取产品数据时所在的页码

整数

url

产品页面在 Walmart 网站上的 URL

字符串

job_id

与抓取作业关联的作业 ID。

字符串

status_code

抓取作业的状态码。您可以在此处查看爬虫状态码说明 此处.

整数

is_render_forced

标识是否对该请求强制进行了渲染。

布尔

parser_type

用于提取数据的解析器类型(例如,"walmart_product_new")。

字符串

General

Key (general)
说明
类型

url

产品的 URL。

字符串

main_image

主产品图片的 URL

整数

images

产品图片的 URL 数组。

数组

title

产品的标题或名称。

字符串

description

产品的详细描述。

字符串

brand

产品的品牌。

字符串

badge

指示特定属性(如促销、产品功能、认证或品牌关联)的标识。

字符串列表

meta

产品的元数据。

对象

meta.sku

产品的库存单位(SKU)。

字符串

meta.gtin

产品的全球贸易项目编号(GTIN)。

字符串

Price

Key (price)
说明
类型

价格

产品当前价格(未做任何扣减)。

float

price_strikethrough

划线价可能为原价、组合价或标价。

float

货币

产品价格的 ISO 4217 三字母货币代码。

字符串

Rating

Key (rating)
说明
类型

rating

产品的平均评分。

float

count

产品评分的数量。

整数

Seller

Key (seller)
描述
类型

name

卖家的名称。

字符串

official_name

卖方实体的官方注册名称。

字符串

id

平台分配给卖方的唯一标识符。

字符串

url

指向卖家官方网站或店面 的 URL。

字符串

catalog_id

目录 ID。

字符串

规格

键(规格)
说明
类型

key

产品的特定属性或特征。

字符串

value

由规格键指定的属性对应的值或描述。

字符串

Fulfillment

Key (fulfillment)
说明
类型

pickup

指示商品是否可通过门店自提完成履约。

布尔

pickup_information

当 pickup = true 时的取货消息。

字符串

delivery

指示产品是否可以由本地门店通过配送方式履约。

布尔

delivery_information

当 delivery = true 时的本地门店配送消息。

字符串

运输

指示商品是否可通过送货到家完成履约。

布尔

shipping_information

显示时的运输消息。

字符串

free_shipping

指示运输是否免运费。

布尔

out_of_stock

指示产品当前是否缺货。

布尔

Variations

键(变体)
说明
类型

state(州)

产品变体的可用性状态。

字符串

product_id

每个产品变体的唯一标识符。

字符串

selected_options

包含定义变体的所选选项的数组。

数组

selected_options.key

描述所选选项的键。

字符串

selected_options.value

所选选项的值。

字符串

键(面包屑)
说明
类型

category_name

类别的名称。

字符串

url

类别的 URL

字符串

Location

Key (location)
说明
类型

city

请求运行时所在的城市。

字符串

state(州)

请求运行时所在的州/省缩写。

字符串

zip_code

请求运行时使用的邮政编码。

字符串

store_id

请求运行时使用的门店 ID。

字符串

最后更新于

这有帮助吗?