Oxylabs Documentation
中文
搜索
K

Amazon

Amazon 有各种我们可以抓取和解析的页面类型。您可以向我们提供一个完整的URL 或通过专门建立的数据源提供一些输入参数(搜索产品提供列表 评论问题和答案最佳卖家 卖家) ,这样我们就可以形成 URL。
重要事项:在大多数情况下,Amazon 会根据您的位置来定制返回的结果。因此,您必须使用 geo_location 参数来设置您的首选位置。您可以在此处阅读更多关于 geo_location的信息。

总览

以下是我们通过 Amazon 支持的所有可用数据source值的快速概述 。
来源
描述
结构化数据
amazon
提交您喜欢的任意 Amazon 网址。
取决于 URL。
amazon_bestsellers
所选分类目录节点中卖家最畅销商品列表。
是。
amazon_pricing
提供所选 ASIN 的报价清单。
是。
amazon_product
所选 ASIN 的产品页面。
是。
amazon_questions
所选 ASIN 的 Q&A 页面。
是。
amazon_reviews
提供所选 ASIN 的评论页面。
是。
amazon_search
搜索所选搜索词的结果。
是。
amazon_sellers
您选择的卖家信息。
是。
您可以通过选择菜单右侧的名称跳转至您喜欢的 Amazon 页面类型。每个页面都包含参数表以及代码示例,可帮助您开始查询。

URL

Amazon 源设计用于从各种 Amazon 的 URL 中检索内容。与其发送多个参数,您可以向我们提供一个转向所需 Amazon 页面的直接 URL。我们不剥离任何参数或以任何方式更改您的 URL。
这个数据源也支持解析的数据(JSON 格式的结构化数据),只要提交的 URL 是我们可以解析的页面类型之一。如果我们不能确认可以解析您请求的页面,您将收到一条失败的消息。
要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本 输出文件。

查询参数

参数
描述
默认值
source
数据源。更多信息
N/A
url
转到 Amazon 页面的直接 URL(链接)
-
user_agent_type
设备类型和浏览器。单击此处查看完整列表。
desktop
render
启用 JavaScript 渲染。更多信息
-
callback_url
转至回调端点的 URL。更多信息
-
parse
true 将返回结构化数据,只要提交的 URL 是我们可以解析的页面类型之一。
false
- 必须提供的参数

代码示例

在以下代码示例中,我们请求检索 ASIN AA12345678 的 Amazon 产品页面.
JSON
cURL
Python
PHP
{
"source": "amazon",
"url": "https://www.amazon.co.uk/dp/AA12345678",
"parse": true
}
curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon", "url": "https://www.amazon.co.uk/dp/AA12345678", "parse": true}'
import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon',
'url': 'https://www.amazon.co.uk/dp/AA12345678',
'parse': true
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Instead of response with job status and results url, this will return the
# JSON response with results.
pprint(response.json())
<?php
$params = array(
'source' => 'amazon',
'url' => 'https://www.amazon.co.uk/dp/AA12345678',
'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://data.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端点),请参考集成方法部分。

搜索

amazon_search 源是用来检索 Amazon 的搜索结果页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出文件。

查询参数

参数
描述
默认值
source
数据源。更多信息
amazon_search
domain
Amazon 的域名本地化。单击此处查看可用域名的完整列表。
com
query
UTF 编码的关键字
-
start_page
起始页数
1
pages
检索的页数
1
geo_location
交付给 位置。请在此处参阅关于使用该参数的指南。
-
user_agent_type
设备类型和浏览器。单击此处查看完整列表。
desktop
render
启用 JavaScript 渲染。更多信息
-
callback_url
转至回调端点的 URL。更多信息
-
parse
true 将返回结构化数据。查看结构化数据了解更多信息。
-
context: category_id
搜索一个特定浏览节点(产品类别)的商品
-
context: merchant_id
搜索某个特定卖家出售的物品
-
- 必须提供的参数

代码示例

在以下示例代码示例中,我们提出请求从 amazon.nl 检索结果,其中包括 10 页搜索结果页面,从第 11 页开始,搜索词为 adidas.此外,搜索范围应限于男鞋/运动鞋 类别(类别 ID:16391843031),并且由 Amazon 自己销售(商家 ID:3aa17d2brd4ymt0x)。
JSON
cURL
Python
PHP
HTTP
{
"source": "amazon_search",
"domain": "nl",
"query": "adidas",
"start_page": 11,
"pages": 10,
"parse": true,
"context" [
{
"key": "category_id",
"value": "16391843031"
},
{
"key": "merchant_id",
"value": "3AA17D2BRD4YMT0X"
}]
}
curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_search", "domain": "nl", "query": "adidas", "start_page": 11, "pages": 10, "parse": true, "context" [{"key": "category_id", "value": "16391843031"},{"key": "merchant_id", "value": "3AA17D2BRD4YMT0X"}]}'
import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_search',
'domain': 'nl',
'query': 'adidas',
'start_page': 11,
'pages': 10,
'parse': true,
'context': [
{'key': 'category_id', 'value': 16391843031},
{'key': 'merchant_id', 'value':'3AA17D2BRD4YMT0X'}
]
'callback_url': 'https://your.callback.url'
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
<?php
$params = array(
'source' => 'amazon_search',
'domain' => 'nl',
'query' => 'adidas',
'start_page' => 11,
'pages' => 10,
'parse' => true,
'context' => [
[
'key' => 'category_id',
'value' => 16391843031,
],
[
'key' => 'merchant_id',
'value' => '3AA17D2BRD4YMT0X'
]
],
'callback_url' => 'https://your.callback.url'
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
https://realtime.oxylabs.io/v1/queries?source=amazon_search&domain=nl&query=adidas&start_page=11&pages=10&parse=true&access_token=12345abcde
Please note that it is not currently possible to use Context parameters with this method.
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

产品

amazon_product 数据源设计用于检索 Amazon产品页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出文件。

查询参数

参数
描述
默认值
source
数据源。更多信息
amazon_product
domain
Amazon 的域名本地化。单击此处查看可用域名的完整列表。
com
query
10 个符号的 ASIN 代码
-
geo_location
交付给 位置。请在此处参阅关于使用该参数的指南。
-
user_agent_type
设备类型和浏览器。单击此处查看完整列表。
desktop
render
启用 JavaScript 渲染。更多信息
callback_url
转至回调端点的 URL。更多信息
-
parse
true 将返回结构化数据。查看结构化数据了解更多信息。
-
context: autoselect_variant
为了获得准确的定价/购买箱数据,将此参数设置为 true(表明要将 th=1&psc=1 URL 参数附加到产品 URL 的末尾)。要获得父 ASIN 的产品页面的准确表述,请省略此参数或将其设置为false
false
- 必须提供的参数

代码示例

在以下示例代码示例中,我们请求从 amazon.nl 市场检索 ASIN AA12345678 的产品页面。如果提供的 ASIN 是一个父 ASIN,我们要求 Amazon 返回一个自动选择变体的产品页面。
JSON
cURL
Python
PHP
HTTP
{
"source": "amazon_product",
"domain": "nl",
"query": "AA12345678",
"parse": true,
"context": [
{
"key": "autoselect_variant",
"value": true
}]
}
curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_product", "domain": "nl", "query": "AA12345678", "parse": true, "context": [{"key": "autoselect_variant", "value": true}]}'
import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_product',
'domain': 'nl',
'query': 'AA12345678',
'parse': true,
'context': [
{
'key': 'autoselect_variant', 'value': true
}],
'callback_url': 'https://your.callback.url'
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
<?php
$params = array(
'source' => 'amazon_product',
'domain' => 'nl',
'query' => 'AA12345678',
'parse' => true,
'context' => [
'key' => 'autoselect_variant',
'value' => true,
]
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
https://realtime.oxylabs.io/v1/queries?source=amazon_product&domain=nl&query=AA12345678&parse=true&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

报价清单

amazon_pricing 数据源设计用于检索 Amazon 产品报价列表。要看解析后的输出是什么样子,请下载 JSON 文件。

查询参数

参数
描述
默认值
source
数据源。更多信息
amazon_pricing
domain
Amazon 的域名本地化。单击此处查看可用域名的完整列表。
com
query
10 个符号的 ASIN 代码
-
start_page
起始页数
1
pages
检索的页数
1
geo_location
交付给 位置。请在此处参阅关于使用该参数的指南。
-
user_agent_type
设备类型和浏览器。单击此处查看完整列表。
desktop
render
启用 JavaScript 渲染。更多信息
callback_url
转至回调端点的 URL。更多信息
-
parse
true 将返回结构化数据。查看结构化数据了解更多信息。
-
- 必须提供的参数

代码示例

在以下示例代码示例中,我们请求从 amazon.nl 市场检索 ASIN AA12345678 的产品报价页面。
JSON
cURL
Python
PHP
HTTP
{
"source": "amazon_pricing",
"domain": "nl",
"query": "AA12345678",
"parse": true
}
curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_pricing", "domain": "nl", "query": "AA12345678", "parse": true}'
import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_pricing',
'domain': 'nl',
'query': 'AA12345678',
'parse': true,
'callback_url': 'https://your.callback.url'
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
<?php
$params = array(
'source' => 'amazon_pricing',
'domain' => 'nl',
'query' => 'AA12345678',
'parse' => true,
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
https://realtime.oxylabs.io/v1/queries?source=amazon_pricing&domain=nl&query=AA12345678&parse=true&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

评价

amazon_reviews 数据源设计用于检索您所选 ASIN 的 Amazon 产品评论页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出文件。

查询参数

参数
描述
默认值
source
数据源。更多信息
amazon_reviews
domain
Amazon 的域名本地化。单击此处查看可用域名的完整列表。
com
query
10 个符号的 ASIN 代码
-
geo_location
交付给 位置。请在此处参阅关于使用该参数的指南。
-
user_agent_type
设备类型和浏览器。单击此处查看完整列表。
desktop
start_page
起始页数
1
render
启用 JavaScript 渲染。更多信息
callback_url
转至回调端点的 URL。更多信息
-
parse
true 将返回结构化数据。查看结构化数据了解更多信息。
-
- 必须提供的参数

代码示例

在以下示例代码示例中,我们请求从 amazon.nl 市场检索 ASIN AA12345678 的产品评论。
JSON
cURL
Python
PHP
HTTP
{
"source": "amazon_reviews",
"domain": "nl",
"query": "AA12345678",
"parse": true
}
curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_reviews", "domain": "nl", "query": "AA12345678",, "parse": true}'
import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_reviews',
'domain': 'nl',
'query': 'AA12345678',
'parse': true
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
<?php
$params = array(
'source' => 'amazon_reviews',
'domain' => 'nl',
'query' => 'AA12345678',
'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
https://realtime.oxylabs.io/v1/queries?source=amazon_reviews&domain=nl&query=AA12345678&parse=true&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

问题与解答

amazon_questions 数据源设计用于检索任何特定产品的问题和答案页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出文件。

查询参数

参数
描述
默认值
source
数据源。更多信息
amazon_questions
domain
Amazon 的域名本地化。单击此处查看可用域名的完整列表。
com
query
10 个符号的 ASIN 代码
-
geo_location
交付给 位置。请在此处参阅关于使用该参数的指南。
-
user_agent_type
设备类型和浏览器。单击此处查看完整列表。
desktop
render
启用 JavaScript 渲染。更多信息
callback_url
转至回调端点的 URL。更多信息
-
parse
true 将返回结构化数据。查看结构化数据了解更多信息。
-
- 必须提供的参数

代码示例

在以下代码示例中,我们请求从 amazon.nl 市场检索 ASIN AA12345678 的 Q&A 页面。
JSON
cURL
Python
PHP
HTTP
{
"source": "amazon_questions",
"domain": "nl",
"query": "AA12345678",
"parse": true
}