Amazon 有各种我们可以抓取和解析的页面类型。您可以向我们提供一个完整的URL 或通过专门建立的数据源提供一些输入参数(搜索 、产品 、提供列表 、 评论 、 问题和答案 、 最佳卖家 、 或 卖家 ) ,这样我们就可以形成 URL。
重要事项 :在大多数情况下,Amazon 会根据您的位置来定制返回的结果。因此,您必须使用 geo_location
参数来设置您的首选位置。您可以在此处
阅读更多关于 geo_location
的信息。
总览
以下是我们通过 Amazon 支持的所有可用数据source
值的快速概述 。
您可以通过选择菜单右侧的名称跳转至您喜欢的 Amazon 页面类型。每个页面都包含参数表以及代码示例,可帮助您开始查询。
URL
Amazon
源设计用于从各种 Amazon 的 URL 中检索内容。与其发送多个参数,您可以向我们提供一个转向所需 Amazon 页面的直接 URL。我们不剥离任何参数或以任何方式更改您的 URL。
这个数据源也支持解析的数据(JSON 格式的结构化数据),只要提交的 URL 是我们可以解析的页面类型之一。如果我们不能确认可以解析您请求的页面,您将收到一条失败的消息。
要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本 输出 文件。
查询参数
true
将返回结构化数据,只要提交的 URL 是我们可以解析的页面类型之一。
- 必须提供的参数
代码示例
在以下代码示例中,我们请求检索 ASIN AA12345678
的 Amazon 产品页面.
JSON cURL Python PHP
Copy {
"source": "amazon",
"url": "https://www.amazon.co.uk/dp/AA12345678",
"parse": true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon", "url": "https://www.amazon.co.uk/dp/AA12345678", "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon',
'url': 'https://www.amazon.co.uk/dp/AA12345678',
'parse': true
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Instead of response with job status and results url, this will return the
# JSON response with results.
pprint(response.json())
Copy <?php
$params = array(
'source' => 'amazon',
'url' => 'https://www.amazon.co.uk/dp/AA12345678',
'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://data.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端点 ),请参考集成方法 部分。
搜索
amazon_search
源是用来检索 Amazon 的搜索结果页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
Amazon 的域名本地化。单击此处 查看可用域名的完整列表。
true
将返回结构化数据。查看结构化数据 了解更多信息。
- 必须提供的参数
代码示例
在以下示例代码示例中,我们提出请求从 amazon.nl
检索结果,其中包括 10
页搜索结果页面,从第 11
页开始,搜索词为 adidas
.此外,搜索范围应限于男鞋/运动鞋
类别(类别 ID:16391843031
),并且由 Amazon 自己销售(商家 ID:3aa17d2brd4ymt0x
)。
JSON cURL Python PHP HTTP
Copy {
"source": "amazon_search",
"domain": "nl",
"query": "adidas",
"start_page": 11,
"pages": 10,
"parse": true,
"context" [
{
"key": "category_id",
"value": "16391843031"
},
{
"key": "merchant_id",
"value": "3AA17D2BRD4YMT0X"
}]
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_search", "domain": "nl", "query": "adidas", "start_page": 11, "pages": 10, "parse": true, "context" [{"key": "category_id", "value": "16391843031"},{"key": "merchant_id", "value": "3AA17D2BRD4YMT0X"}]}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_search',
'domain': 'nl',
'query': 'adidas',
'start_page': 11,
'pages': 10,
'parse': true,
'context': [
{'key': 'category_id', 'value': 16391843031},
{'key': 'merchant_id', 'value':'3AA17D2BRD4YMT0X'}
]
'callback_url': 'https://your.callback.url'
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
Copy <?php
$params = array(
'source' => 'amazon_search',
'domain' => 'nl',
'query' => 'adidas',
'start_page' => 11,
'pages' => 10,
'parse' => true,
'context' => [
[
'key' => 'category_id',
'value' => 16391843031,
],
[
'key' => 'merchant_id',
'value' => '3AA17D2BRD4YMT0X'
]
],
'callback_url' => 'https://your.callback.url'
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_search&domain=nl&query=adidas&start_page=11&pages=10&parse=true&access_token=12345abcde
Please note that it is not currently possible to use Context parameters with this method.
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
产品
amazon_product
数据源设计用于检索 Amazon产品页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
Amazon 的域名本地化。单击此处 查看可用域名的完整列表。
true
将返回结构化数据。查看结构化数据 了解更多信息。
context
:
autoselect_variant
为了获得准确的定价/购买箱数据,将此参数设置为 true
(表明要将 th=1&psc=1
URL 参数附加到产品 URL 的末尾)。要获得父 ASIN 的产品页面的准确表述,请省略此参数或将其设置为false
。
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl
市场检索 ASIN AA12345678
的产品页面。如果提供的 ASIN 是一个父 ASIN,我们要求 Amazon 返回一个自动选择变体的产品页面。
JSON cURL Python PHP HTTP
Copy {
"source": "amazon_product",
"domain": "nl",
"query": "AA12345678",
"parse": true,
"context": [
{
"key": "autoselect_variant",
"value": true
}]
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_product", "domain": "nl", "query": "AA12345678", "parse": true, "context": [{"key": "autoselect_variant", "value": true}]}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_product',
'domain': 'nl',
'query': 'AA12345678',
'parse': true,
'context': [
{
'key': 'autoselect_variant', 'value': true
}],
'callback_url': 'https://your.callback.url'
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
Copy <?php
$params = array(
'source' => 'amazon_product',
'domain' => 'nl',
'query' => 'AA12345678',
'parse' => true,
'context' => [
'key' => 'autoselect_variant',
'value' => true,
]
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_product&domain=nl&query=AA12345678&parse=true&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
报价清单
amazon_pricing
数据源设计用于检索 Amazon 产品报价列表。要看解析后的输出是什么样子,请下载该 JSON 文件。
查询参数
Amazon 的域名本地化。单击此处 查看可用域名的完整列表。
true
将返回结构化数据。查看结构化数据 了解更多信息。
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl
市场检索 ASIN AA12345678
的产品报价页面。
JSON cURL Python PHP HTTP
Copy {
"source": "amazon_pricing",
"domain": "nl",
"query": "AA12345678",
"parse": true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_pricing", "domain": "nl", "query": "AA12345678", "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_pricing',
'domain': 'nl',
'query': 'AA12345678',
'parse': true,
'callback_url': 'https://your.callback.url'
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
Copy <?php
$params = array(
'source' => 'amazon_pricing',
'domain' => 'nl',
'query' => 'AA12345678',
'parse' => true,
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_pricing&domain=nl&query=AA12345678&parse=true&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
评价
amazon_reviews
数据源设计用于检索您所选 ASIN 的 Amazon 产品评论页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
Amazon 的域名本地化。单击此处 查看可用域名的完整列表。
true
将返回结构化数据。查看结构化数据 了解更多信息。
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl
市场检索 ASIN AA12345678
的产品评论。
JSON cURL Python PHP HTTP
Copy {
"source": "amazon_reviews",
"domain": "nl",
"query": "AA12345678",
"parse": true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_reviews", "domain": "nl", "query": "AA12345678",, "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_reviews',
'domain': 'nl',
'query': 'AA12345678',
'parse': true
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
Copy <?php
$params = array(
'source' => 'amazon_reviews',
'domain' => 'nl',
'query' => 'AA12345678',
'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_reviews&domain=nl&query=AA12345678&parse=true&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
问题与解答
amazon_questions
数据源设计用于检索任何特定产品的问题和答案页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
Amazon 的域名本地化。单击此处 查看可用域名的完整列表。
true
将返回结构化数据。查看结构化数据 了解更多信息。
- 必须提供的参数
代码示例
在以下代码示例中,我们请求从 amazon.nl
市场检索 ASIN AA12345678
的 Q&A 页面。
JSON cURL Python PHP HTTP
Copy {
"source": "amazon_questions",
"domain": "nl",
"query": "AA12345678",
"parse": true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_questions", "domain": "nl", "query": "AA12345678", "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_questions',
'domain': 'nl',
'query': 'AA12345678',
'parse': true
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
Copy <?php
$params = array(
'source' => 'amazon_questions',
'domain' => 'nl',
'query' => 'AA12345678',
'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_questions&domain=nl&query=AA12345678&parse=true&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
畅销产品
amazon_bestsellers
数据源设计用于检索 Amazon 最佳卖家页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
Amazon 的域名本地化。单击此处 查看可用域名的完整列表。
部门名称。示例: Clothing, Shoes & Jewelry
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.com
市场检索第 2
页中的服装、鞋和珠宝产品
部门、男士运动鞋
浏览节点(6127770011
)最佳卖家。
JSON cURL Python PHP
Copy {
"source": "amazon_bestsellers",
"domain": "com",
"query": "Clothing, Shoes & Jewelry",
"start_page": 2,
"parse": true,
"context": [
{
"key": "category_id",
"value": "6127770011"
}]
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_bestsellers", "domain": "com", "query": "Clothing, Shoes & Jewelry", "start_page": 2, "parse": true, "context": ["category_id": "6127770011"]}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_bestsellers',
'domain': 'com',
'query': 'Clothing, Shoes & Jewelry',
'start_page': 2,
'parse': true,
'context': [
{'key': 'category_id', 'value': 6127770011},
],
'callback_url': 'https://your.callback.url'
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
Copy <?php
$params = array(
'source' => 'amazon_bestsellers',
'domain' => 'com',
'query' => 'Clothing, Shoes & Jewelry',
'start_page' => 2,
'parse' => true,
'context' => array(
'key' => 'category_id',
'value': 6127770011
),
'callback_url': 'https://your.callback.url'
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
卖家
amazon_sellers
数据源设计用于检索 Amazon 卖家页面。
查询参数
Amazon 的域名本地化。单击此处 查看可用域名的完整列表。
true
将返回结构化数据。请注意,现在我们只支持对desktop
设备类型的解析输出。然而,没有明显理由用任何其他设备类型获取卖家页面,因为卖家数据在所有设备上都会完全相同
- 必须提供的参数
代码示例
在以下代码示例中,我们请求从 amazon.de
市场检索卖家 ID ABNP0A7Y0QWBN
的卖家页面。
JSON cURL Python PHP HTTP
Copy {
"source": "amazon_sellers",
"domain": "de",
"query": "ABNP0A7Y0QWBN",
"parse": true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_sellers", "domain": "de", "query": "ABNP0A7Y0QWBN", "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'amazon_sellers',
'domain': 'de',
'query': 'ABNP0A7Y0QWBN',
'parse': true
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
Copy <?php
$params = array(
'source' => 'amazon_sellers',
'domain' => 'de',
'query' => 'ABNP0A7Y0QWBN',
'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_sellers&domain=de&query=ABNP0A7Y0QWBN&domain=de&parse=true&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。