Amazon
Amazon 有各种我们可以抓取和解析的页面类型。您可以向我们提供一个完整的URL 或通过专门建立的数据源提供一些输入参数(搜索、产品 、提供列表 、评论、问题和答案、最佳卖家、或 卖家) ,这样我们就可以形成 URL。
重要事项:在大多数情况下,Amazon 会根据您的位置来定制返回的结果。因此,您必须使用 geo_location 参数来设置您的首选位置。您可以在此处阅读更多关于 geo_location的信息。
总览
以下是我们通过 Amazon 支持的所有可用数据source值的快速概述 。
amazon
提交您喜欢的任意 Amazon 网址。
取决于 URL。
amazon_bestsellers
所选分类目录节点中卖家最畅销商品列表。
是。
amazon_pricing
提供所选 ASIN 的报价清单。
是。
amazon_product
所选 ASIN 的产品页面。
是。
amazon_questions
所选 ASIN 的 Q&A 页面。
是。
amazon_reviews
提供所选 ASIN 的评论页面。
是。
amazon_search
搜索所选搜索词的结果。
是。
amazon_sellers
您选择的卖家信息。
是。
您可以通过选择菜单右侧的名称跳转至您喜欢的 Amazon 页面类型。每个页面都包含参数表以及代码示例,可帮助您开始查询。
URL
Amazon 源设计用于从各种 Amazon 的 URL 中检索内容。与其发送多个参数,您可以向我们提供一个转向所需 Amazon 页面的直接 URL。我们不剥离任何参数或以任何方式更改您的 URL。
这个数据源也支持解析的数据(JSON 格式的结构化数据),只要提交的 URL 是我们可以解析的页面类型之一。如果我们不能确认可以解析您请求的页面,您将收到一条失败的消息。
要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本 输出文件。
查询参数
- 必须提供的参数
代码示例
在以下代码示例中,我们请求检索 ASIN AA12345678 的 Amazon 产品页面.
{
    "source": "amazon", 
    "url": "https://www.amazon.co.uk/dp/AA12345678",
    "parse": true
}curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
 -d '{"source": "amazon", "url": "https://www.amazon.co.uk/dp/AA12345678", "parse": true}'import requests
from pprint import pprint
# Structure payload.
payload = {
    'source': 'amazon',
    'url': 'https://www.amazon.co.uk/dp/AA12345678',
    'parse': true
}
# Get response.
response = requests.request(
    'POST',
    'https://realtime.oxylabs.io/v1/queries',
    auth=('user', 'pass1'),
    json=payload,
)
# Instead of response with job status and results url, this will return the
# JSON response with results.
pprint(response.json())<?php
$params = array(
    'source' => 'amazon',
    'url' => 'https://www.amazon.co.uk/dp/AA12345678',
    'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://data.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
    echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
搜索
amazon_search 源是用来检索 Amazon 的搜索结果页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出文件。
查询参数
domain
Amazon 的域名本地化。单击此处查看可用域名的完整列表。
com
 query 
UTF 编码的关键字
-
start_page
起始页数
1
pages
检索的页数
1
context:
category_id
搜索一个特定浏览节点(产品类别)的商品
-
context:
merchant_id
搜索某个特定卖家出售的物品
-
- 必须提供的参数
代码示例
在以下示例代码示例中,我们提出请求从 amazon.nl 检索结果,其中包括 10 页搜索结果页面,从第 11 页开始,搜索词为 adidas.此外,搜索范围应限于男鞋/运动鞋 类别(类别 ID:16391843031),并且由 Amazon 自己销售(商家 ID:3aa17d2brd4ymt0x)。
{
    "source": "amazon_search", 
    "domain": "nl", 
    "query": "adidas", 
    "start_page": 11, 
    "pages": 10,
    "parse": true, 
    "context" [
        {
            "key": "category_id", 
            "value": "16391843031"
        },
        {
            "key": "merchant_id", 
            "value": "3AA17D2BRD4YMT0X"
        }]
}curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
 -d '{"source": "amazon_search", "domain": "nl", "query": "adidas", "start_page": 11, "pages": 10, "parse": true, "context" [{"key": "category_id", "value": "16391843031"},{"key": "merchant_id", "value": "3AA17D2BRD4YMT0X"}]}'import requests
from pprint import pprint
# Structure payload.
payload = {
    'source': 'amazon_search',
    'domain': 'nl',
    'query': 'adidas',
    'start_page': 11,
    'pages': 10,
    'parse': true,
    'context': [
        {'key': 'category_id', 'value': 16391843031},
        {'key': 'merchant_id', 'value':'3AA17D2BRD4YMT0X'}
    ]
    'callback_url': 'https://your.callback.url'
# Get response.
response = requests.request(
    'POST',
    'https://realtime.oxylabs.io/v1/queries',
    auth=('user', 'pass1'),
    json=payload,
)
# Print prettified response to stdout.
pprint(response.json())<?php
$params = array(
    'source' => 'amazon_search',
    'domain' => 'nl',
    'query' => 'adidas',
    'start_page' => 11,
    'pages' => 10,
    'parse' => true,
    'context' => [
      [
        'key' => 'category_id', 
        'value' => 16391843031,
      ],
      [
        'key' => 'merchant_id',
        'value' => '3AA17D2BRD4YMT0X'
      ]
    ],
    'callback_url' => 'https://your.callback.url'
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
    echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>https://realtime.oxylabs.io/v1/queries?source=amazon_search&domain=nl&query=adidas&start_page=11&pages=10&parse=true&access_token=12345abcde
Please note that it is not currently possible to use Context parameters with this method.以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
产品
amazon_product 数据源设计用于检索 Amazon产品页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出文件。
查询参数
 query 
10 个符号的 ASIN 代码
-
context:
autoselect_variant
为了获得准确的定价/购买箱数据,将此参数设置为 true(表明要将 th=1&psc=1 URL 参数附加到产品 URL 的末尾)。要获得父 ASIN 的产品页面的准确表述,请省略此参数或将其设置为false。
false
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl 市场检索 ASIN AA12345678 的产品页面。如果提供的 ASIN 是一个父 ASIN,我们要求 Amazon 返回一个自动选择变体的产品页面。
{
    "source": "amazon_product", 
    "domain": "nl", 
    "query": "AA12345678",
    "parse": true, 
    "context": [
        {
            "key": "autoselect_variant", 
            "value": true
        }]
}curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
 -d '{"source": "amazon_product", "domain": "nl", "query": "AA12345678", "parse": true, "context": [{"key": "autoselect_variant", "value": true}]}'import requests
from pprint import pprint
# Structure payload.
payload = {
    'source': 'amazon_product',
    'domain': 'nl',
    'query': 'AA12345678',
    'parse': true,
    'context': [
    {
      'key': 'autoselect_variant', 'value': true
    }],
    'callback_url': 'https://your.callback.url'
}
# Get response.
response = requests.request(
    'POST',
    'https://realtime.oxylabs.io/v1/queries',
    auth=('user', 'pass1'),
    json=payload,
)
# Print prettified response to stdout.
pprint(response.json())<?php
$params = array(
    'source' => 'amazon_product',
    'domain' => 'nl',
    'query' => 'AA12345678',
    'parse' => true,
    'context' => [
     'key' => 'autoselect_variant',
     'value' => true,
    ]
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
    echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>https://realtime.oxylabs.io/v1/queries?source=amazon_product&domain=nl&query=AA12345678&parse=true&access_token=12345abcde以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
报价清单
amazon_pricing 数据源设计用于检索 Amazon 产品报价列表。要看解析后的输出是什么样子,请下载该 JSON 文件。
查询参数
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl 市场检索 ASIN AA12345678 的产品报价页面。
{
    "source": "amazon_pricing", 
    "domain": "nl", 
    "query": "AA12345678",
    "parse": true
}curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
 -d '{"source": "amazon_pricing", "domain": "nl", "query": "AA12345678", "parse": true}'import requests
from pprint import pprint
# Structure payload.
payload = {
    'source': 'amazon_pricing',
    'domain': 'nl',
    'query': 'AA12345678',
    'parse': true,
    'callback_url': 'https://your.callback.url'
}
# Get response.
response = requests.request(
    'POST',
    'https://realtime.oxylabs.io/v1/queries',
    auth=('user', 'pass1'),
    json=payload,
)
# Print prettified response to stdout.
pprint(response.json())<?php
$params = array(
    'source' => 'amazon_pricing',
    'domain' => 'nl',
    'query' => 'AA12345678',
    'parse' => true,
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
    echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>https://realtime.oxylabs.io/v1/queries?source=amazon_pricing&domain=nl&query=AA12345678&parse=true&access_token=12345abcde以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
评价
amazon_reviews 数据源设计用于检索您所选 ASIN 的 Amazon 产品评论页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出文件。
查询参数
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl 市场检索 ASIN AA12345678 的产品评论。
{
    "source": "amazon_reviews", 
    "domain": "nl", 
    "query": "AA12345678",
    "parse": true
}curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
 -d '{"source": "amazon_reviews", "domain": "nl", "query": "AA12345678",, "parse": true}'import requests
from pprint import pprint
# Structure payload.
payload = {
    'source': 'amazon_reviews',
    'domain': 'nl',
    'query': 'AA12345678',
    'parse': true
}
# Get response.
response = requests.request(
    'POST',
    'https://realtime.oxylabs.io/v1/queries',
    auth=('user', 'pass1'),
    json=payload,
)
# Print prettified response to stdout.
pprint(response.json())<?php
$params = array(
    'source' => 'amazon_reviews',
    'domain' => 'nl',
    'query' => 'AA12345678',
    'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
    echo 'Error:' . curl_error($ch);
}
curl_close ($ch);https://realtime.oxylabs.io/v1/queries?source=amazon_reviews&domain=nl&query=AA12345678&parse=true&access_token=12345abcde以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
问题与解答
amazon_questions 数据源设计用于检索任何特定产品的问题和答案页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出文件。
查询参数
- 必须提供的参数
代码示例
在以下代码示例中,我们请求从 amazon.nl 市场检索 ASIN AA12345678 的 Q&A 页面。
{
    "source": "amazon_questions", 
    "domain": "nl", 
    "query": "AA12345678",
    "parse": true
}curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
 -d '{"source": "amazon_questions", "domain": "nl", "query": "AA12345678", "parse": true}'import requests
from pprint import pprint
# Structure payload.
payload = {
    'source': 'amazon_questions',
    'domain': 'nl',
    'query': 'AA12345678',
    'parse': true
}
# Get response.
response = requests.request(
    'POST',
    'https://realtime.oxylabs.io/v1/queries',
    auth=('user', 'pass1'),
    json=payload,
)
# Print prettified response to stdout.
pprint(response.json())<?php
$params = array(
    'source' => 'amazon_questions',
    'domain' => 'nl',
    'query' => 'AA12345678',
    'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
    echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>https://realtime.oxylabs.io/v1/queries?source=amazon_questions&domain=nl&query=AA12345678&parse=true&access_token=12345abcde以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
畅销产品
amazon_bestsellers 数据源设计用于检索 Amazon 最佳卖家页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
domain
Amazon 的域名本地化。单击此处查看可用域名的完整列表。
com
query
部门名称。示例: Clothing, Shoes & Jewelry
-
start_page
起始页数
1
pages
检索的页数
1
parse
true 将返回结构化数据
-
context:
category_id
搜索一个特定浏览节点(产品类别)的商品。
-
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.com 市场检索第 2页中的服装、鞋和珠宝产品 部门、男士运动鞋 浏览节点(6127770011)最佳卖家。
{
    "source": "amazon_bestsellers", 
    "domain": "com", 
    "query": "Clothing, Shoes & Jewelry", 
    "start_page": 2, 
    "parse": true, 
    "context": [
        {
            "key": "category_id",
            "value": "6127770011"
        }]
}curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
 -d '{"source": "amazon_bestsellers", "domain": "com", "query": "Clothing, Shoes & Jewelry", "start_page": 2, "parse": true, "context": ["category_id": "6127770011"]}'import requests
from pprint import pprint
# Structure payload.
payload = {
    'source': 'amazon_bestsellers',
    'domain': 'com',
    'query': 'Clothing, Shoes & Jewelry',
    'start_page': 2,
    'parse': true,
    'context': [
        {'key': 'category_id', 'value': 6127770011},
    ],
    'callback_url': 'https://your.callback.url'
}
# Get response.
response = requests.request(
    'POST',
    'https://realtime.oxylabs.io/v1/queries',
    auth=('user', 'pass1'),
    json=payload,
)
# Print prettified response to stdout.
pprint(response.json())<?php
$params = array(
    'source' => 'amazon_bestsellers',
    'domain' => 'com',
    'query' => 'Clothing, Shoes & Jewelry',
    'start_page' => 2,
    'parse' => true,
    'context' => array(
        'key' => 'category_id', 
        'value': 6127770011
    ),
    'callback_url': 'https://your.callback.url'
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
    echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
卖家
amazon_sellers 数据源设计用于检索 Amazon 卖家页面。 
查询参数
 query 
13 个字符的卖家 ID
-
parse
true 将返回结构化数据。请注意,现在我们只支持对desktop设备类型的解析输出。然而,没有明显理由用任何其他设备类型获取卖家页面,因为卖家数据在所有设备上都会完全相同
-
- 必须提供的参数
代码示例
在以下代码示例中,我们请求从 amazon.de 市场检索卖家 ID ABNP0A7Y0QWBN 的卖家页面。
{
    "source": "amazon_sellers", 
    "domain": "de", 
    "query": "ABNP0A7Y0QWBN",
    "parse": true
}curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
 -d '{"source": "amazon_sellers", "domain": "de", "query": "ABNP0A7Y0QWBN", "parse": true}'import requests
from pprint import pprint
# Structure payload.
payload = {
    'source': 'amazon_sellers',
    'domain': 'de',
    'query': 'ABNP0A7Y0QWBN',
    'parse': true
}
# Get response.
response = requests.request(
    'POST',
    'https://realtime.oxylabs.io/v1/queries',
    auth=('user', 'pass1'),
    json=payload,
)
# Print prettified response to stdout.
pprint(response.json())<?php
$params = array(
    'source' => 'amazon_sellers',
    'domain' => 'de',
    'query' => 'ABNP0A7Y0QWBN',
    'parse' => true
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
    echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>https://realtime.oxylabs.io/v1/queries?source=amazon_sellers&domain=de&query=ABNP0A7Y0QWBN&domain=de&parse=true&access_token=12345abcde以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉或代理端点),请参考集成方法部分。
Last updated
Was this helpful?

