Amazon 有各种我们可以抓取和解析的页面类型。您可以向我们提供一个完整的URL 或通过专门建立的数据源提供一些输入参数(搜索 、产品 、提供列表 、 评论 、 问题和答案 、 最佳卖家 、 或 卖家 ) ,这样我们就可以形成 URL。
重要事项 :在大多数情况下,Amazon 会根据您的位置来定制返回的结果。因此,您必须使用 geo_location
参数来设置您的首选位置。您可以在此处
阅读更多关于 geo_location
的信息。
总览
以下是我们通过 Amazon 支持的所有可用数据source
值的快速概述 。
您可以通过选择菜单右侧的名称跳转至您喜欢的 Amazon 页面类型。每个页面都包含参数表以及代码示例,可帮助您开始查询。
URL
Amazon
源设计用于从各种 Amazon 的 URL 中检索内容。与其发送多个参数,您可以向我们提供一个转向所需 Amazon 页面的直接 URL。我们不剥离任何参数或以任何方式更改您的 URL。
这个数据源也支持解析的数据(JSON 格式的结构化数据),只要提交的 URL 是我们可以解析的页面类型之一。如果我们不能确认可以解析您请求的页面,您将收到一条失败的消息。
要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本 输出 文件。
查询参数
true
将返回结构化数据,只要提交的 URL 是我们可以解析的页面类型之一。
- 必须提供的参数
代码示例
在以下代码示例中,我们请求检索 ASIN AA12345678
的 Amazon 产品页面.
JSON cURL Python PHP
Copy {
"source" : "amazon" ,
"url" : "https://www.amazon.co.uk/dp/AA12345678" ,
"parse" : true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon", "url": "https://www.amazon.co.uk/dp/AA12345678", "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source' : 'amazon' ,
'url' : 'https://www.amazon.co.uk/dp/AA12345678' ,
'parse' : true
}
# Get response.
response = requests . request (
'POST' ,
'https://realtime.oxylabs.io/v1/queries' ,
auth = ( 'user' , 'pass1' ),
json = payload,
)
# Instead of response with job status and results url, this will return the
# JSON response with results.
pprint (response. json ())
Copy <? php
$params = array (
'source' => 'amazon' ,
'url' => 'https://www.amazon.co.uk/dp/AA12345678' ,
'parse' => true
);
$ch = curl_init () ;
curl_setopt ( $ch , CURLOPT_URL , "https://data.oxylabs.io/v1/queries" ) ;
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
curl_setopt ( $ch , CURLOPT_POSTFIELDS , json_encode ( $params )) ;
curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
curl_setopt ( $ch , CURLOPT_USERPWD , "user" . ":" . "pass1" ) ;
$headers = array ();
$headers[] = "Content-Type: application/json" ;
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $headers ) ;
$result = curl_exec ( $ch ) ;
echo $result;
if ( curl_errno ( $ch ) ) {
echo 'Error:' . curl_error ( $ch ) ;
}
curl_close ( $ch ) ;
?>
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端点 ),请参考集成方法 部分。
搜索
amazon_search
源是用来检索 Amazon 的搜索结果页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
- 必须提供的参数
代码示例
在以下示例代码示例中,我们提出请求从 amazon.nl
检索结果,其中包括 10
页搜索结果页面,从第 11
页开始,搜索词为 adidas
.此外,搜索范围应限于男鞋/运动鞋
类别(类别 ID:16391843031
),并且由 Amazon 自己销售(商家 ID:3aa17d2brd4ymt0x
)。
JSON cURL Python PHP HTTP
Copy {
"source" : "amazon_search" ,
"domain" : "nl" ,
"query" : "adidas" ,
"start_page" : 11 ,
"pages" : 10 ,
"parse" : true ,
"context" [
{
"key" : "category_id" ,
"value" : "16391843031"
},
{
"key" : "merchant_id" ,
"value" : "3AA17D2BRD4YMT0X"
}]
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_search", "domain": "nl", "query": "adidas", "start_page": 11, "pages": 10, "parse": true, "context" [{"key": "category_id", "value": "16391843031"},{"key": "merchant_id", "value": "3AA17D2BRD4YMT0X"}]}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source' : 'amazon_search' ,
'domain' : 'nl' ,
'query' : 'adidas' ,
'start_page' : 11 ,
'pages' : 10 ,
'parse' : true ,
'context' : [
{ 'key' : 'category_id' , 'value' : 16391843031 },
{ 'key' : 'merchant_id' , 'value' : '3AA17D2BRD4YMT0X' }
]
'callback_url' : 'https://your.callback.url'
# Get response.
response = requests . request (
'POST' ,
'https://realtime.oxylabs.io/v1/queries' ,
auth = ( 'user' , 'pass1' ),
json = payload,
)
# Print prettified response to stdout.
pprint (response. json ())
Copy <? php
$params = array (
'source' => 'amazon_search' ,
'domain' => 'nl' ,
'query' => 'adidas' ,
'start_page' => 11 ,
'pages' => 10 ,
'parse' => true ,
'context' => [
[
'key' => 'category_id' ,
'value' => 16391843031 ,
] ,
[
'key' => 'merchant_id' ,
'value' => '3AA17D2BRD4YMT0X'
]
] ,
'callback_url' => 'https://your.callback.url'
);
$ch = curl_init () ;
curl_setopt ( $ch , CURLOPT_URL , "https://realtime.oxylabs.io/v1/queries" ) ;
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
curl_setopt ( $ch , CURLOPT_POSTFIELDS , json_encode ( $params )) ;
curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
curl_setopt ( $ch , CURLOPT_USERPWD , "user" . ":" . "pass1" ) ;
$headers = array ();
$headers[] = "Content-Type: application/json" ;
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $headers ) ;
$result = curl_exec ( $ch ) ;
echo $result;
if ( curl_errno ( $ch ) ) {
echo 'Error:' . curl_error ( $ch ) ;
}
curl_close ( $ch ) ;
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_search&domain=nl& query = adidas & start_page =11& pages =10& parse = true & access_token =12345 abcde
Please note that it is not currently possible to use Context parameters with this method .
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
产品
amazon_product
数据源设计用于检索 Amazon产品页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
context
:
autoselect_variant
为了获得准确的定价/购买箱数据,将此参数设置为 true
(表明要将 th=1&psc=1
URL 参数附加到产品 URL 的末尾)。要获得父 ASIN 的产品页面的准确表述,请省略此参数或将其设置为false
。
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl
市场检索 ASIN AA12345678
的产品页面。如果提供的 ASIN 是一个父 ASIN,我们要求 Amazon 返回一个自动选择变体的产品页面。
JSON cURL Python PHP HTTP
Copy {
"source" : "amazon_product" ,
"domain" : "nl" ,
"query" : "AA12345678" ,
"parse" : true ,
"context" : [
{
"key" : "autoselect_variant" ,
"value" : true
}]
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_product", "domain": "nl", "query": "AA12345678", "parse": true, "context": [{"key": "autoselect_variant", "value": true}]}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source' : 'amazon_product' ,
'domain' : 'nl' ,
'query' : 'AA12345678' ,
'parse' : true ,
'context' : [
{
'key' : 'autoselect_variant' , 'value' : true
} ] ,
'callback_url' : 'https://your.callback.url'
}
# Get response.
response = requests . request (
'POST' ,
'https://realtime.oxylabs.io/v1/queries' ,
auth = ( 'user' , 'pass1' ),
json = payload,
)
# Print prettified response to stdout.
pprint (response. json ())
Copy <? php
$params = array (
'source' => 'amazon_product' ,
'domain' => 'nl' ,
'query' => 'AA12345678' ,
'parse' => true ,
'context' => [
'key' => 'autoselect_variant' ,
'value' => true ,
]
);
$ch = curl_init () ;
curl_setopt ( $ch , CURLOPT_URL , "https://realtime.oxylabs.io/v1/queries" ) ;
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
curl_setopt ( $ch , CURLOPT_POSTFIELDS , json_encode ( $params )) ;
curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
curl_setopt ( $ch , CURLOPT_USERPWD , "user" . ":" . "pass1" ) ;
$headers = array ();
$headers[] = "Content-Type: application/json" ;
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $headers ) ;
$result = curl_exec ( $ch ) ;
echo $result;
if ( curl_errno ( $ch ) ) {
echo 'Error:' . curl_error ( $ch ) ;
}
curl_close ( $ch ) ;
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_product&domain=nl& query = AA12345678 & parse = true & access_token =12345 abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
报价清单
amazon_pricing
数据源设计用于检索 Amazon 产品报价列表。要看解析后的输出是什么样子,请下载该 JSON 文件。
查询参数
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl
市场检索 ASIN AA12345678
的产品报价页面。
JSON cURL Python PHP HTTP
Copy {
"source" : "amazon_pricing" ,
"domain" : "nl" ,
"query" : "AA12345678" ,
"parse" : true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_pricing", "domain": "nl", "query": "AA12345678", "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source' : 'amazon_pricing' ,
'domain' : 'nl' ,
'query' : 'AA12345678' ,
'parse' : true ,
'callback_url' : 'https://your.callback.url'
}
# Get response.
response = requests . request (
'POST' ,
'https://realtime.oxylabs.io/v1/queries' ,
auth = ( 'user' , 'pass1' ),
json = payload,
)
# Print prettified response to stdout.
pprint (response. json ())
Copy <? php
$params = array (
'source' => 'amazon_pricing' ,
'domain' => 'nl' ,
'query' => 'AA12345678' ,
'parse' => true ,
);
$ch = curl_init () ;
curl_setopt ( $ch , CURLOPT_URL , "https://realtime.oxylabs.io/v1/queries" ) ;
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
curl_setopt ( $ch , CURLOPT_POSTFIELDS , json_encode ( $params )) ;
curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
curl_setopt ( $ch , CURLOPT_USERPWD , "user" . ":" . "pass1" ) ;
$headers = array ();
$headers[] = "Content-Type: application/json" ;
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $headers ) ;
$result = curl_exec ( $ch ) ;
echo $result;
if ( curl_errno ( $ch ) ) {
echo 'Error:' . curl_error ( $ch ) ;
}
curl_close ( $ch ) ;
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_pricing&domain=nl& query = AA12345678 & parse = true & access_token =12345 abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
评价
amazon_reviews
数据源设计用于检索您所选 ASIN 的 Amazon 产品评论页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.nl
市场检索 ASIN AA12345678
的产品评论。
JSON cURL Python PHP HTTP
Copy {
"source" : "amazon_reviews" ,
"domain" : "nl" ,
"query" : "AA12345678" ,
"parse" : true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_reviews", "domain": "nl", "query": "AA12345678",, "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source' : 'amazon_reviews' ,
'domain' : 'nl' ,
'query' : 'AA12345678' ,
'parse' : true
}
# Get response.
response = requests . request (
'POST' ,
'https://realtime.oxylabs.io/v1/queries' ,
auth = ( 'user' , 'pass1' ),
json = payload,
)
# Print prettified response to stdout.
pprint (response. json ())
Copy <? php
$params = array (
'source' => 'amazon_reviews' ,
'domain' => 'nl' ,
'query' => 'AA12345678' ,
'parse' => true
);
$ch = curl_init () ;
curl_setopt ( $ch , CURLOPT_URL , "https://realtime.oxylabs.io/v1/queries" ) ;
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
curl_setopt ( $ch , CURLOPT_POSTFIELDS , json_encode ( $params )) ;
curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
curl_setopt ( $ch , CURLOPT_USERPWD , "user" . ":" . "pass1" ) ;
$headers = array ();
$headers[] = "Content-Type: application/json" ;
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $headers ) ;
$result = curl_exec ( $ch ) ;
echo $result;
if ( curl_errno ( $ch ) ) {
echo 'Error:' . curl_error ( $ch ) ;
}
curl_close ( $ch ) ;
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_reviews&domain=nl& query = AA12345678 & parse = true & access_token =12345 abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
问题与解答
amazon_questions
数据源设计用于检索任何特定产品的问题和答案页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
- 必须提供的参数
代码示例
在以下代码示例中,我们请求从 amazon.nl
市场检索 ASIN AA12345678
的 Q&A 页面。
JSON cURL Python PHP HTTP
Copy {
"source" : "amazon_questions" ,
"domain" : "nl" ,
"query" : "AA12345678" ,
"parse" : true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_questions", "domain": "nl", "query": "AA12345678", "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source' : 'amazon_questions' ,
'domain' : 'nl' ,
'query' : 'AA12345678' ,
'parse' : true
}
# Get response.
response = requests . request (
'POST' ,
'https://realtime.oxylabs.io/v1/queries' ,
auth = ( 'user' , 'pass1' ),
json = payload,
)
# Print prettified response to stdout.
pprint (response. json ())
Copy <? php
$params = array (
'source' => 'amazon_questions' ,
'domain' => 'nl' ,
'query' => 'AA12345678' ,
'parse' => true
);
$ch = curl_init () ;
curl_setopt ( $ch , CURLOPT_URL , "https://realtime.oxylabs.io/v1/queries" ) ;
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
curl_setopt ( $ch , CURLOPT_POSTFIELDS , json_encode ( $params )) ;
curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
curl_setopt ( $ch , CURLOPT_USERPWD , "user" . ":" . "pass1" ) ;
$headers = array ();
$headers[] = "Content-Type: application/json" ;
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $headers ) ;
$result = curl_exec ( $ch ) ;
echo $result;
if ( curl_errno ( $ch ) ) {
echo 'Error:' . curl_error ( $ch ) ;
}
curl_close ( $ch ) ;
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_questions&domain=nl& query = AA12345678 & parse = true & access_token =12345 abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
畅销产品
amazon_bestsellers
数据源设计用于检索 Amazon 最佳卖家页面。要查看带有检索数据的响应示例,请下载这个 JSON 格式的样本输出 文件。
查询参数
部门名称。示例: Clothing, Shoes & Jewelry
- 必须提供的参数
代码示例
在以下示例代码示例中,我们请求从 amazon.com
市场检索第 2
页中的服装、鞋和珠宝产品
部门、男士运动鞋
浏览节点(6127770011
)最佳卖家。
JSON cURL Python PHP
Copy {
"source" : "amazon_bestsellers" ,
"domain" : "com" ,
"query" : "Clothing, Shoes & Jewelry" ,
"start_page" : 2 ,
"parse" : true ,
"context" : [
{
"key" : "category_id" ,
"value" : "6127770011"
}]
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_bestsellers", "domain": "com", "query": "Clothing, Shoes & Jewelry", "start_page": 2, "parse": true, "context": ["category_id": "6127770011"]}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source' : 'amazon_bestsellers' ,
'domain' : 'com' ,
'query' : 'Clothing, Shoes & Jewelry' ,
'start_page' : 2 ,
'parse' : true ,
'context' : [
{ 'key' : 'category_id' , 'value' : 6127770011 },
] ,
'callback_url' : 'https://your.callback.url'
}
# Get response.
response = requests . request (
'POST' ,
'https://realtime.oxylabs.io/v1/queries' ,
auth = ( 'user' , 'pass1' ),
json = payload,
)
# Print prettified response to stdout.
pprint (response. json ())
Copy <? php
$params = array (
'source' => 'amazon_bestsellers' ,
'domain' => 'com' ,
'query' => 'Clothing, Shoes & Jewelry' ,
'start_page' => 2 ,
'parse' => true ,
'context' => array (
'key' => 'category_id' ,
'value' : 6127770011
) ,
'callback_url' : 'https://your.callback.url'
);
$ch = curl_init () ;
curl_setopt ( $ch , CURLOPT_URL , "https://realtime.oxylabs.io/v1/queries" ) ;
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
curl_setopt ( $ch , CURLOPT_POSTFIELDS , json_encode ( $params )) ;
curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
curl_setopt ( $ch , CURLOPT_USERPWD , "user" . ":" . "pass1" ) ;
$headers = array ();
$headers[] = "Content-Type: application/json" ;
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $headers ) ;
$result = curl_exec ( $ch ) ;
echo $result;
if ( curl_errno ( $ch ) ) {
echo 'Error:' . curl_error ( $ch ) ;
}
curl_close ( $ch ) ;
?>
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。
卖家
amazon_sellers
数据源设计用于检索 Amazon 卖家页面。
查询参数
true
将返回结构化数据。请注意,现在我们只支持对desktop
设备类型的解析输出。然而,没有明显理由用任何其他设备类型获取卖家页面,因为卖家数据在所有设备上都会完全相同
- 必须提供的参数
代码示例
在以下代码示例中,我们请求从 amazon.de
市场检索卖家 ID ABNP0A7Y0QWBN
的卖家页面。
JSON cURL Python PHP HTTP
Copy {
"source" : "amazon_sellers" ,
"domain" : "de" ,
"query" : "ABNP0A7Y0QWBN" ,
"parse" : true
}
Copy curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "amazon_sellers", "domain": "de", "query": "ABNP0A7Y0QWBN", "parse": true}'
Copy import requests
from pprint import pprint
# Structure payload.
payload = {
'source' : 'amazon_sellers' ,
'domain' : 'de' ,
'query' : 'ABNP0A7Y0QWBN' ,
'parse' : true
}
# Get response.
response = requests . request (
'POST' ,
'https://realtime.oxylabs.io/v1/queries' ,
auth = ( 'user' , 'pass1' ),
json = payload,
)
# Print prettified response to stdout.
pprint (response. json ())
Copy <? php
$params = array (
'source' => 'amazon_sellers' ,
'domain' => 'de' ,
'query' => 'ABNP0A7Y0QWBN' ,
'parse' => true
);
$ch = curl_init () ;
curl_setopt ( $ch , CURLOPT_URL , "https://realtime.oxylabs.io/v1/queries" ) ;
curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
curl_setopt ( $ch , CURLOPT_POSTFIELDS , json_encode ( $params )) ;
curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
curl_setopt ( $ch , CURLOPT_USERPWD , "user" . ":" . "pass1" ) ;
$headers = array ();
$headers[] = "Content-Type: application/json" ;
curl_setopt ( $ch , CURLOPT_HTTPHEADER , $headers ) ;
$result = curl_exec ( $ch ) ;
echo $result;
if ( curl_errno ( $ch ) ) {
echo 'Error:' . curl_error ( $ch ) ;
}
curl_close ( $ch ) ;
?>
Copy https://realtime.oxylabs.io/v1/queries?source=amazon_sellers&domain=de& query = ABNP0A7Y0QWBN & domain = de & parse = true & access_token =12345 abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉 或代理端 点 ),请参考集成方法 部分。