Oxylabs Documentation
中文
搜索
⌃K

Yandex

有两种方法可以使用我们的 SERP 爬虫 API 检索 Yandex 中的数据。您可以向我们提供一个完整的 URL 或通过专门建立的数据源传递参数 - 搜索

总览

以下是我们通过 Yandex 支持的所有可用数据source值的快速概览。
来源
描述
结构化数据
yandex
提交您喜欢的任何 Yandex 网址。
yandex_search
Yandex SERPs.
您可以通过选择菜单右侧的名称跳转至您喜欢的 Yandex 页面类型。每个页面都包含参数表以及代码示例,可帮助您开始查询。

URL

yandex 源被设计用于检索各种 Yandex 网页直接 URL 中的内容。您可以向我们提供转到 Yandex 页面所需的直接 URL,而不是发送多个参数。我们不会剥离任何参数或以任何其他方式更改您的 URL。
查询参数
参数
描述
默认值
source
数据源。更多信息
yandex
url
转到 Yandex 页面的直接 URL(链接)。
-
user_agent_type
设备类型和浏览器。单击此处查看完整列表。
desktop
render
启用 JavaScript 渲染。更多信息
-
callback_url
转至回调端点的 URL。更多信息
-
- 必须提供的参数

代码示例

在以下示例中,我们提出一个请求来检索一个 URL 的结果。
JSON
cURL
Python
PHP
HTTP
{
"source": "yandex",
"url": "https://yandex.com/search/?text=nike&"
}
curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "yandex", "url": "https://yandex.com/search/?text=nike&"}'
import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'yandex',
'url': 'https://yandex.com/search/?text=nike&'
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Instead of response with job status and results url, this will return the
# JSON response with results.
pprint(response.json())
<?php
$params = array(
'source' => 'yandex',
'url' => 'https://yandex.com/search/?text=nike&'
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://data.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
# URL has to be encoded to escape `&` and `=` characters:
# URL: https://yandex.com/search/?text=nike&
# Encoded URL: https%3A%2F%2Fyandex.com%2Fsearch%2F%3Ftext%3Dnike%26
https://realtime.oxylabs.io/v1/queries?source=google&url=https%3A%2F%2Fyandex.com%2Fsearch%2F%3Ftext%3Dnike%26&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

搜索

yandex_search 源被设计用于检索 Yandex 搜索结果(SERP)。

查询参数

参数
描述
默认值
source
数据源。更多信息
yandex_search
domain
域本地化。可用域:com, ru, ua, by, kz, tr
com
query
UTF 编码的关键字
-
start_page
起始页数
1
pages
检索的页数
1
limit
每页中要检索的结果数
10
locale
语言可用语言:en, ru, by, fr, de, id, kk, tt, tr, uk
-
geo_location
Yandex 的地理位置 rstr 格式。
-
user_agent_type
设备类型和浏览器。单击此处查看完整列表。
desktop
callback_url
转至回调端点的 URL。更多信息
-
- 必须提供的参数

代码示例

在以下例子中,我们提出了一个请求来检索 Yandex SERP,从第11 页到第 20 页,关键词为adidas
JSON
cURL
Python
PHP
HTTP
{
"source": "yandex_search",
"query": "adidas",
"start_page": 11,
"pages": 10
}
curl --user user:pass1 'https://realtime.oxylabs.io/v1/queries' -H "Content-Type: application/json"
-d '{"source": "yandex_search", "domain": "com", "query": "adidas", "start_page": 11, "pages": 10}'
import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'yandex_search',
'domain': 'com',
'query': 'adidas',
'start_page': 11,
'pages': 10
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())
<?php
$params = array(
'source' => 'yandex_search',
'domain' => 'com',
'query' => 'adidas',
'start_page' => 11,
'pages' => 10
);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://realtime.oxylabs.io/v1/queries");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($params));
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$headers = array();
$headers[] = "Content-Type: application/json";
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>
https://realtime.oxylabs.io/v1/queries?source=yandex_search&domain=com&query=adidas&start_page=11&pages=10&access_token=12345abcde
以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。