Realtime
Oxylabs 网页爬虫 API 的 Realtime 集成。从任务提交到返回结果或错误期间保持 HTTPS 连接打开,使用 JSON 格式负载。
提交作业
端点
POST https://realtime.oxylabs.io/v1/queries输入
curl --user "USERNAME:PASSWORD" \
'https://realtime.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "universal", "url": "https://example.com", "geo_location": "United States"}'import requests
from pprint import pprint
# 构建负载。
payload = {
"source": "universal", # 你选择的来源,例如 "universal"
"url": "https://example.com", # 请查看你使用的具体来源的文档,确定应使用 "url" 还是 "query"
"geo_location": "United States", # 某些来源接受邮政编码和/或坐标
#"render" : "html", # 如果你想在页面上渲染 JavaScript,请取消注释
#"render" : "png", # 如果要对抓取的网页截图,则取消注释
#"parse" : true, # 检查哪些来源支持解析数据
}
# 获取响应。
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('YOUR_USERNAME', 'YOUR_PASSWORD'), # 在此填写您的凭据
json=payload,
)
# 该请求不会返回带有作业状态和结果 URL 的响应,而是返回
# JSON response with results.
pprint(response.json())输出
渲染参数
解析参数
默认输出
可用输出
输出示例:
最后更新于
这有帮助吗?

