JS 渲染与浏览器控制
了解如何使用 `render` 参数,以及如何在 网页爬虫API 中定义浏览器指令,以便抓取复杂的动态页面。
JavaScript 渲染
HTML
PNG(截图)
请求示例
curl --user "user:pass" \
'https://realtime.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "universal", "url": "https://www.example.com", "render": "html"}'import requests
from pprint import pprint
# Structure payload.
payload = {
'source': 'universal',
'url': 'https://www.example.com',
'render': 'html',
}
# Get response.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# 不返回作业状态和结果 URL 的响应,而是返回
# 结果的 JSON 响应。
pprint(response.json())强制渲染特定页面
浏览器指令
用法


获取浏览器资源
支持的浏览器指令列表
通用参数
type
typetimeout_s
timeout_swait_time_s
wait_time_son_error
on_error通用参数示例
指令
click
click输入
输入滚动
滚动scroll_to_bottom
scroll_to_bottomwait
waitwait_for_element
wait_for_elementfetch_resource
fetch_resource指令验证
故障排查
状态码
错误和警告
可能的错误和警告
最后更新于
这有帮助吗?

