JavaScript 渲染

了解如何在网页爬虫API中使用 render 参数,以便高效爬取动态页面。

如果您要抓取的页面需要 JavaScript 将所有必要数据动态加载到 DOM 中,您可以在请求中包含一个 render 参数,而不是手动设置和使用自定义浏览器指令。带有此参数的请求将被完全渲染,数据将根据指定的参数存储为 HTML 文件或 PNG 截图。

HTML

render 参数设置为 html 以获取渲染页面的原始输出。

PNG(截图)

render 参数设置为 png 以获取渲染页面的 Base64 编码截图。

circle-info

如果您想抓取并下载图像,请参阅 本节.

请求示例

curl --user "user:pass" \
'https://realtime.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "universal", "url": "https://www.example.com", "render": "html"}'
circle-exclamation
circle-exclamation

在特定页面强制渲染

为成功抓取,某些特定域的页面类型由于其动态内容需要渲染。我们的系统会自动对这些页面强制渲染,即使用户未明确设置。

circle-exclamation

我们希望用户在抓取以下页面时充分了解这一点:

这种方法为这些具有挑战性的页面提供了最佳的抓取体验,确保数据的准确性和可靠性。

如果您希望禁用渲染,您可以通过在请求中添加以下参数来实现:

浏览器指令

通过我们的自定义浏览器指令,您还可以执行各种 浏览器指令 例如点击、滚动、输入、等待等。阅读更多:

浏览器指令chevron-right

最后更新于

这有帮助吗?