JavaScript 呈现

了解如何在网页爬虫 API 中使用 render 参数,以便有效抓取动态页面。

如果您要抓取的页面需要通过 JavaScript 动态将所有必要数据加载到 DOM 中,您可以在请求中包含一个 render 参数,而不是手动设置和使用无头浏览器。带有此参数的请求将被完全渲染,数据将根据指定参数存储为 HTML 文件或 PNG 截图。

HTML

render 参数设置为 html 以获取渲染页面的原始输出。

PNG(截图)

render 参数设置为 png 以获取渲染页面的 Base64 编码截图。

circle-info

如果您想抓取并下载图像,请参考 本节.

请求示例

curl --user "user:pass" \
'https://realtime.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "universal", "url": "https://www.example.com", "render": "html"}'
circle-exclamation
circle-exclamation

在特定页面强制渲染

为成功抓取,某些特定域名的页面类型由于其动态内容需要渲染。我们的系统会自动对这些页面强制进行渲染,即使用户未明确设置。

circle-exclamation

我们希望用户在抓取以下页面时充分了解这一点:

这种方法为这些具有挑战性的页面提供了最佳的抓取体验,确保数据的准确性和可靠性。

如果您希望禁用渲染,可以通过向请求添加以下参数来实现:

浏览器指令

使用我们的无头浏览器,您还可以执行各种 浏览器指令 例如点击、滚动、输入、等待等。阅读更多:

浏览器指令chevron-right

最后更新于

这有帮助吗?