URL

Google URL 抓取器可轻松检索任何 Google 页面内容。提供多语言的简单集成代码示例。

google source 旨在从各种 Google URL 检索内容。这意味着您可以向我们提供所需 Google 页面 的直接 URL,而不是发送多个参数。我们不会删除任何参数或以其他方式更改您的 URL。

请求示例

在下面的示例中,API 将检索 Google Scholar 的搜索页面。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "google",
        "url": "https://scholar.google.com/scholar?hl=en&q=newton&btnG=&as_sdt=1%2C5&as_sdtp="
    }'

我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

用于抓取 Google URL 的基本设置和自定义选项。

参数
说明
默认值

source

设置要使用的爬虫。

google

url

指向该 Google 页面的直接 URL(链接)。

-

render

设置为时启用 JavaScript 渲染 html. 更多信息.

-

parse

设置为时返回解析数据 true. 仅限特定类型的 URL Google 页面类型.

-

callback_url

您的回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

geo_location

应适配结果的地理位置。正确使用此参数对于获取正确数据非常重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 此处.

-

- 强制参数

输出示例

最后更新于

这有帮助吗?