URL

Google URL 抓取器可轻松从任何 Google 页面检索内容。提供简单集成方式和多语言代码示例。

google source 旨在从各种 Google URL 中检索内容。这意味着你无需发送多个参数,只需提供所需 Google 页面对应的直接 URL 即可。我们不会删除任何参数,也不会以任何其他方式更改你的 URL。

请求示例

在下面的示例中,API 将检索一个 Google Scholar 搜索页面。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "google",
        "url": "https://scholar.google.com/scholar?hl=en&q=newton&btnG=&as_sdt=1%2C5&as_sdtp="
    }'

我们使用同步的 Realtime 集成方法作为示例。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

Google URL 爬取的基础设置和自定义选项。

参数
说明
默认值

source

设置爬虫。

google

url

Google 页面对应的直接 URL(链接)。

-

render

设置为 html. 更多信息.

-

parse

设置为 true. 仅限于特定类型的 URL Google 页面类型.

-

callback_url

您的回调端点 URL。 更多信息

-

user_agent_type

设备类型和浏览器。完整列表可在 这里.

desktop

geo_location

结果应适配的地理位置。正确使用此参数对于获取正确数据极其重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 这里.

-

- 必填参数

输出示例

最后更新于

这有帮助吗?