Documentation has been updated: see help center and changelog in one place.

URL

Google URL 抓取器可轻松检索任何 Google 页面内容。提供多语言的简单集成和代码示例。

google source 被设计用于从各种 Google URL 检索内容。这意味着您可以提供所需 Google 页面的直接 URL,而不是发送多个参数。我们不会剥离任何参数或以任何其他方式更改您的 URL。

请求示例

在下面的示例中,API 将检索 Google 学术的搜索页面。

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "google",
        "url": "https://scholar.google.com/scholar?hl=en&q=newton&btnG=&as_sdt=1%2C5&as_sdtp="
    }'

在我们的示例中,我们使用同步的 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步的 Push-Pull 集成,请参阅 集成方法 部分。

请求参数值

通用

针对抓取 Google URL 的基本设置和自定义选项。

参数
说明
默认值

source

设置抓取器。

google

url

指向该 Google 页面的直接 URL(链接)。

-

render

启用 JavaScript 渲染,当设置为 html. 更多信息.

-

parse

当设置为以下值时返回解析后的数据 true. 仅限特定 类型 的 URL Google 页面类型.

-

callback_url

回调端点的 URL。 更多信息.

-

user_agent_type

设备类型和浏览器。完整列表可在 此处.

desktop

geo_location

应为其适配结果的地理位置。正确使用此参数对于获取正确数据非常重要。有关更多信息,请阅读我们建议的 geo_location 参数结构 此处.

-

- 必填参数

输出示例

{
    "results": [
        {
            "content":"<!doctype html>\n<html lang=\"en\">\n<head>
            ...
            </script></body>\n</html>\n",            
            "created_at": "2024-05-27 12:28:27",
            "updated_at": "2024-05-27 12:28:30",
            "page": 1,
            "url": "https://scholar.google.com/scholar?hl=en&q=newton&btnG=&as_sdt=1%2C5&as_sdtp=",
            "job_id": "7200835246005180417",
            "status_code": 200
        }
    ]
}

最后更新于

这有帮助吗?