Google

我们可以在 Google 上抓取和解析各种页面类型。您可以向我们提供一个完整的URL 或通过专门建立的页面类型提供一些输入参数(如搜索 ,广告 , 酒店, 和其他),所以我们可以在我们的终端形成 URL。

注意:SERP 爬虫 API 在抓取时可以渲染 JavaScript。这在一些 Google 服务中是有必要的,例如 旅行

总览

以下概述我们通过 Google 支持的所有可用数据source值 。

来源描述结构化数据

google

提交您喜欢的任意 Google 网址。

取决于 URL。

google_search

SERP。

是。

google_ads

SERP,针对最大广告率进行优化。 仅 num=10

是。

google_hotels

传奇酒店的服务。

是。

google_travel_hotels

旅行:酒店服务。

是。

google_images

反向图像搜索。

是。

google_suggest

自动完成的搜索词建议。

是。

google_msv_v2

每月搜寻流量。

是。

google_trends_explore

趋势。

是。

您可以通过选择菜单右侧的名称跳转至您喜欢的 Google 页面类型。每个页面都包含参数表以及代码示例,可帮助您开始查询。

URL

google 源设计用于检索各种 Google URL 中的内容。这意味着,您可以向我们提供一个转至所需 Google 页面的直接 URL,而不是发送多个参数。我们不会剥离任何参数或以任何其他方式更改您的 URL。

这个数据源也支持解析数据(JSON 格式的结构化数据),只要提交的 URL 用于 Google(SERP 页面)。如果我们不能确认这是一个 SERP 页面请求,我们将返回一个故障信息。

查询参数

参数描述默认值

source

数据源。更多信息

google

url

转到 Google 页面的直接 URL(链接)

-

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

render

启用 JavaScript 渲染。更多信息

callback_url

转至回调端点的 URL。更多信息

-

geo_location

这些结果将根据地理位置进行调整。正确使用这个参数对获得准确的数据极为重要。欲了解更多信息,请在此处阅读我们建议的 geo_location 参数结构。

-

parse

true 将返回结构化数据。

-

- 必须提供的参数

代码示例

在以下示例中,API 将检索一个 Google Scholar 搜索页面。

{
    "source": "google", 
    "url": "https://scholar.google.com/scholar?hl=en&q=newton&btnG=&as_sdt=1%2C5&as_sdtp="
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

搜索

google_search 源设计用于检索 Google Search 结果(SERP)。

查询参数

参数描述默认值

source

数据源。更多信息

google_search

domain

域本地化

com

query

UTF 编码的关键字

-

start_page

起始页数

1

pages

检索的页数

1

limit

每页中要检索的结果数

10

locale

Accept-Language 标头值,它可以更改您的 Google 搜索页面的网页界面语言。更多信息

-

geo_location

结果应适应的地理位置。正确使用这个参数对获得正确数据极为重要。欲了解更多信息,请在此处阅读我们建议的 geo_location 参数结构。

-

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

render

启用 JavaScript 渲染。更多信息

callback_url

转至回调端点的 URL。更多信息

-

parse

true 将返回解析数据。查看结构化数据了解更多信息。

-

context: fpstate

设置 fpstate 值为 aig 将使 Google 加载更多应用程序。这个参数只有在与渲染 参数一起使用时才有用。

-

context: nfpr

true 将关闭拼写自动纠正功能。

false

context:limit_per_page

如果要使用相同的IP地址抓取多个页面,请包含一个JSON数组,并使用 page 键指定页面数量。还必须通过添加 limit 键来指示每个页面上的自动搜索结果数,例如:

"context": [{
        "key": "limit_per_page",
        "value": [
          {"page": 1, "limit": 10},
          {"page": 2, "limit": 90}
        ]
      }]

-

context: results_language

结果语言。您可以在这里 找到一个支持的 Google 语言列表。

-

context: tbm

待配或 tbm 参数。可接受的值是:appblgbksdscischnwsptsplcsrcplcl

-

context: tbs

ttbs 参数这个参数就像一个容器,用于存放更多无名 Google 参数,比如按日期限制/排序结果,以及其他过滤器,其中一些取决于 tbm 参数(例如 tbs=app_os:1 只适用于 tbmapp).单击此处了解更多相关信息。

-

- 必须提供的参数

代码示例

在以下示例中,我们请求从 google.nl 域获得 2 个结果页面,从第 11 页到第 12 页,搜索词为 adidas。SERP 将被过滤,只包含法语的结果。

{
    "source": "google_search",
    "domain": "nl",
    "query": "adidas",
    "start_page": 11,
    "pages": 2,
    "parse": true,
    "context": [
        {
            "key": "results_language",
            "value": "fr"
        }]
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

广告

google_ads 源被优化为检索带有付费广告的 Google Search 结果页(SERP)。这个来源每页只返回十个结果,确保显示付费结果的机会最高。除此以外,它支持与常规 搜索 相同的参数。

查询参数

参数描述默认值

source

数据源。更多信息

google_ads

domain

Google 的域名本地化。单击此处查看可用域名的完整列表。

com

query

UTF 编码的关键字

-

start_page

起始页数

1

pages

检索的页数

1

locale

Accept-Language 标头值,它可以更改您的 Google 搜索页面的网页界面语言。更多信息

-

geo_location

结果应适应的地理位置。正确使用这个参数对获得正确数据极为重要。欲了解更多信息,请在此处阅读我们建议的 geo_location 参数结构。

-

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

render

启用 JavaScript 渲染。更多信息

-

callback_url

转至回调端点的 URL。更多信息

-

parse

true 将返回结构化数据。查看结构化数据了解更多信息。

-

context: nfpr

true 将关闭拼写自动纠正功能。

false

context: results_language

结果语言。您可以在这里 找到一个支持的 Google 语言列表。

-

context: tbm

待配或 tbm 参数。可接受的值是:appblgbksdscischnwsptsplcsrcplcl

-

context: tbs

tbs 参数这个参数就像一个容器,用于存放更多无名 google 参数,比如按日期限制/排序结果以及其他过滤器,其中一些取决于tbm 参数(例如 tbs=app_os:1 只适用于 tbmapp).单击此处了解更多相关信息。

-

- 必须提供的参数

代码示例

在这个示例中,我们向 google.nl 发送请求检索关键字 adidas 的搜索结果。

{
    "source": "google_ads", 
    "domain": "nl", 
    "query": "adidas",
    "parse": true
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

酒店

google_hotels 数据源设计用于检索 Google Hotel 搜索结果。

查询参数

参数描述默认值

source

数据源。更多信息

google_hotels

domain

域本地化

com

query

UTF 编码的关键字

-

start_page

起始页数。

1

pages

检索的页数。

1

limit

每页中要检索的结果数。

10

locale

Accept-Language 标头值,它可以更改您的 Google 搜索页面的网页界面语言。更多信息

-

results_language

结果语言。您可以在这里 找到一个支持的 Google 语言列表。

-

geo_location

结果应适应的地理位置。正确使用这个参数对获得正确数据极为重要。欲了解更多信息,请在此处阅读我们建议的 geo_location 参数结构。

-

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

render

启用 JavaScript 渲染。更多信息

callback_url

转至回调端点的 URL。更多信息

-

context: nfpr

true 将关闭拼写自动纠正功能。

false

context: hotel_occupancy

宾客人数。

2

context: hotel_dates

入住酒店时长,入住日期 - 离开日期。示例:2023-07-12,2023-07-13

-

- 必须提供的参数

注意:使用 Google hotel,您始终需要发送一个包含“酒店”一词的关键词 例如,“洛杉矶的酒店”,“法国巴黎的酒店”,等等。“宾馆”和“酒店”都可以。Google 还支持当地语言,为赫尔辛基的酒店发送“Hotelli Helsingissä”,为维尔纽斯的酒店发送“viešbučiai Vilnius”。

代码示例

在这个示例中,我们请求 google.com.sons. 检索前 3 页页面,以查询2023-10-012023-10-10期间在巴黎是否有可容纳1名客人的酒店。

{
    "source": "google_hotels", 
    "domain": "com", 
    "pages": 3, 
    "query": "hotels in Paris", 
    "context": [
        {
            "key": "hotel_occupancy", 
            "value": 1
        }, 
        {
            "key": "hotel_dates", 
            "value": "2023-10-01,2023-10-10"
            }]
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

旅行:酒店

Google_travel_hotels 数据源设计用于检索 Google Travel 服务的酒店搜索结果。

查询参数

参数描述默认值

source

数据源。更多信息

google_travel_hotels

domain

域本地化

com

query

UTF 编码的关键字

-

start_page

起始页数

1

locale

Accept-Language 标头值,它可以更改您的 Google 搜索页面的网页界面语言。更多信息

-

geo_location

结果应适应的地理位置。正确使用这个参数对获得正确数据极为重要。请注意,这个来源可以接受数量有限的 geo_location 值 - 请检查 本节 来查看 产生准确结果的geo_location 值。

-

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

render

启用 JavaScript 渲染。更多信息

-

callback_url

转至回调端点的 URL。更多信息

-

context: hotel_occupancy

宾客人数

2

context: hotel_classes

按酒店星级过滤结果。您可以指定一个或多个介于25之间的值.例如:[3,4]

-

context: hotel_dates

住在酒店的日期,入住日期 - 离开日期。示例:2023-07-12,2023-07-13

-

- 必须提供的参数

注意:请注意,使用 Google Hotels,您的关键词必须始终包括“酒店”,例如,“洛杉矶的酒店”、“法国巴黎的酒店”等。“宾馆”和“酒店”都可以。Google 还支持当地语言,为赫尔辛基的酒店发送“Hotelli Helsingissä”,为维尔纽斯的酒店发送“viešbučiai Vilnius”。

代码示例

在这个示例中,我们请求从 google.com 检索第 2 页结果页面,以查询 2023-10-012023-10-10期间在巴黎是否有可容纳2名客人的24-星级酒店。

{
    "source": "google_travel_hotels",
    "domain": "com", 
    "start_page": 2, 
    "query": "hotels in Paris", 
    "context": [
        {
            "key": "hotel_occupancy", 
            "value": 2
        }, 
        {
            "key": "hotel_dates", 
            "value": "2023-10-01,2023-10-10"
        },
        {
            "key": "hotel_classes", 
            "value": [2,4]
        }]
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

图片

google_images 源设计用于检索图像搜索页面以查找与提供query参数和包含这些图像的网站的图像相似的图像。

查询参数

参数描述默认值

source

数据源。更多信息

google_images

domain

域本地化

com

query

图像 URL

-

start_page

起始页数

1

pages

检索的页数

1

locale

Accept-Language 标头值,它可以更改您的 Google 搜索页面的网页界面语言。更多信息

-

geo_location

结果应适应的地理位置。正确使用这个参数对获得正确数据极为重要。欲了解更多信息,请在此处阅读我们建议的 geo_location 参数结构。

-

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

render

启用 JavaScript 渲染。更多信息

callback_url

转至回调端点的 URL。更多信息

-

context: nfpr

true 将关闭拼写自动纠正功能。

false

context: results_language

结果语言。您可以在 这里找到一个支持 Google 语言的列表。

-

- 必须提供的参数

代码示例

在这个示例中,我们请求获得这个图像的反向图像搜索结果: 来自 google.comhttps://newsneakernews-wpengine.netdna-ssl.com/wp-content/uploads/2017/03/adidas-boost-march-25-2017.jpg。

{
    "source": "google_images", 
    "domain": "com", 
    "query": "https://newsneakernews-wpengine.netdna-ssl.com/wp-content/uploads/2017/03/adidas-boost-march-25-2017.jpg", 
    "context": [
        {
            "key": "search_operators",
            "value": [
                {"key": "site", "value": "example.com"}, 
                {"key": "filetype", "value": "html"}, 
                {"key": "inurl", "value": "image"}
        }], 
    "callback_url": "https://your.callback.url"
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

建议

google_suggest 源设计用于检索 Google 的搜索术语建议。

查询参数

参数描述默认值

source

数据源。更多信息

google_suggest

query

UTF 编码的关键字

-

locale

Accept-Language 标头值,它可以更改您的 Google 搜索页面的网页界面语言。更多信息

-

geo_location

结果应适应的地理位置。正确使用这个参数对获得正确数据极为重要。欲了解更多信息,请在此处阅读我们建议的 geo_location 参数结构。

-

user_agent_type

设备类型和浏览器。单击此处查看完整列表。

desktop

render

启用 JavaScript 渲染。更多信息

callback_url

转至回调端点的 URL。更多信息

-

- 必须提供的参数

代码示例

API 请求 Google Suggestions 页面检索关键词 adidas 的建议。

 {
    "source": "google_suggest",  
    "query": "what is"
}

以上示例使用了 Realtime 集成方法。如果您想在您的查询中使用一些其他集成方法(如推拉代理端),请参考集成方法部分。

关键字

google_msv_v2 数据源将检索指定关键字和建议关键字的 Google 关键字数据(除非在上下文中传递 idea=False)。

查询参数

参数描述默认值

source

数据源。更多信息

google_msv_v2

query

UTF 编码的关键词,用逗号分隔。

-

geo_location

结果应适应的地理位置。正确使用这个参数对获得正确数据极为重要。欲了解更多信息,请在此处阅读我们建议的 geo_location 参数结构。

-

context: language

语言,例如,英语法文.没有参数或空值将返回所有语言的结果。

context: currency

3 个符号的货币代码。

EUR

context: ideas

如果是true,返回关键字的意思 ,如果是false,将只返回所请求关键字的数据。

true

context: ideas_limit

当获取意思时,将检索意思关键字的数量限制为已有限制,四舍五入到最接近的 50 倍数(例如:20 -> 50, 123 -> 150).0 表示没有限制。

0

context: min_amsv

在获取意思时,将过滤掉月平均搜索量低于所提供数字的意思关键词。0 表示没有过滤器。

0

context: max_amsv

在获取意思时,将过滤掉月平均搜索量高于所提供数字的意思关键词。0 表示没有过滤器。

0

context: category

在获取意思时,将过滤掉不属于所提供类别的意思关键词。此处 提供了 .csv 格式的可用类别。

null

callback_url

转至回调端点的 URL。更多信息

-

- 必须提供的参数

代码示例

在这个示例中,API 将检索优秀的 餐厅的关键词数据和所有建议的关键词。关键词语言是法文,地理位置为Paris,Ile-de-France,France 和货币是 EUR