AI 概览
了解如何使用 Web Scraper API 提取 AI 概览。查找代码示例和支持的参数。
该 google_search 和 google_ads sources 可以在所有受支持的全球地区从 Google Search 结果返回 AI Overviews。 ai_overviews result 数组在单个响应中支持多个 AI 块,包括“People also ask”和“Things to know”等部分。
为最大化接收完整呈现的 AI Overviews 内容的可能性,您必须包含以下参数:
source
google_search 或 google_ads
render
html
user_agent_type
desktop 或 mobile
使用这些参数还允许您通过单个请求同时接收一般响应和 AI Overviews 内容。
Google 动态生成此内容或加载缓存版本,因此 AI 生成的答案可能随时间变化,即使参数相同。
探索 数据字典 用于某些 AI Overviews SERP 功能。
AI Overviews 区域可用性
Google AI Overviews 在大多数国家可用,但有少数例外。目前最大的不包括国家有:
法国
中国
伊朗
朝鲜
Google AI Overviews 功能正在持续推出,随着时间推移会包含更多国家。
请求示例
我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。
请求参数值
通用
用于抓取带有 AI Overviews 的 Google Web 搜索结果的基本设置和自定义选项。
- 强制参数
Google 高级搜索运算符
在抓取时,将 Google 高级搜索运算符与查询结合使用可能很有用。它使您能够自定义搜索范围,确保结果更相关、更集中。探索这些特殊命令 此处 和 此处。参见下面的示例查询。
本地化
将搜索结果适配到特定的地理位置、域名和语言。
分页
用于管理搜索结果分页和检索的控制。
start_page
起始页码。
1
pages
要检索的页面数量。
1
limit
每页要检索的结果数量。
10
context:limit_per_page
使用相同 IP 地址和会话(cookie 集)抓取多页。通过在 JSON 数组中使用 page 键并使用 limit 键指示每页的有机结果数,您可以将跨页出现重复有机结果(例如第一页的最后一个有机结果与第二页的第一个有机结果相同)的概率降到最低。 参见示例.
-
支持连续滚动
Web Scraper API 完全支持 Google Search 连续滚动。它会自动检测连续滚动布局,有效加载请求的自然结果,无需任何额外参数。
每页限制
由于 Google 最近的限制更改,我们调整了 网页爬虫API 的行为。每页最大结果将与 Google 的有机输出匹配,通常为 10 个结果。
要使用此功能,请在 JSON 数组中包含包含以下数据的 JSON 对象:
page
您要抓取的页面编号。任何大于 0 的整数值都可用
1
limit
该页上的结果数。任何介于 1 和 100 (含)之间的整数值都可用。
90
请求示例
筛选
用于根据各种条件过滤和细化搜索结果的选项。了解如何使用上下文参数 此处.
context:
filter
将此参数的值设置为可让您看到本会因与其他结果相似而被排除的结果。 0 让您看到本会因与其他结果相似而被排除的结果。
1
context:
safe_search
安全搜索。设置为以启用它。 true 以启用它。
false
context:
tbm
要匹配或 tbm 参数。可接受的值为: app, blg, bks, dsc, isch, nws, pts, plcs, rcp, lcl
-
context:
tbs
此参数类似于包含更晦涩 Google 参数的容器,例如按日期限制/排序结果以及其他某些依赖于的过滤器, tbm 参数(例如 tbs=app_os:1 仅在与一起使用时可用 tbm value app)。更多信息 此处.
-
udm 和 tbm 上下文参数不能在单个抓取请求中一起使用;请仅选择一个。两者同时使用可能导致冲突或意外行为。
其他
用于专门需求的其他高级设置和控制。
context:
fpstate
将 fpstate 的值设置为 aig 将使 Google 加载更多应用。仅在与一起使用时此参数才有用。 render 参数。
-
context:
nfpr
true 将关闭拼写自动更正
false
上下文参数
所有上下文参数应作为对象添加到 context 数组,包含 key 和 value 键值对,例如:
数据结构和处理
数据字典
AI Overviews SERP 功能中所有可用的键在下表中定义:
answer_text
有关 Google Search 查询术语的一般信息。
数组
bullet_list
指示在 AI Overviews SERP 功能中以项目符号列表呈现的项目的信息。
数组
products
包含各自详细信息的产品列表。
对象
source_panel
用于生成 Google SERP 功能中 AI Overviews 结果的来源列表。
对象
additional_questions
包含各自详细信息的附加问题列表。
对象
食谱
包含相应详情的食谱列表。
对象
info_list
最常用于表示与搜索查询相关流程步骤的信息列表。
数组
pos_overall
指示 AI Overviews SERP 功能结果在所有可用 Google SERP 结果中的位置。
整数
处理多个 AI Overviews
由于 AI Overviews 现在作为数组返回,您必须对其进行迭代:
在大多数情况下,通常只有一个 AI Overview,但您的代码应准备处理多个条目。
在下面按不同搜索查询分类,探索 AI Overviews 结果示例: 项目, 食谱, 说明.
项目
在以下示例中,使用了查询 “Emporio Armani EA3192”。
答案文本
text
对 Google Search 查询的简短回答。
数组
pos
指示给定项目在所有 AI Overviews 答案结果中的位置。
整数
项目符号列表
list_title
项目符号列表的标题。
字符串
points
在项目符号列表中呈现的条目。所有条目以逗号分隔。
数组
pos
指示给定项目在所有 AI Overviews 项目符号列表结果中的位置。
整数
产品
items
包含各自详细信息的产品列表。
数组
items.product_name
产品名称。
字符串
items.price
产品的当前价格。
字符串
items.previous_price
产品的初始价格(如适用)。
字符串
items.seller
产品的卖家。
字符串
items.shipping
产品可用的运输类型。
字符串
items.url
产品的 URL。
字符串
items.pos
指示给定项目在所有 AI Overviews 产品结果中的位置。
整数
来源面板
items
用于生成 Google SERP 功能中 AI Overviews 结果的来源列表。
对象
items.url
网站的 URL。
字符串
items.source
网站的名称。
字符串
items.date
文章发布的日期。
字符串
items.title
文章的标题。
字符串
items.pos
指示给定项目在所有 AI Overviews 来源面板结果中的位置。
整数
附加问题
items.question
与原始搜索查询相关的以逗号分隔的附加问题列表。
数组
items.pos
指示给定项目在所有 AI Overviews 附加问题结果中的位置。
整数
食谱
在以下示例中,使用了查询 “recipe for an apple pie”。

食谱
items
包含相应详情的食谱列表。
数组
items.description
食谱的简短描述。
字符串
items.image
食谱的 base64 编码缩略图。
字符串
items.source
发布食谱的网站名称。
字符串
items.rating
食谱的评分。
字符串
items.rating_count
评分数量。
字符串
items.duration
准备菜肴所需的时间。
字符串
items.url
完整食谱的 URL。
字符串
items.title
食谱的标题。
字符串
在以下示例中,使用了查询 “recipe of a juicy succulent steak”。

信息列表
list_title
列表的标题。
字符串
list_items
包含带各自详细信息的项目列表。
数组
list_items.title
列表中部分的标题。
字符串
list_items.content
该部分的简短描述。
数组
list_item.pos
指示给定项目在所有 AI Overviews 信息列表结果中的位置。
整数
说明
在以下示例中,使用了查询 “docker exec commands explained”。

答案文本 命令
command
给计算机或软件下达以执行特定任务的指令。
字符串
最后更新于
这有帮助吗?

