URL
Google URL 抓取器可轻松检索任何 Google 页面内容。提供多语言的简单集成代码示例。
该 google source 旨在从各种 Google URL 检索内容。这意味着您可以向我们提供所需 Google 页面 的直接 URL,而不是发送多个参数。我们不会删除任何参数或以其他方式更改您的 URL。
请求示例
在下面的示例中,API 将检索 Google Scholar 的搜索页面。
curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
"source": "google",
"url": "https://scholar.google.com/scholar?hl=en&q=newton&btnG=&as_sdt=1%2C5&as_sdtp="
}'import requests
from pprint import pprint
# 构建负载。
payload = {
'source': 'google',
'url': 'https://scholar.google.com/scholar?hl=en&q=newton&btnG=&as_sdt=1%2C5&as_sdtp='
}
# 获取响应。
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('USERNAME', 'PASSWORD'),
json=payload,
)
# 该请求不会返回带有作业状态和结果 URL 的响应,而是返回
# JSON response with results.
pprint(response.json())我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。
请求参数值
通用
用于抓取 Google URL 的基本设置和自定义选项。
参数
说明
默认值
source
设置要使用的爬虫。
google
url
指向该 Google 页面的直接 URL(链接)。
-
- 强制参数
输出示例

最后更新于
这有帮助吗?

