构建请求
了解如何为搜索引擎、市场和其他网站构建 Web Scraper API 请求。包含代码示例和参数指导。
阅读关于如何开始并使用以下内容发出请求的详细指南: 网页爬虫 API 用于不同网站。
搜索引擎
快速开始
选择要爬取的搜索引擎: Google, Bing, 其他搜索引擎.
请求示例
curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
"source": "google_search",
"query": "adidas"
}'import requests
from pprint import pprint
# 构建负载。
payload = {
'source': 'google_search',
'query': 'adidas',
}
# 获取响应。
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('USERNAME', 'PASSWORD'),
json=payload,
)
# 将美化后的响应打印到标准输出。
pprint(response.json())我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。
构建请求
选择你的集成方式:同步(Realtime, Proxy Endpoint)或异步(Push-Pull).
在构建请求时,包括以下要素:
端点:
用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
内容类型。提交作业时,始终添加此标头:
负载:
source- 此参数设置将用于处理您请求的爬虫。URL或query- 提供URL或query以指定您要爬取的页面类型。请参考下表以及相应的目标子页面,以获取何时使用每个参数的详细指导。附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,parse,render等,以自定义你的爬取请求。
端点:
忽略证书。 在
cURL中,使用的是-k或--insecure.用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
负载:
URL- 提供URL你想要爬取的页面。附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,parse,并将它们作为头发送。
端点:
用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
内容类型。提交作业时,始终添加此标头:
负载:
source- 此参数设置将用于处理您请求的爬虫。URL或query- 提供URL或query以指定您要爬取的页面类型。请参考下表以及相应的目标子页面,以获取何时使用每个参数的详细指导。附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,parse,等,以自定义你的爬取请求。
提交请求后,你会立即收到一个 JSON 响应,包含所有作业详情,包括作业参数、作业 ID 以及用于下载作业结果的 URL:
市场
快速开始
选择要爬取的在线市场: Amazon, Google Shopping, Walmart, Best Buy, Etsy, 目标, 其他网站.
请求示例
我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。
构建请求
选择你的集成方式:同步(Realtime, Proxy Endpoint)或异步(Push-Pull).
在构建请求时,包括以下要素:
端点:
用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
内容类型。提交作业时,始终添加此标头:
负载:
source- 此参数设置将用于处理您请求的爬虫。URL或query- 提供URL或query以指定您要爬取的页面类型。请参考下表以及相应的目标子页面,以获取何时使用每个参数的详细指导。附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,parse,render等,以自定义你的爬取请求。
端点:
忽略证书。 在
cURL中,使用的是-k或--insecure.用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
负载:
URL- 提供URL你想要爬取的页面。附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,parse,并将它们作为头发送。
端点:
用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
内容类型。提交作业时,始终添加此标头:
负载:
source- 此参数设置将用于处理您请求的爬虫。URL或query- 提供URL或query以指定您要爬取的页面类型。请参考下表以及相应的目标子页面,以获取何时使用每个参数的详细指导。附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,parse,等,以自定义你的爬取请求。
提交请求后,你会立即收到一个 JSON 响应,包含所有作业详情,包括作业参数、作业 ID 以及用于下载作业结果的 URL:
其他网站
快速开始
使用我们的 universal source。你也可以添加 附加参数.
请求示例
我们在示例中使用同步 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步 Push-Pull 集成,请参阅 集成方法 部分。
构建请求
选择你的集成方式:同步(Realtime, Proxy Endpoint)或异步(Push-Pull).
在构建请求时,包括以下要素:
端点:
用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
内容类型。提交作业时,始终添加此标头:
载荷.
source- 此参数设置将用于处理您请求的爬虫。URL- 提供URL你想要爬取的目标的,例如:房地产:Idealista、Redfin、Zillow、Zoopla
旅游:Airbnb、Agoda、Booking、TripAdvisor
汽车:Crunchbase、ZoomInfo、AngelList、Product Hunt
公司数据:Netflix、SoundCloud、YouTube、IMDb
娱乐:AutoEurope、Autotrader、RockAuto、Halfords
任何其他.
附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,等,以自定义你的爬取请求。
端点:
忽略证书。 在
cURL中,使用的是-k或--insecure.用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
负载:
URL- 提供URL你想要爬取的页面,例如:房地产:Idealista、Redfin、Zillow、Zoopla
旅游:Airbnb、Agoda、Booking、TripAdvisor
汽车:Crunchbase、ZoomInfo、AngelList、Product Hunt
公司数据:Netflix、SoundCloud、YouTube、IMDb
娱乐:AutoEurope、Autotrader、RockAuto、Halfords
任何其他.
附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,并将它们作为头发送。
端点:
用户名和密码 (HTTP 身份验证). 在你的 试用注册或产品购买期间创建 API 用户凭据.
如果您需要为帐户创建多个 API 用户,请联系 客户支持 或使用我们的 24/7 在线聊天支持发送消息。
内容类型。提交作业时,始终添加此标头:
载荷.
source- 此参数设置将用于处理您请求的爬虫。URL- 提供URL你想要爬取的目标的,例如:房地产:Idealista、Redfin、Zillow、Zoopla
旅游:Airbnb、Agoda、Booking、TripAdvisor
汽车:Crunchbase、ZoomInfo、AngelList、Product Hunt
公司数据:Netflix、SoundCloud、YouTube、IMDb
娱乐:AutoEurope、Autotrader、RockAuto、Halfords
任何其他.
附加参数:可选地,你可以包含附加参数,例如
geo_location,user_agent_type,等,以自定义你的爬取请求。
提交请求后,你会立即收到一个 JSON 响应,包含所有作业详情,包括作业参数、作业 ID 以及用于下载作业结果的 URL:
最后更新于
这有帮助吗?

