构造请求
了解如何为搜索引擎、市场和其他网站构造 Web Scraper API 请求。包括代码示例和参数指南。
阅读关于如何开始并使用以下内容发出请求的详细指南: Web Scraper API 针对不同网站。
搜索引擎
入门指南
选择您要抓取的搜索引擎: Google, Bing, 其他搜索引擎.
请求示例
curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
"source": "google_search",
"query": "adidas"
}'import requests
from pprint import pprint
# 构建负载。
payload = {
'source': 'google_search',
'query': 'adidas',
}
# 获取响应。
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('USERNAME', 'PASSWORD'),
json=payload,
)
# 将格式化后的响应打印到 stdout。
pprint(response.json())我们在示例中使用同步的 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步的 Push-Pull 集成,请参阅 集成方法 部分。
构建请求
选择您的集成方式:同步(Realtime, Proxy Endpoint)或异步(Push-Pull).
在构建请求时,请包含以下要素:
端点:
用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
Content-type提交作业时,请始终添加此头:
负载:
source- 此参数设置将用于处理您请求的抓取器。URL或query- 提供您想要抓取的页面类型的URL或query有关何时使用每个参数的详细指南,请参阅下表及相应的目标子页面。附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type,parse,render等,以自定义您的抓取请求。
端点:
忽略证书。 在
cURL中,使用-k或--insecure.用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
负载:
URL- 提供您想要抓取的页面类型的URL用于您想要抓取的页面。附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type,parse,并将它们作为头发送。
端点:
用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
Content-type提交作业时,请始终添加此头:
负载:
source- 此参数设置将用于处理您请求的抓取器。URL或query- 提供您想要抓取的页面类型的URL或query有关何时使用每个参数的详细指南,请参阅下表及相应的目标子页面。附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type,parse等,以自定义您的抓取请求。
提交请求后,您将立即收到一个 JSON 响应,其中包含所有作业详细信息,包括作业参数、作业 ID 以及用于下载作业结果的 URL:
市场
入门指南
选择您要抓取的在线市场: Amazon, Google Shopping, Walmart, Best Buy, Etsy, 目标, 其他网站.
请求示例
我们在示例中使用同步的 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步的 Push-Pull 集成,请参阅 集成方法 部分。
构建请求
选择您的集成方式:同步(Realtime, Proxy Endpoint)或异步(Push-Pull).
在构建请求时,请包含以下要素:
端点:
用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
Content-type提交作业时,请始终添加此头:
负载:
source- 此参数设置将用于处理您请求的抓取器。URL或query- 提供您想要抓取的页面类型的URL或query有关何时使用每个参数的详细指南,请参阅下表及相应的目标子页面。附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type,parse,render等,以自定义您的抓取请求。
端点:
忽略证书。 在
cURL中,使用-k或--insecure.用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
负载:
URL- 提供您想要抓取的页面类型的URL用于您想要抓取的页面。附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type,parse,并将它们作为头发送。
端点:
用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
Content-type提交作业时,请始终添加此头:
负载:
source- 此参数设置将用于处理您请求的抓取器。URL或query- 提供您想要抓取的页面类型的URL或query有关何时使用每个参数的详细指南,请参阅下表及相应的目标子页面。附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type,parse等,以自定义您的抓取请求。
提交请求后,您将立即收到一个 JSON 响应,其中包含所有作业详细信息,包括作业参数、作业 ID 以及用于下载作业结果的 URL:
其他网站
入门指南
使用我们的 universal source 抓取任何 URL。您也可以添加 附加参数.
请求示例
我们在示例中使用同步的 Realtime 集成方法。如果您想使用 Proxy Endpoint 或异步的 Push-Pull 集成,请参阅 集成方法 部分。
构建请求
选择您的集成方式:同步(Realtime, Proxy Endpoint)或异步(Push-Pull).
在构建请求时,请包含以下要素:
端点:
用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
Content-type提交作业时,请始终添加此头:
负载.
source- 此参数设置将用于处理您请求的抓取器。URL- 提供您想要抓取的页面类型的URL您要抓取的目标的示例,例如:房地产:Idealista、Redfin、Zillow、Zoopla
旅游:Airbnb、Agoda、Booking、TripAdvisor
汽车:Crunchbase、ZoomInfo、AngelList、Product Hunt
公司数据:Netflix、SoundCloud、YouTube、IMDb
娱乐:AutoEurope、Autotrader、RockAuto、Halfords
任何其他.
附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type等,以自定义您的抓取请求。
端点:
忽略证书。 在
cURL中,使用-k或--insecure.用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
负载:
URL- 提供您想要抓取的页面类型的URL您想要抓取的页面,例如:房地产:Idealista、Redfin、Zillow、Zoopla
旅游:Airbnb、Agoda、Booking、TripAdvisor
汽车:Crunchbase、ZoomInfo、AngelList、Product Hunt
公司数据:Netflix、SoundCloud、YouTube、IMDb
娱乐:AutoEurope、Autotrader、RockAuto、Halfords
任何其他.
附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type,并将它们作为头发送。
端点:
用户名和密码 (HTTP 认证). 在试用注册或购买产品时创建 API 用户凭据 试用注册或产品购买期间.
如果您需要为您的帐户创建多个 API 用户,请联系我们的 客户支持 或通过我们的 24/7 在线聊天支持联系。
Content-type提交作业时,请始终添加此头:
负载.
source- 此参数设置将用于处理您请求的抓取器。URL- 提供您想要抓取的页面类型的URL您要抓取的目标的示例,例如:房地产:Idealista、Redfin、Zillow、Zoopla
旅游:Airbnb、Agoda、Booking、TripAdvisor
汽车:Crunchbase、ZoomInfo、AngelList、Product Hunt
公司数据:Netflix、SoundCloud、YouTube、IMDb
娱乐:AutoEurope、Autotrader、RockAuto、Halfords
任何其他.
附加参数:可选地,您可以包含附加参数,例如
geo_location,user_agent_type等,以自定义您的抓取请求。
提交请求后,您将立即收到一个 JSON 响应,其中包含所有作业详细信息,包括作业参数、作业 ID 以及用于下载作业结果的 URL:
如果您在发出首次请求时需要任何帮助,请随时通过 24/7 在线聊天与我们联系。
本文中的所有信息均按“原样”提供,仅供参考。对于您使用本页所含任何信息所产生的后果,我们不作任何陈述并否认一切责任。在进行任何形式的抓取活动之前,您应咨询法律顾问并仔细阅读相关网站的服务条款或获得抓取许可。
最后更新于
这有帮助吗?

