Proxy Endpoint
通过 Oxylabs 网页爬虫 API 的 Proxy Endpoint 发送和接收数据。通过简单的基于 URL 的集成直接访问目标页面。
如果您曾使用常规代理进行数据抓取,集成 Proxy Endpoint 交付方式将非常简单。您所需做的只是将我们的入口节点作为代理,使用 Scraper API 凭据进行授权,并忽略证书。在 cURL中,使用的是 -k 或 --insecure。您的数据将通过开放连接传递给您。
Proxy Endpoint 仅适用于基于 URL 的数据源,其中提供完整的 URL。因此,它只接受少量额外的作业参数,这些参数 应作为头部发送.
该产品并非设计为直接与无头浏览器(例如 Chromium、PhantomJS、Splash 等)及其驱动程序(例如 Playwright、Selenium、Puppeteer 等)配合使用。
端点
GET realtime.oxylabs.io:60000输入
请参见下面的请求示例。
curl -k -x https://realtime.oxylabs.io:60000 \
-U 'USERNAME:PASSWORD' \
-H 'x-oxylabs-user-agent-type: desktop_chrome' \
-H 'x-oxylabs-geo-location: Germany' \
'https://www.example.com'import requests
from pprint import pprint
# 在此处使用您的 SERP API 凭据。
USERNAME, PASSWORD = 'YOUR_USERNAME', 'YOUR_PASSWORD'
# 定义代理字典。
proxies = {
'http': f'http://{USERNAME}:{PASSWORD}@realtime.oxylabs.io:60000',
'https': f'https://{USERNAME}:{PASSWORD}@realtime.oxylabs.io:60000'
}
# 若要设置特定的地理位置、User-Agent 或渲染 Javascript
# 需要将参数作为请求头发送。
headers = {
'x-oxylabs-user-agent-type': 'desktop_chrome',
'x-oxylabs-geo-location': 'Germany',
#'X-Oxylabs-Render': 'html', # 如果您希望在页面内渲染 JavaScript,请取消注释。
}
response = requests.request(
'GET',
'https://www.example.com',
headers = headers, # 传入已定义的头部。
verify=False, # 接受我们的证书。
proxies=proxies,
)
# 将结果页面打印到 stdout。
pprint(response.text)
# 将返回的 HTML 保存到 'result.html' 文件中。
with open('result.html', 'w') as f:
f.write(response.text)输出
下面您会看到来自的示例响应 https://example.com:
接受的参数
发起请求时,除了 URL,您还可以向我们发送一些我们在执行作业时会使用的作业参数。作业参数应作为请求头发送 - 请参见示例 此处.
以下是您可以随 Proxy Endpoint 请求一起发送的作业参数列表:
最后更新于
这有帮助吗?

