入门
要使用我们的爬虫API 开始抓取, 请遵循以下简单步骤:
- 1.选择您想在您所使用的爬虫API 下抓取的域名。
- 3.组建一个查询 并将其发送到我们的 API。
- 在您所选页面类型或域名下,您会发现不同编程语言的代码示例。使用它们来建立您的查询,并确保始终包括以下元素:
内容类型
。提交作业时,始终发送content-type: application/json
标头。- 有效载荷.它是一个查询参数的集合,详细说明了您希望我们服务执行的作业。注意强制性、参数(
source
、query
, 或ULR
)。它们在查询参数表中被标记为绿色。您可以使用这些强制性参数提出一个非常基本的请求,或者添加各种额外参数(例如,geo_location
、user_agent_type
等)。 Username
andpassword
. You must provide your API user credentials. Otherwise, your query won't work. Our Scraper APIs use basic HTTP authentication.用户名
及Password
。您必须提供您的 API 用户凭证。否则,您的查询就不会成功。我们的爬虫API 使用基本的 HTTP 身份验证。
如果您想在大规模使用 API 之前手动尝试一下,我们建议使用 Postman。在每个域下,您会发现其 Postman 集合,您可以将其导入 Postman 并立即开始抓取。这些集合包含各种来源和集成方法的请求模板。
- 我们极力建议您访问我们的 API 参考部分以高效地使用和整合我们的爬虫API。您会发现关于整合方法、全局参数值、响应代码和用量统计的信息。
- 随时可通过查询以下端点查看历史用量统计:
GET https://data.oxylabs.io/v2/stats
。亦可返回月度或每日统计。请访问以下部分了解更多信息。
- 查看我们的Scraper API 任务管家功能。它可用于重复性的抓取和解析作业。
- 测试一下爬虫 API 功能网络爬虫: 这是一款让您抓取任何网站并选择有用内容并将其批量交付给您。