入门
创建作业
要使用我们的爬虫API 开始抓取, 请遵循以下简单步骤:
- 选择您想在您所使用的爬虫API 下抓取的域名。 - 例如,如果您正在尝试使用我们的 SERP 爬虫 API, 您可以选择抓取 Google, 或任何其他搜索引擎。我们的 爬虫API 在菜单左侧。 
 
- 组建一个查询 并将其发送到我们的 API。 - 在您所选页面类型或域名下,您会发现不同编程语言的代码示例。使用它们来建立您的查询,并确保始终包括以下元素: 
 
重要事项:始终将所提供代码示例中的 USERNAME 和 PASSWORD 替换为您的 API 用户凭证。查看身份验证部分了解更多信息。
手动测试工具
如果您想在大规模使用 API 之前手动尝试一下,我们建议使用 Postman。在每个域下,您会发现其 Postman 集合,您可以将其导入 Postman 并立即开始抓取。这些集合包含各种来源和集成方法的请求模板。
有用链接
- 我们极力建议您访问我们的 API 参考部分以高效地使用和整合我们的爬虫API。您会发现关于整合方法、全局参数值、响应代码和用量统计的信息。 
- 随时可通过查询以下端点查看历史用量统计: - GET https://data.oxylabs.io/v2/stats。亦可返回月度或每日统计。请访问以下部分了解更多信息。
- 查看我们的Scraper API 任务管家功能。它可用于重复性的抓取和解析作业。 
- 测试一下爬虫 API 功能网络爬虫:这是一款让您抓取任何网站并选择有用内容并将其批量交付给您。 
- 利用无头浏览器高效抓取JavaScript密集型网站,实现执行各种浏览器指令,包括点击、滚动、输入、等待等。 
- 查阅 Oxylabs GitHub 获取关于如何使用最流行的编程语言(如 C#、Java、NodeJs、PHP、Python等)抓取网站、使用我们的工具、推行产品或整合产品的教程。 
Last updated
Was this helpful?

