Oxylabs Documentation
中文
搜索
K

Helium Scraper

Helium 爬虫是一款数据提取工具。它允许您使用代理来抓取公共数据,以避免各种限制,例如 CAPTCHA 和 IP 被阻止。Helium 的基础架构提供无限的可扩展性、提取、自定义场景并支持多种导出格式。
要将 Oxylabs Proxies 集成到 Helium 爬虫,请按照以下步骤操作:
  • 首先,通过 heliumscraper.com 下载并安装 Helium 爬虫。
  • 启动 Helium 爬虫并选择 文件 (File) > 代理列表 (Proxy list)。
  • 填写所需凭证。在 Address(地址)下,输入 pr.oxylabs.io,并在 Port(端口)类型下输入 7777。此外,您还可以使用特定国家/地区的入口。例如,如果您在 Address 下填入 us-pr.oxylabs.io,在Port 下填入 10001,您将获得一个带有粘性会话的美国出口节点 ( 有关特定国家/地区的条目说明的完整列表,请参阅本节。输入您的 Oxylabs 子用户 UsernamePassword。按下 OK(确定)。
要为 Helium 爬虫启用代理,请按照以下步骤操作:
  • 打开您正在处理的 Helium 爬虫项目并导航到 项目 (Project) > 设置 (Settings)。每次开始一个新项目时,请执行此步骤和以下步骤。
  • Enable Proxies 更改为 True 并单击 OK(确定)
最后,要核实代理是否集成到 Helium 爬虫,请访问一个使用 Helium 主浏览器显示 IP 地址的网站。确认 IP 地址确实已更改。设置完成。您已成功将您的住宅代理集成到 Helium。