Helium Scraper
Last updated
Last updated
Helium 爬虫是一款数据提取工具。它允许您使用代理来抓取公共数据,以避免各种限制,例如 CAPTCHA 和 IP 被阻止。Helium 的基础架构提供无限的可扩展性、提取、自定义场景并支持多种导出格式。
要将 Oxylabs Proxies 集成到 Helium 爬虫,请按照以下步骤操作:
首先,通过 heliumscraper.com 下载并安装 Helium 爬虫。
启动 Helium 爬虫并选择 文件 (File) > 代理列表 (Proxy list)。
填写所需凭证。在 Address(地址)下,输入 pr.oxylabs.io
,并在 Port(端口)类型下输入 7777
。此外,您还可以使用特定国家/地区的入口。例如,如果您在 Address 下填入 us-pr.oxylabs.io
,在Port 下填入 10001
,您将获得一个带有粘性会话的美国出口节点 ( 有关特定国家/地区的条目说明的完整列表,请参阅本节。输入您的 Oxylabs 子用户 Username 和 Password。按下 OK(确定)。
要为 Helium 爬虫启用代理,请按照以下步骤操作:
打开您正在处理的 Helium 爬虫项目并导航到 项目 (Project) > 设置 (Settings)。每次开始一个新项目时,请执行此步骤和以下步骤。
将 Enable Proxies 更改为 True 并单击 OK(确定)。
最后,要核实代理是否集成到 Helium 爬虫,请访问一个使用 Helium 主浏览器显示 IP 地址的网站。确认 IP 地址确实已更改。设置完成。您已成功将您的住宅代理集成到 Helium。