将 WebHarvy 网页爬虫与 Oxylabs 住宅代理 集成。包含代理配置和身份验证的分步设置指南。
WebHarvy 是一款网页抓取工具,可从网页中提取文本、HTML 和图片。该工具支持登录、表单提交、导航、分页、定时抓取,并支持代理。
集成 Oxylabs 住宅代理 与 WebHarvy 时,请按照以下步骤操作:
步骤 1。 下载 并安装 WebHarvy 应用。
步骤 2。 设置完成后,导航到 设置。
步骤 3。 点击 代理设置。选择 通过代理服务器启用网络连接 并选择 HTTP 作为你的 类型.
HTTP
步骤 4。 填写详细信息:
地址:pr.oxylabs.io
pr.oxylabs.io
端口: 7777
7777
你也可以使用随机或粘性国家/地区特定条目。例如,如果你输入 us-pr.oxylabs.io 在 地址 并 10000 在 端口下,你将获得一个美国出口节点。如果你输入 10001 在 端口,你将获得带有粘性会话的美国出口节点。你可以在 这里 找到完整的国家/地区特定随机代理入口节点列表,以及粘性代理入口节点列表 - 这里.
us-pr.oxylabs.io
10000
10001
步骤 5。 选择 需要身份验证 以输入你的 Oxylabs 代理 用户名 并 密码。点击 + 按钮将你的新代理添加到列表中。
步骤 6。 点击 应用 以完成你的 WebHarvy 代理集成。
就是这样。现在你可以浏览互联网,并标记要抓取的特定行。通过点击 开始, 你可以开始选择目标数据。
查找原始 WebHarvy 集成博客文章 这里.
这有帮助吗?