Documentation has been updated: see help center and changelog in one place.

WebHarvy

Integra el scraper WebHarvy con los Residential Proxies de Oxylabs. Guía de configuración paso a paso para la configuración de proxy y autenticación.

WebHarvy es una herramienta de web scraping que extrae texto, HTML e imágenes de páginas web. La herramienta gestiona inicios de sesión, envíos de formularios, navegación, paginación, scraping programado y soporta proxies.

Para integrar Oxylabs Residential Proxies con WebHarvy, sigue los pasos a continuación:

Paso 1. Descargar e instala la aplicación WebHarvy.

Paso 2. Una vez configurado, navega a Ajustes.

settings

Paso 3. Haz clic en Proxy Settings. Selecciona Enable network connection via Proxy Server y elige HTTP como tu Type.

Proxy settings

Paso 4. Rellena los detalles:

Dirección:pr.oxylabs.io

Puerto: 7777

También puedes usar entradas aleatorias o sticky específicas por país. Por ejemplo, si introduces us-pr.oxylabs.io bajo Dirección y 10000 bajo Puerto, obtendrás un nodo de salida en EE. UU. Si introduces 10001 bajo Puerto, recibirás el nodo de salida de EE. UU. con una sesión sticky. Puedes encontrar una lista completa de nodos de entrada aleatorios específicos por país aquí y una lista de nodos de entrada sticky - aquí.

Paso 5. Selecciona Requires Authentication para ingresar tu proxy de Oxylabs Nombre de usuario y Contraseña. Haz clic en el botón + para agregar tu nuevo proxy a la lista.

Paso 6. Pulsa Apply para finalizar la integración del proxy en WebHarvy.

Add proxy

Eso es todo. Ahora puedes navegar por Internet y marcar las filas específicas para extraer. Al hacer clic en Start, puedes comenzar a seleccionar los datos objetivo.

Encuentra la publicación original del blog de integración de WebHarvy aquí.

Última actualización

¿Te fue útil?