LangChain
Usa el framework LangChain junto con la Web Scraper API de Oxylabs para extraer datos web e introducirlos en flujos de trabajo LLM: recopila, procesa y analiza en una sola canalización.
El LangChain integración con el Oxylabs Web Scraper API le permite recopilar y procesar datos web a través de un LLM (Large Language Model) en el mismo flujo de trabajo.
Resumen
LangChain es un marco para construir aplicaciones que usan LLMs junto con herramientas, APIs y datos web. Admite tanto Python como JavaScript. Úselo con Oxylabs Web Scraper API para:
Raspar datos estructurados sin manejar CAPTCHAs, bloqueos de IP o renderizado JS
Procesar resultados con un LLM en la misma canalización
Construir flujos de trabajo de extremo a extremo desde la extracción hasta la salida impulsada por IA
que quieras.
Primeros pasos: regístrate para una prueba gratuita o compra el producto en el : Regístrate para una prueba gratuita o compra el producto en el panel de Oxylabspara crear tus credenciales de usuario API ( y y).
PASSWORD Si necesitas más de un usuario API para tu cuenta, por favor contacta con nuestro soporte al cliente
En esta guía usaremos el lenguaje de programación Python. Instala las librerías requeridas usando pip:
pip install -qU langchain-oxylabs langchain-openai langgraph requests python-dotenvConfiguración del entorno
Crea un .env archivo en el directorio de su proyecto con su usuario de API de Oxylabs y credenciales de OpenAI:
OXYLABS_USERNAME=your-username
OXYLABS_PASSWORD=your-password
OPENAI_API_KEY=your-openai-keyCarga estas variables de entorno en tu script de Python:
Métodos de integración
Hay dos formas principales de integrar Oxylabs Web Scraper API con LangChain:
Usando el paquete langchain-oxylabs
Para consultas de búsqueda en Google, use el langchain-oxylabs paquete, que proporciona una integración lista para usar:
Usando la Web Scraper API
Para acceder a otros sitios web más allá de la búsqueda de Google, puede enviar directamente solicitudes a la Web Scraper API:
Rastreadores específicos por objetivo
Oxylabs proporciona rastreadores especializados para varios sitios web populares. Aquí hay algunos ejemplos de fuentes disponibles:
google_search
query
Amazon
amazon_search
query, dominio (opcional)
Walmart
walmart_search
query
Objetivo
target_search
query
Kroger
kroger_search
query, store_id
Staples
staples_search
query
Para usar un rastreador específico, modifique la carga útil en la scrape_website función:
Configuración avanzada
Manejo de contenido dinámico
La Web Scraper API puede manejar representación de JavaScript al agregar el user_agent_type parámetro:
Configuración del tipo de User-Agent
Puede especificar diferentes user agents para simular diferentes dispositivos:
Uso de parámetros específicos del objetivo
Muchos rastreadores específicos por objetivo admiten parámetros adicionales:
Manejo de errores
Implemente un manejo de errores adecuado para aplicaciones en producción:
Última actualización
¿Te fue útil?

