circle-check
Documentation has been updated: see help center and changelog in one place.

LangChain

Usa el framework LangChain junto con la Oxylabs Web Scraper API para extraer datos web y alimentarlos en flujos de trabajo LLM: recopila, procesa y analiza en una sola canalización.

El LangChain integración con el Oxylabs Web Scraper APIarrow-up-right te permite recopilar y procesar datos web a través de un LLM (Large Language Model) en el mismo flujo de trabajo.

Descripción general

LangChain es un framework para construir aplicaciones que usan LLMs junto con herramientas, APIs y datos web. Admite tanto Python como JavaScript. Úsalo con Oxylabs Web Scraper API arrow-up-rightpara:

  • Extraer datos estructurados sin manejar CAPTCHAs, bloqueos de IP o renderizado JS

  • Procesar resultados con un LLM en la misma canalización

  • Construir flujos de trabajo de extremo a extremo desde la extracción hasta la salida potenciada por IA

Comenzando

Crea tus credenciales de usuario de API: regístrate para una prueba gratuita o compra el producto en el panel de Oxylabsarrow-up-right para crear tus credenciales de usuario API (USERNAME y PASSWORD).

circle-exclamation

En esta guía usaremos el lenguaje de programación Python. Instala las bibliotecas requeridas usando pip:

pip install -qU langchain-oxylabs langchain-openai langgraph requests python-dotenv

Configuración del entorno

Crea un .env archivo en el directorio de tu proyecto con tu usuario de API de Oxylabs y las credenciales de OpenAI:

OXYLABS_USERNAME=tu-usuario
OXYLABS_PASSWORD=tu-contraseña
OPENAI_API_KEY=your-openai-key

Carga estas variables de entorno en tu script de Python:

Métodos de integración

Hay dos maneras principales de integrar Oxylabs Web Scraper API con LangChain:

Usando el paquete langchain-oxylabs

Para consultas de búsqueda en Google, usa el langchain-oxylabsarrow-up-right paquete, que proporciona una integración lista para usar:

Usando la Web Scraper API

Para acceder a otros sitios web más allá de la búsqueda de Google, puedes enviar directamente solicitudes a la Web Scraper API:

Raspadores específicos por objetivo

Oxylabs proporciona raspadores especializados para varios sitios web populares. Aquí hay algunos ejemplos de fuentes disponibles:

Sitio web
Parámetro de fuente
Parámetros requeridos

Google

google_search

query

Amazon

amazon_search

query, dominio (opcional)

Walmart

walmart_search

query

Target

target_search

query

Kroger

kroger_search

query, store_id

Staples

staples_search

query

Para usar un raspador específico, modifica el payload en la scrape_website función:

Configuración avanzada

Manejo de contenido dinámico

La Web Scraper API puede manejar renderizado de JavaScript al agregar el render parámetro:

Configurando el tipo de User-Agent

Puedes especificar diferentes agentes de usuario para simular diferentes dispositivos:

Uso de parámetros específicos del objetivo

Muchos raspadores específicos por objetivo soportan parámetros adicionales:

Manejo de errores

Implementa un manejo de errores adecuado para aplicaciones en producción:

Última actualización

¿Te fue útil?