For the complete documentation index, see llms.txt. This page is also available as Markdown.

LangChain

Use o framework LangChain junto com a Oxylabs Web Scraper API para extrair dados da web e alimentá-los em fluxos de trabalho de LLM — colete, processe e analise em um único pipeline.

A LangChain integração com a Oxylabs Web Scraper API permite coletar e processar dados da web por meio de um LLM (Large Language Model) no mesmo fluxo de trabalho.

Visão geral

LangChain é um framework para criar apps que usam LLMs junto com ferramentas, APIs e dados da web. Ele oferece suporte a Python e JavaScript. Use-o com Oxylabs Web Scraper API para:

  • Extrair dados estruturados sem lidar com CAPTCHAs, bloqueios de IP ou renderização de JS

  • Processar resultados com um LLM no mesmo pipeline

  • Criar fluxos de trabalho de ponta a ponta, da extração à saída com IA

Primeiros passos

Crie suas credenciais de usuário da API: cadastre-se para uma avaliação gratuita ou compre o produto no painel da Oxylabs para criar suas credenciais de usuário da API (USERNAME e PASSWORD).

Neste guia, usaremos a linguagem de programação Python. Instale as bibliotecas necessárias usando pip:

pip install -qU langchain-oxylabs langchain-openai langgraph requests python-dotenv

Configuração do ambiente

Crie um arquivo .env no diretório do seu projeto com seu usuário da API da Oxylabs e suas credenciais da OpenAI:

OXYLABS_USERNAME=seu-usuario
OXYLABS_PASSWORD=sua-senha
OPENAI_API_KEY=sua-chave-openai

Carregue essas variáveis de ambiente no seu script Python:

Métodos de integração

Há duas formas principais de integrar a Oxylabs Web Scraper API com o LangChain:

Usando o pacote langchain-oxylabs

Para consultas de pesquisa do Google, use o pacote dedicado langchain-oxylabs , que oferece uma integração pronta para uso:

Usando a Web Scraper API

Para acessar outros sites além da pesquisa do Google, você pode enviar uma solicitação diretamente para a Web Scraper API:

Scrapers específicos por destino

A Oxylabs fornece scrapers especializados para vários sites populares. Aqui estão alguns exemplos de fontes disponíveis:

Site
Parâmetro de source
Parâmetros necessários

Google

google_search

query

Amazon

amazon_search

query, domain (opcional)

Walmart

walmart_search

query

Target

target_search

query

Kroger

kroger_search

query, store_id

Staples

staples_search

query

Para usar um scraper específico, modifique o payload na função scrape_website :

Configuração avançada

Tratamento de conteúdo dinâmico

A Web Scraper API pode lidar com renderização de JavaScript adicionando o parâmetro render :

Definindo o tipo de user agent

Você pode especificar diferentes user agents para simular diferentes dispositivos:

Usando parâmetros específicos do destino

Muitos scrapers específicos por destino aceitam parâmetros adicionais:

Tratamento de erros

Implemente um tratamento de erros adequado para aplicações de produção:

Atualizado

Isto foi útil?