AI-Scraper
Aprenda como obter dados web a partir de uma única URL para seus fluxos de trabalho de IA usando o AI Studio.
Visão geral
AI-Scraper é uma ferramenta de scraping que extrai dados de uma única página web. Ela identifica e analisa informações relevantes com base em um prompt em linguagem natural e então fornece os resultados em JSON (para automação e APIs) ou Markdown (formato (melhor para saídas legíveis e fluxos de trabalho de IA).)
Este scraper com IA elimina a necessidade de seletores CSS/XPath ou parsers personalizados, integrando-se perfeitamente a diversos pipelines de automação. Geração automática de esquema e formatos de saída flexíveis oferecem aos usuários uma maneira fácil de extrair dados limpos e estruturados sem precisar manter lógica de parsing.
Você pode pré-visualizar a ferramenta aqui e integrá-la aos seus fluxos de trabalho usando nossos SDKs Python/JavaScript, servidor MCP ou uma de nossas integrações de terceiros.
Principais recursos
Extração baseada em prompt de linguagem natural – Defina suas necessidades em inglês simples, e o agente de scraping recuperará as informações relevantes.
Múltiplos formatos de saída – Escolha JSON para fluxos de trabalho estruturados ou Markdown para resultados legíveis por humanos e fluxos de IA.
Geração automática de esquema – Gere um esquema automaticamente a partir de um prompt ou defina-o manualmente para parsing JSON preciso.
Funciona em qualquer página pública – Extraia de e-commerce, notícias, blogs ou qualquer outra fonte acessível.
Como funciona
Para raspar uma página com o AI-Scraper, siga estes passos:
Forneça a URL da página que você deseja raspar.
Descreva os dados a extrair em linguagem natural (ex.: “Obter todos os nomes de produtos e preços”).
Selecione o formato de saída – JSON estruturado ou Markdown.
(Opcional) Defina um esquema – Deixe o AI-Scraper gerar um automaticamente, ou forneça seu próprio esquema OpenAPI para a estrutura exata desejada.
Instalação
Para começar, certifique-se de ter acesso a uma chave de API do AI Studio (ou obter um teste gratuito com 1000 créditos) e Python v3.10 ou superior instalado. Você pode instalar o oxylabs-ai-studio pacote usando pip:
Exemplos de código (Python)
Os exemplos a seguir mostram como usar AiScraper para extrair dados de uma página de exemplo.
Saiba mais sobre AI-Scraper e o SDK Python do Oxylabs AI Studio em nosso repositório PyPI. Você também pode conferir nosso AI Studio JavaScript SDK guia para usuários JS.
Parâmetros da requisição
url*
URL alvo para raspar
–
output_format
Formato de saída (json, markdown)
markdown
schema
Esquema OpenAPI para extração estruturada (obrigatório para JSON)
–
render_javascript
Habilitar renderização de JavaScript
False
geo_location
Localização do proxy em formato ISO2
–
* – parâmetros obrigatórios
Amostras de saída
AI-Scraper pode retornar saída analisada e pronta para uso, fácil de integrar às suas aplicações.
Veja como é a saída JSON:
Alternativamente, você pode definir output_format para markdown para receber resultados formatados em Markdown em vez de JSON.
Casos de uso práticos
AI-Scraper pode ser aplicado a uma ampla variedade de tarefas de coleta de dados:
Extrair detalhes de produtos – Coletar nomes de produtos, descrições e preços de sites de e-commerce.
Analisar artigos de notícia – Recuperar títulos de artigos, datas, autores e o texto do corpo.
Raspar páginas de preços – Coletar informações de preços estruturadas para pesquisa de concorrência ou de mercado.
Extrair vagas de emprego – Capturar títulos de vagas, locais, salários e datas de publicação de portais de recrutamento.
Atualizado
Isto foi útil?

