For the complete documentation index, see llms.txt. This page is also available as Markdown.

Custom Parser

Veja os passos para começar rapidamente com o Oxylabs Custom Parser.

Custom Parser é um recurso gratuito do Web Scraper API que permite que você crie lógica de parsing e processamento de dados que é executada em um resultado bruto de HTML. Você pode gerar parsers automaticamente usando IA ou escrevê-los manualmente para cenários avançados.

Para instruções detalhadas e exemplos, consulte estas páginas:

Começando Gerando parsers via API Predefinições de Parser

Escrevendo instruções manualmente Lista de funções de parsing


Início rápido

1. Gere um parser

Recomendamos começar com nossa ferramenta com IA OxyCopilot que permite gerar scrapers e parsers sem escrever nenhum código. /bu

Siga as etapas mostradas no vídeo para gerar um parser:

Aqui estão as mesmas etapas mostradas no vídeo:

  1. Insira a(s) URL(s) que você quer coletar e fazer parsing

  2. Especifique quaisquer parâmetros como renderização de JavaScript

  3. Escreva um prompt que descreva o que você quer fazer parsing

  4. Executar OxyCopilot

Quando estiver satisfeito com o parser gerado, carregue as instruções.

2. Salve o parser como uma predefinição

Você pode salvar facilmente os parsers gerados pelo OxyCopilot para uso posterior. Veja as etapas abaixo:

  1. Atribua a predefinição a um usuário específico da API

  2. Clique Salvar

  3. Digite o nome da predefinição e a descrição (opcional)

Depois de salvar a predefinição, você pode usá-la com requisições da API.

3. Use o parser com requisições da API

Para usar sua predefinição com o Web Scraper API, envie um payload com o parâmetro parser_preset definido como o nome da sua predefinição. Nos exemplos de código abaixo, estamos reutilizando a predefinição example_parser criada nas etapas anteriores.

Exemplo de saída

Obtendo o conteúdo HTML de um job analisado

Você também pode recuperar o resultado bruto em HTML adicionando ?type=raw ao final da URL de recuperação do resultado. Leia mais aqui.

Atualizado

Isto foi útil?