sparklesCustom Parser

Veja os passos para um início rápido com o Oxylabs Custom Parser.

Custom Parser é um recurso gratuito da Web Scraper API que permite criar lógica de parsing e processamento de dados que é executada em um resultado HTML bruto. Você pode gerar parsers automaticamente usando IA ou escrevê-los manualmente para cenários avançados.

Para instruções detalhadas e exemplos, consulte estas páginas:

flag-checkeredIntrodução brain-circuitGerando parsers via API layer-groupPredefinições de Parser

codeEscrevendo instruções manualmente list-ulLista de funções de parsing


Início rápido

1. Gere um parser

Recomendamos começar com nossa ferramenta com IA OxyCopilotarrow-up-right que permite gerar scrapers e parsers sem escrever código.

circle-check

Siga os passos mostrados no vídeo para gerar um parser:

Aqui estão os mesmos passos mostrados no vídeo:

  1. Insira o(s) URL(s) que você quer raspar e parsear

  2. Especifique quaisquer parâmetros como renderização JavaScript

  3. Escreva um prompt que descreva o que você quer parsear

  4. Execute o OxyCopilot

Quando estiver satisfeito com o parser gerado, carregue as instruções.

2. Salve o parser como uma predefinição

Você pode salvar facilmente seus parsers gerados através do OxyCopilot para uso posterior. Veja os passos abaixo:

  1. Atribua a predefinição a um usuário de API específico

  2. Clique Salvar

  3. Insira o nome da predefinição e a descrição (opcional)

Após salvar a predefinição, você pode usá-la em requisições de API.

3. Use o parser com requisições de API

Para usar sua predefinição com a Web Scraper API, envie um payload com o parser_preset parâmetro definido com o nome da sua predefinição. Nos exemplos de código abaixo, estamos reutilizando o example_parser preset criado nos passos anteriores.

chevron-rightExemplo de saídahashtag

Obtendo o conteúdo HTML de um job parseado

Você também pode recuperar o resultado HTML bruto adicionando ?type=raw ao final da URL de recuperação do resultado. Leia mais aqui.

Atualizado

Isto foi útil?