documentação de Parser Presets

Saiba como os presets de parser funcionam e como usá-los em seus jobs de scraping.

Você pode salvar, reutilizar, e modificar instruções de parsing personalizadas por meio da Web Scraper API. Depois de criar um preset de parser, iremos hospedá-lo em nosso sistema, permitindo que você o referencie em seus jobs de scraping via o parser_preset parâmetro no payload.

Este recurso oferece várias capacidades principais:

  • Salve e gerencie seus próprios parsers em nosso sistema

  • Reutilize facilmente presets em múltiplos jobs de scraping

  • Crie, recupere, atualize, exclua e liste todos os presets

  • Acesse estatísticas de desempenho e uso de um preset

  • Adapte-se a sites em mudança usando presets com self-healing

Referência da API

Endpoint: https://data.oxylabs.io/v1/parsers/presets

A tabela lista cada operação disponível e seu caminho de endpoint:

Ação
Método de Requisição
Caminho

Criar um preset

POST

/v1/parsers/presets

Recuperar um preset

GET

/v1/parsers/presets/{preset_name}

Atualizar um preset

PUT

/v1/parsers/presets/{preset_name}

Excluir um preset

DELETE

/v1/parsers/presets/{preset_name}

Listar todos presets

GET

/v1/parsers/presets

Ver uso e desempenho estatísticas

GET

/v1/parsers/presets/{preset_name}/stats

Acompanhar alterações de self-healing

GET

/v1/parsers/presets/{parser_name}/changelog

Habilitar self-healing

Presets de parser vêm com a função de self-healing, que ajuda a manter os parsers e suas taxas de sucesso conforme os sites mudam. Quando habilitado, os presets de parser se reparam automaticamente e ajustam as instruções de parsing em segundo plano sem necessidade de intervenção manual adicional.

Para habilitar o self-healing do seu preset de parser personalizado, inclua os seguintes parâmetros obrigatórios ao criar ou atualizar um preset:

Parâmetro
Descrição

self_heal

Ativa a funcionalidade de self-healing quando definido como True.

prompt_schema

Um esquema JSON descrevendo a saída de parser exigida. Você pode criar automaticamente o esquema ao gerar parsers com a API.

urls

Uma lista de até 5 URLs do mesmo tipo de página. Recomendamos fornecer 3-5 URLs para ajudar o parser a se adaptar a diferentes layouts e melhorar a precisão do parsing.

chevron-rightExemplo de payloadhashtag

O exemplo de payload mostrado aqui habilita o self-healing atualizando um preset existente.

Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Exemplos de uso

Criar um preset

Endpoint: POST https://data.oxylabs.io/v1/parsers/presets

Payload:

chevron-rightSaídahashtag

Usar um preset

Endpoint: POST https://realtime.oxylabs.io/v1/queries

Payload:

chevron-rightSaídahashtag

Recuperar um preset

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}

chevron-rightSaídahashtag

Atualizar um preset

Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Defina os campos do preset que você deseja atualizar. No exemplo a seguir, apenas o parsing_instructions será atualizado.

Payload:

chevron-rightSaídahashtag

Excluir um preset

Endpoint: DELETE https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Listar todos os presets

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets

chevron-rightSaídahashtag

Ver estatísticas

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/stats

chevron-rightSaídahashtag

Você pode filtrar resultados por data e hora usando os date_from e/ou date_to parâmetros de URL. Use o formato YYYY-MM-DDTHH, onde T indica o horário, e HH é a hora em formato de 24 horas.

Por exemplo, para obter estatísticas das 9h às 14h em 5 de agosto de 2025:

Acompanhar alterações de self-healing

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/changelog

Nosso sistema registra automaticamente a atividade de self-healing. Você pode acessar esse registro histórico para revisar todas as modificações feitas pela função de self-healing.

Atualizado

Isto foi útil?