Predefinições de Parser

Descubra como funcionam os presets de parser e como usá-los nos seus jobs de raspagem.

Você pode salvar, reutilizar, e modificar instruções de parsing personalizadas por meio da Web Scraper API. Depois que você criar um preset de parser, nós o hospedaremos em nosso sistema, permitindo que você o referencie em seus jobs de scraping via o parser_preset parâmetro no payload.

Este recurso oferece várias funcionalidades principais:

  • Salve e gerencie seus próprios parsers em nosso sistema

  • Reutilize facilmente presets em vários jobs de scraping

  • Crie, recupere, atualize, exclua e liste todos os presets

  • Acesse estatísticas de desempenho e uso de um preset

  • Adapte-se a sites em mudança usando presets autossustentáveis

Referência da API

Endpoint: https://data.oxylabs.io/v1/parsers/presets

A tabela lista cada operação disponível e o caminho do endpoint correspondente:

A ação
Método da solicitação
Caminho

Criar um preset

POST

/v1/parsers/presets

Recuperar um preset

GET

/v1/parsers/presets/{preset_name}

Atualizar um preset

PUT

/v1/parsers/presets/{preset_name}

Excluir um preset

DELETE

/v1/parsers/presets/{preset_name}

Listar todos presets

GET

/v1/parsers/presets

Ver uso e desempenho estatísticas

GET

/v1/parsers/presets/{preset_name}/stats

Rastrear autossustentação alterações

GET

/v1/parsers/presets/{parser_name}/changelog

Ativar autossustentação

Os presets de parser são equipados com a função de autossustentação, que ajuda a manter os parsers e suas taxas de sucesso à medida que os sites mudam. Quando ativados, os presets de parser se reparam automaticamente e ajustam as instruções de parsing em segundo plano, sem entrada manual adicional.

Para ativar autossustentação para o seu preset de parser personalizado, inclua os seguintes parâmetros obrigatórios ao criar ou atualizar um preset:

Parâmetro
Descrição

self_heal

Ativa a funcionalidade de autossustentação quando definido como True.

prompt_schema

Um esquema JSON que descreve a saída necessária do parser. Você pode criar o esquema automaticamente ao gerar parsers com a API.

urls

Uma lista de até 5 URLs do mesmo tipo de página. Recomendamos fornecer de 3 a 5 URLs para ajudar o parser a se adaptar a diferentes layouts e melhorar a precisão do parsing.

Exemplo de payload

O exemplo de payload mostrado aqui ativa a autossustentação ao atualizar um preset existente.

Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Exemplos de uso

Criar um preset

Endpoint: POST https://data.oxylabs.io/v1/parsers/presets

Payload:

Saída

Usar um preset

Endpoint: POST https://realtime.oxylabs.io/v1/queries

Payload:

Saída

Recuperar um preset

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Saída

Atualizar um preset

Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Defina os campos do preset que você quer atualizar. No exemplo a seguir, apenas o parsing_instructions será atualizado.

Payload:

Saída

Excluir um preset

Endpoint: DELETE https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Listar todos os presets

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets

Saída

Ver estatísticas

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/stats

Saída

Você pode filtrar resultados por data e hora usando os parâmetros de URL date_from e/ou date_to . Use o formato YYYY-MM-DDTHH, em que T indica o horário, e HH é a hora em formato de 24 horas.

Por exemplo, para obter estatísticas das 9h às 14h em 5 de agosto de 2025:

Rastrear alterações de autossustentação

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/changelog

Nosso sistema registra automaticamente a atividade de autossustentação. Você pode acessar esse registro histórico para revisar todas as modificações feitas pela função de autossustentação.

Atualizado

Isto foi útil?