documentação de Parser Presets
Saiba como os presets de parser funcionam e como usá-los em seus jobs de scraping.
Você pode salvar, reutilizar, e modificar instruções de parsing personalizadas por meio da Web Scraper API. Depois de criar um preset de parser, iremos hospedá-lo em nosso sistema, permitindo que você o referencie em seus jobs de scraping via o parser_preset parâmetro no payload.
Este recurso oferece várias capacidades principais:
Salve e gerencie seus próprios parsers em nosso sistema
Reutilize facilmente presets em múltiplos jobs de scraping
Crie, recupere, atualize, exclua e liste todos os presets
Acesse estatísticas de desempenho e uso de um preset
Adapte-se a sites em mudança usando presets com self-healing
Referência da API
Endpoint: https://data.oxylabs.io/v1/parsers/presets
A tabela lista cada operação disponível e seu caminho de endpoint:
Criar um preset
POST
/v1/parsers/presets
Recuperar um preset
GET
/v1/parsers/presets/{preset_name}
Atualizar um preset
PUT
/v1/parsers/presets/{preset_name}
Excluir um preset
DELETE
/v1/parsers/presets/{preset_name}
Listar todos presets
GET
/v1/parsers/presets
Ver uso e desempenho estatísticas
GET
/v1/parsers/presets/{preset_name}/stats
Acompanhar alterações de self-healing
GET
/v1/parsers/presets/{parser_name}/changelog
Habilitar self-healing
Presets de parser vêm com a função de self-healing, que ajuda a manter os parsers e suas taxas de sucesso conforme os sites mudam. Quando habilitado, os presets de parser se reparam automaticamente e ajustam as instruções de parsing em segundo plano sem necessidade de intervenção manual adicional.
Para habilitar o self-healing do seu preset de parser personalizado, inclua os seguintes parâmetros obrigatórios ao criar ou atualizar um preset:
self_heal
Ativa a funcionalidade de self-healing quando definido como True.
prompt_schema
Um esquema JSON descrevendo a saída de parser exigida. Você pode criar automaticamente o esquema ao gerar parsers com a API.
urls
Uma lista de até 5 URLs do mesmo tipo de página. Recomendamos fornecer 3-5 URLs para ajudar o parser a se adaptar a diferentes layouts e melhorar a precisão do parsing.
Exemplo de payload
O exemplo de payload mostrado aqui habilita o self-healing atualizando um preset existente.
Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Exemplos de uso
Criar um preset
Endpoint: POST https://data.oxylabs.io/v1/parsers/presets
Payload:
Usar um preset
Endpoint: POST https://realtime.oxylabs.io/v1/queries
Payload:
Recuperar um preset
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Atualizar um preset
Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Defina os campos do preset que você deseja atualizar. No exemplo a seguir, apenas o parsing_instructions será atualizado.
Payload:
Excluir um preset
Endpoint: DELETE https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Listar todos os presets
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets
Ver estatísticas
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/stats
Você pode filtrar resultados por data e hora usando os date_from e/ou date_to parâmetros de URL. Use o formato YYYY-MM-DDTHH, onde T indica o horário, e HH é a hora em formato de 24 horas.
Por exemplo, para obter estatísticas das 9h às 14h em 5 de agosto de 2025:
Acompanhar alterações de self-healing
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/changelog
Nosso sistema registra automaticamente a atividade de self-healing. Você pode acessar esse registro histórico para revisar todas as modificações feitas pela função de self-healing.
Atualizado
Isto foi útil?

