Predefinições de parser
Descubra como as predefinições de parser funcionam e como usá‑las em seus jobs de scraping.
Você pode salvar, reutilizar, e modificar instruções de parsing personalizadas por meio da Web Scraper API. Depois de criar um preset de parser, nós o hospedaremos em nosso sistema, permitindo que você o referencie em seus trabalhos de scraping através do parser_preset parâmetro no payload.
Este recurso oferece várias capacidades principais:
Salve e gerencie seus próprios parsers em nosso sistema
Reutilize presets facilmente em múltiplos trabalhos de scraping
Crie, recupere, atualize, exclua e liste todos os presets
Acesse estatísticas de desempenho e uso de um preset
Adapte-se a sites em mudança usando presets com autocorreção
Referência da API
Endpoint: https://data.oxylabs.io/v1/parsers/presets
A tabela lista cada operação disponível e seu caminho de endpoint:
Criar um preset
POST
/v1/parsers/presets
Recuperar um preset
GET
/v1/parsers/presets/{preset_name}
Atualizar um preset
PUT
/v1/parsers/presets/{preset_name}
Excluir um preset
DELETE
/v1/parsers/presets/{preset_name}
Listar todos presets
GET
/v1/parsers/presets
Ver uso e desempenho estatísticas
GET
/v1/parsers/presets/{preset_name}/stats
Acompanhar alterações de autocorreção
GET
/v1/parsers/presets/{parser_name}/changelog
Habilitar autocorreção
Os presets de parser vêm equipados com a função de autocorreção, que ajuda a manter os parsers e suas taxas de sucesso conforme os sites mudam. Quando ativada, os presets de parser se repararem automaticamente e ajustarem as instruções de parsing em segundo plano sem necessidade de intervenção manual adicional.
Para habilitar a autocorreção para seu preset de parser personalizado, inclua os seguintes parâmetros obrigatórios ao criar ou atualizar um preset:
self_heal
Ativa a funcionalidade de autocorreção quando definido como True.
prompt_schema
Um schema JSON descrevendo a saída requerida do parser. Você pode criar o schema automaticamente ao gerar parsers com a API.
urls
Uma lista de até 5 URLs do mesmo tipo de página. Recomendamos fornecer de 3 a 5 URLs para ajudar o parser a se adaptar a diferentes layouts e melhorar a precisão do parsing.
Exemplos de uso
Criar um preset
Endpoint: POST https://data.oxylabs.io/v1/parsers/presets
Payload:
Usar um preset
Endpoint: POST https://realtime.oxylabs.io/v1/queries
Payload:
Recuperar um preset
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Atualizar um preset
Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Defina os campos do preset que você quer atualizar. No exemplo a seguir, apenas o parsing_instructions será atualizado.
Payload:
Excluir um preset
Endpoint: DELETE https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Listar todos os presets
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets
Ver estatísticas
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/stats
Você pode filtrar resultados por data e hora usando os date_from e/ou date_to parâmetros de URL. Use o formato YYYY-MM-DDTHH, onde T indica o horário, e HH é a hora em formato 24 horas.
Por exemplo, para obter estatísticas das 9h às 14h em 5 de agosto de 2025:
Acompanhar alterações de autocorreção
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/changelog
Nosso sistema registra automaticamente a atividade de autocorreção. Você pode acessar esse registro histórico para revisar todas as modificações feitas pela função de autocorreção.
Atualizado
Isto foi útil?

