Gerando instruções de parsing via API

Veja como você pode gerar parsers automaticamente enviando solicitações para a API.

Você pode gerar conjuntos de instruções de parsing via API fornecendo URLs e descrevendo quais pontos de dados você gostaria de extrair. Ao receber as instruções de parsing geradas, você pode salvá-las como um preset de parser ou simplesmente enviar as instruções com sua requisição de scraping.

Você também pode gerar instruções de parsing via OxyCopilot no nosso Web Scraper API Playground.

Gerar instruções a partir de prompt

Você pode gerar instruções de parsing inserindo uma descrição em texto livre dos pontos de dados que deseja extrair e fornecendo algumas URLs que pertençam ao mesmo tipo de página. A API responderá com um conjunto de instruções de parsing.

  • Endpoint: https://data.oxylabs.io/v1/parsers/generate-instructions/prompt

  • Método: POST

  • Autenticação: Basic

  • Cabeçalhos da requisição: Content-Type: application/json

Payload de exemplo

{ 
  "prompt_text": "Parse title of the product, main price, developer name and platform name.",
  "urls": [
    "https://sandbox.oxylabs.io/products/1",
    "https://sandbox.oxylabs.io/products/2",
    "https://sandbox.oxylabs.io/products/4"
  ],
  "render": false
}
Parâmetro
Descrição

prompt_text

Descrição em texto livre dos pontos de dados a serem extraídos.

urls

Lista de URLs exemplificando o tipo de página para o qual você gostaria de obter instruções de parsing. Recomendamos fornecer 3-5 URLs para ajudar o parser a se adaptar a diferentes layouts e melhorar a precisão do parsing.

render

Indica se a renderização de JS deve ou não ser usada para buscar o conteúdo necessário.

- parâmetro obrigatório

Resposta de exemplo

Gerar instruções a partir de schema JSON

Existem casos em que você quer obter dados parseados em um schema JSON específico. Você pode usar este endpoint para obter instruções de parsing que aderem estritamente ao schema que você fornece.

  • Endpoint: https://data.oxylabs.io/v1/parsers/generate-instructions/schema

  • Método: POST

  • Autenticação: Basic

  • Cabeçalhos da requisição: Content-Type: application/json

Payload de exemplo

Parâmetro
Descrição

prompt_schema

Schema JSONarrow-up-right descrevendo a saída do parser requerida.

urls

Lista de URLs exemplificando o tipo de página para o qual você gostaria de obter instruções de parsing.

render

Indica se a renderização de JS deve ou não ser usada para buscar o conteúdo necessário.

- parâmetro obrigatório

Resposta de exemplo

Atualizado

Isto foi útil?