Gerando instruções de parsing via API

Veja como você pode gerar parsers automaticamente enviando solicitações para a API.

Você pode gerar conjuntos de instruções de parsing via API fornecendo URLs e descrevendo quais pontos de dados você gostaria de fazer parse. Ao receber as instruções de parsing geradas, você pode salvá-las como um preset do parser ou simplesmente enviar as instruções com sua solicitação de scraping.

Você também pode gerar instruções de parsing via OxyCopilot em nosso Playground do Web Scraper API.

Gerar instruções a partir de prompt

Você pode gerar instruções de parsing inserindo uma descrição em texto livre dos pontos de dados que você gostaria de fazer parse e nos fornecendo algumas URLs que pertençam ao mesmo tipo de página. A API responderá com um conjunto de instruções de parsing.

  • Endpoint: https://data.oxylabs.io/v1/parsers/generate-instructions/prompt

  • Método: POST

  • Autenticação: Básico

  • Cabeçalhos da solicitação: Content-Type: application/json

Payload de exemplo

{ 
  "prompt_text": "Faça o parse do título do produto, preço principal, nome do desenvolvedor e nome da plataforma.",
  "urls": [
    "https://sandbox.oxylabs.io/products/1",
    "https://sandbox.oxylabs.io/products/2",
    "https://sandbox.oxylabs.io/products/4"
  ],
  "render": false
}
Parâmetro
Descrição

prompt_text

Descrição em texto livre dos pontos de dados a serem extraídos.

urls

Lista de URLs que exemplificam o tipo de página para o qual você gostaria de obter instruções de parsing. Recomendamos fornecer de 3 a 5 URLs para ajudar o parser a se adaptar a diferentes layouts e melhorar a precisão do parsing.

render

Se a renderização de JS deve ou não ser usada para buscar o conteúdo necessário.

- parâmetro obrigatório

Resposta de exemplo

Gerar instruções a partir de schema JSON

Há casos em que você quer obter dados extraídos em um schema JSON específico. Você pode usar este endpoint para obter instruções de parsing que sigam estritamente o schema que você fornecer.

  • Endpoint: https://data.oxylabs.io/v1/parsers/generate-instructions/schema

  • Método: POST

  • Autenticação: Básico

  • Cabeçalhos da solicitação: Content-Type: application/json

Payload de exemplo

Parâmetro
Descrição

prompt_schema

schema JSON descrevendo a saída necessária do parser.

urls

Lista de URLs que exemplificam o tipo de página para o qual você gostaria de obter instruções de parsing.

render

Se a renderização de JS deve ou não ser usada para buscar o conteúdo necessário.

- parâmetro obrigatório

Resposta de exemplo

Atualizado

Isto foi útil?