Gerando instruções de parsing via API

Veja como você pode gerar parsers automaticamente enviando requisições para a API.

Você pode gerar conjuntos de instruções de parsing via API fornecendo URLs e descrevendo quais pontos de dados você gostaria de extrair. Ao receber as instruções de parsing geradas, você pode salvá-las como um preset de parser ou simplesmente enviar as instruções junto com sua solicitação de scraping.

Você também pode gerar instruções de parsing via OxyCopilot no nosso Web Scraper API Playground.

Gerar instruções a partir do prompt

Você pode gerar instruções de parsing inserindo uma descrição em texto livre dos pontos de dados que gostaria de extrair e fornecendo algumas URLs que pertençam ao mesmo tipo de página. A API responderá com um conjunto de instruções de parsing.

  • Endpoint: https://data.oxylabs.io/v1/parsers/generate-instructions/prompt

  • Método: POST

  • Autenticação: Básico

  • Cabeçalhos da requisição: Content-Type: application/json

Exemplo de payload

{ 
  "prompt_text": "Parse title of the product, main price, developer name and platform name.",
  "urls": [
    "https://sandbox.oxylabs.io/products/1",
    "https://sandbox.oxylabs.io/products/2",
    "https://sandbox.oxylabs.io/products/4"
  ],
  "render": false
}
Parâmetro
Descrição

prompt_text

Descrição em texto livre dos pontos de dados a serem extraídos.

urls

Lista de URLs que exemplificam o tipo de página para o qual você gostaria de obter instruções de parsing. Recomendamos fornecer 3-5 URLs para ajudar o parser a se adaptar a diferentes layouts e melhorar a precisão do parsing.

render

Se a renderização de JS deve ou não ser usada para buscar o conteúdo requerido.

- parâmetro obrigatório

Resposta de exemplo

Gerar instruções a partir de um schema JSON

Existem casos em que você deseja obter dados extraídos em um schema JSON específico. Você pode usar este endpoint para obter instruções de parsing que adiram estritamente ao schema que você fornecer.

  • Endpoint: https://data.oxylabs.io/v1/parsers/generate-instructions/schema

  • Método: POST

  • Autenticação: Básico

  • Cabeçalhos da requisição: Content-Type: application/json

Exemplo de payload

Parâmetro
Descrição

prompt_schema

JSON schemaarrow-up-right descrevendo o output requerido do parser.

urls

Lista de URLs que exemplificam o tipo de página para o qual você gostaria de obter instruções de parsing.

render

Se a renderização de JS deve ou não ser usada para buscar o conteúdo requerido.

- parâmetro obrigatório

Resposta de exemplo

Atualizado

Isto foi útil?