Realtime

Integração Realtime para a Web Scraper API da Oxylabs. Mantenha a conexão HTTPS aberta desde o envio do job até a devolução dos resultados ou de um erro, usando payloads em formato JSON.

Realtime é um método de integração síncrono. Ele é usado para lidar com tarefas de extração de dados em grande escala de forma confiável, sem exigir que você gerencie a distribuição de requisições ou a infraestrutura. Ele requer manter a conexão aberta até que a tarefa seja concluída com sucesso ou retorne um erro.

Envio da tarefa

Endpoint

O endpoint da Realtime API para envio de tarefas é:

POST https://realtime.oxylabs.io/v1/queries

Entrada

Forneça os parâmetros do job em um payload JSON como mostrado nos exemplos abaixo. Os exemplos em Python e PHP incluem comentários para maior clareza.

curl --user "USERNAME:PASSWORD" \\
'https://realtime.oxylabs.io/v1/queries' \\
-H "Content-Type: application/json" \
-d '{"source": "universal", "url": "https://example.com", "geo_location": "United States"}'

Saída

A Realtime API oferece estes tipos de resultado na saída:

  • HTML: O conteúdo HTML bruto extraído da página da web de destino;

  • JSON: Dados estruturados analisados a partir do conteúdo HTML, formatados em JSON;

  • PNG: Captura de tela em Base64 da página renderizada no formato PNG.

  • XHR: Requisições XHR feitas أثناء carregar a página.

  • Markdown: Markdown de uma página da web.

Você também pode recuperar vários tipos de resultado em uma única resposta da API.

Esta tabela explica o tipo de resultado padrão e outros tipos disponíveis com base nos parâmetros incluídos no payload da requisição da API:

Parâmetro de renderização
Parâmetro de parse
Saída padrão
Saída disponível

-

-

html

html

html

-

html

html

png

-

png

html, png

-

true

json

html, json

html

true

json

html, json

png

true

png

html, json, png

A Realtime API sempre retorna a saída padrão. Para obter outras saídas disponíveis, use o método de integração {Push-Pull}.

Exemplo de saída:

Atualizado

Isto foi útil?