Push-Pull
Descubra o método de integração Push-Pull para a Oxylabs Web Scraper API. Submeta um job e depois consulte o endpoint de resultados mais tarde usando dados formatados em JSON.
Job Único
Endpoint
POST https://data.oxylabs.io/v1/queriesEntrada
curl --user "user:pass1" \
'https://data.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "ENTER_SOURCE_HERE", "url": "https://www.example.com", "geo_location": "United States", "callback_url": "https://your.callback.url", "storage_type": "s3", "storage_url": "s3://your.storage.bucket.url"}'import requests
from pprint import pprint
# Estruturar payload.
payload = {
"source": "ENTER_SOURCE_HERE", # Fonte que você escolhe, por exemplo "universal"
"url": "https://www.example.com", # Verifique na fonte específica se você deve usar "url" ou "query"
"geo_location": "United States", # Algumas fontes aceitam CEP ou coordenadas
#"render" : "html", # Descomente se quiser renderizar JavaScript dentro da página
#"render" : "png", # Descomente se quiser capturar uma screenshot de uma página raspada
#"parse" : true, # Verifique quais fontes suportam dados parseados
#"callback_url": "https://your.callback.url", #obrigatório se estiver usando listener de callback
"callback_url": "https://your.callback.url",
"storage_type": "s3",
"storage_url": "s3://your.storage.bucket.url"
}
# Obter resposta.
response = requests.request(
'POST',
'https://data.oxylabs.io/v1/queries',
auth=('YOUR_USERNAME', 'YOUR_PASSWORD'), #Suas credenciais vão aqui
json=payload,
)
# Imprimir a resposta formatada no stdout.
pprint(response.json())Saída
Dicionário de dados
Chave
Descrição
Tipo
Callback
Entrada
Saída
Verificar Status do Job
Endpoint
Entrada
Saída
Valores de status
Parâmetro
Descrição
Recuperar Conteúdo do Job
Endpoints
Entrada
Saída
Parâmetro render
Parâmetro parse
Parâmetro XHR
Saída padrão
Saída disponível
Consulta em Lote
Endpoint
Entrada
Saída
Obter lista de endereços IP do Notifier
Endpoint
Entrada
Saída
Agendador
AgendadorAtualizado
Isto foi útil?

