Push-Pull
Discover the Push-Pull integration method for the Oxylabs Web Scraper API. Submit a job, then poll the results endpoint later using JSON-formatted data.
Job Único
Endpoint
POST https://data.oxylabs.io/v1/queriesEntrada
curl --user "user:pass1" \
'https://data.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "ENTER_SOURCE_HERE", "url": "https://www.example.com", "geo_location": "United States", "callback_url": "https://your.callback.url", "storage_type": "s3", "storage_url": "s3://your.storage.bucket.url"}'import requests
from pprint import pprint
# Estruturar payload.
payload = {
"source": "ENTER_SOURCE_HERE", # Fonte que você escolhe, por exemplo "universal"
"url": "https://www.example.com", # Verifique na fonte específica se você deve usar "url" ou "query"
"geo_location": "United States", # Algumas fontes aceitam CEP ou coordenadas
#"render" : "html", # Descomente se quiser renderizar JavaScript dentro da página
#"render" : "png", # Descomente se quiser capturar uma screenshot de uma página raspada
#"parse" : true, # Verifique quais fontes suportam dados parseados
#"callback_url": "https://your.callback.url", #obrigatório se estiver usando listener de callback
"callback_url": "https://your.callback.url",
"storage_type": "s3",
"storage_url": "s3://your.storage.bucket.url"
}
# Obter resposta.
response = requests.request(
'POST',
'https://data.oxylabs.io/v1/queries',
auth=('YOUR_USERNAME', 'YOUR_PASSWORD'), #Suas credenciais vão aqui
json=payload,
)
# Imprimir a resposta formatada no stdout.
pprint(response.json())Saída
Dicionário de dados
Chave
Descrição
Tipo
Callback
Entrada
Saída
Verificar Status do Job
Endpoint
Entrada
Saída
Valores de status
Parâmetro
Descrição
Recuperar Conteúdo do Job
Endpoints
Entrada
Saída
Parâmetro render
Parâmetro parse
Parâmetro XHR
Saída padrão
Saída disponível
Consulta em Lote
Endpoint
Entrada
Saída
Obter lista de endereços IP do Notifier
Endpoint
Entrada
Saída
Agendador
SchedulerAtualizado
Isto foi útil?

