Proxy Endpoint
Envie e receba dados via Proxy Endpoint da Oxylabs Web Scraper API. Acesse páginas-alvo diretamente por meio de uma integração simples baseada em URL.
Se você já usou proxies regulares para raspagem de dados, integrar o método de entrega Proxy Endpoint será muito fácil. Tudo o que você precisa fazer é usar nosso nó de entrada como proxy, autorizar com as credenciais do Scraper API e ignorar certificados. Em cURL, é -k ou --insecure. Seus dados chegarão até você em uma conexão aberta.
Proxy Endpoint funciona apenas com as fontes de dados baseadas em URL, onde a URL completa é fornecida. Portanto, ele aceita apenas um pequeno conjunto de parâmetros de trabalho adicionais, que devem ser enviados como cabeçalhos.
O produto não foi projetado para ser usado diretamente com navegadores headless (por exemplo, Chromium, PhantomJS, Splash etc.) e seus drivers (por exemplo, Playwright, Selenium, Puppeteer etc.).
Endpoint
GET realtime.oxylabs.io:60000Entrada
Veja um exemplo de requisição abaixo.
curl -k -x https://realtime.oxylabs.io:60000 \
-U 'USERNAME:PASSWORD' \
-H 'x-oxylabs-user-agent-type: desktop_chrome' \
-H 'x-oxylabs-geo-location: Germany' \
'https://www.example.com'import requests
from pprint import pprint
# Use suas credenciais da SERP API aqui.
USERNAME, PASSWORD = 'YOUR_USERNAME', 'YOUR_PASSWORD'
# Defina o dicionário de proxy.
proxies = {
'http': f'http://{USERNAME}:{PASSWORD}@realtime.oxylabs.io:60000',
'https': f'https://{USERNAME}:{PASSWORD}@realtime.oxylabs.io:60000'
}
# Para definir uma geo-localização específica, user-agent ou para renderizar Javascript
# é necessário enviar parâmetros como cabeçalhos da requisição.
headers = {
'x-oxylabs-user-agent-type': 'desktop_chrome',
'x-oxylabs-geo-location': 'Germany',
#'X-Oxylabs-Render': 'html', # Descomente se quiser renderizar JavaScript na página.
}
response = requests.request(
'GET',
'https://www.example.com',
headers = headers, # Passe os cabeçalhos definidos.
verify=False, # Aceite nosso certificado.
proxies=proxies,
)
# Imprima a página resultante no stdout.
pprint(response.text)
# Salve o HTML retornado no arquivo 'result.html'.
with open('result.html', 'w') as f:
f.write(response.text)Saída
Abaixo você encontrará uma resposta de exemplo de https://example.com:
Parâmetros aceitos
Ao fazer sua requisição, junto com a URL, você pode nos enviar alguns parâmetros de trabalho que usaremos ao executar seu job. Os parâmetros do job devem ser enviados nos cabeçalhos da sua requisição - veja um exemplo aqui.
Aqui está a lista de parâmetros de job que você pode enviar com requisições do Proxy Endpoint:
x-oxylabs-user-agent-type
Não há como indicar um User-Agent específico, mas você pode nos informar qual tipo de user-agent gostaria que usássemos. Uma lista dos tipos de User-Agent suportados pode ser encontrada aqui.
x-oxylabs-geo-location
Em alguns casos, pode ser necessário indicar a localização geográfica para a qual o resultado deve ser adaptado. Este parâmetro corresponde ao geo_location parâmetro, descrito separadamente na documentação a nível de fonte. Os valores aceitos dependem da URL que você deseja que raspemos. Leia mais aqui.
x-oxylabs-render
Execução de JavaScript. Leia mais aqui.
Atualizado
Isto foi útil?

