Proxy Endpoint
Envía y recibe datos a través del Proxy Endpoint de la Oxylabs Web Scraper API. Accede a páginas objetivo directamente mediante una integración simple basada en URL.
Si alguna vez ha utilizado proxies regulares para scraping de datos, integrar el método de entrega Proxy Endpoint será muy sencillo. Todo lo que necesita hacer es usar nuestro nodo de entrada como proxy, autorizarse con las credenciales de Scraper API y ignorar certificados. En cURL, es -k o --insecure. Sus datos le llegarán en una conexión abierta.
Proxy Endpoint solo funciona con las fuentes de datos basadas en URL, donde se proporciona la URL completa. Por lo tanto, solo acepta un puñado de parámetros adicionales de trabajo, que debén enviarse como encabezados.
El producto no está diseñado para usarse directamente con navegadores sin cabeza (por ejemplo, Chromium, PhantomJS, Splash, etc.) ni con sus controladores (por ejemplo, Playwright, Selenium, Puppeteer, etc.).
Endpoint
GET realtime.oxylabs.io:60000Entrada
Vea un ejemplo de solicitud a continuación.
curl -k -x https://realtime.oxylabs.io:60000 \
-U 'USERNAME:PASSWORD' \
-H 'x-oxylabs-user-agent-type: desktop_chrome' \
-H 'x-oxylabs-geo-location: Germany' \
'https://www.example.com'import requests
from pprint import pprint
# Use sus credenciales de SERP API aquí.
USERNAME, PASSWORD = 'YOUR_USERNAME', 'YOUR_PASSWORD'
# Definir diccionario de proxy.
proxies = {
'http': f'http://{USERNAME}:{PASSWORD}@realtime.oxylabs.io:60000',
'https': f'https://{USERNAME}:{PASSWORD}@realtime.oxylabs.io:60000'
}
# Para establecer una geo-ubicación específica, user-agent o para renderizar Javascript
# es necesario enviar parámetros como encabezados de la solicitud.
headers = {
'x-oxylabs-user-agent-type': 'desktop_chrome',
'x-oxylabs-geo-location': 'Germany',
#'X-Oxylabs-Render': 'html', # Descomente si desea renderizar JavaScript dentro de la página.
}
response = requests.request(
'GET',
'https://www.example.com',
headers = headers, # Pase los encabezados definidos.
verify=False, # Acepte nuestro certificado.
proxies=proxies,
)
# Imprimir la página de resultado en stdout.
pprint(response.text)
# Guardar el HTML devuelto en el archivo 'result.html'.
with open('result.html', 'w') as f:
f.write(response.text)Salida
A continuación encontrará una respuesta de ejemplo de https://example.com:
Parámetros aceptados
Al realizar su solicitud, junto con la URL, puede enviarnos algunos parámetros de trabajo que utilizaremos al ejecutar su tarea. Los parámetros de trabajo deben enviarse en los encabezados de su solicitud: vea un ejemplo aquí.
Aquí está la lista de parámetros de trabajo que puede enviar con solicitudes a Proxy Endpoint:
x-oxylabs-user-agent-type
No existe una forma de indicar un User-Agent específico, pero puede informarnos qué tipo de user-agent le gustaría que usemos. Una lista de tipos de User-Agent compatibles se puede encontrar aquí.
x-oxylabs-geo-location
En algunos casos, es posible que deba indicar la ubicación geográfica para la que se debe adaptar el resultado. Este parámetro corresponde al geo_location parámetro, descrito por separado en la documentación a nivel de fuente. Los valores aceptados dependen de la URL que desea que raspemos. Lea más aquí.
x-oxylabs-render
Ejecución de JavaScript. Lea más aquí.
Última actualización
¿Te fue útil?

