renderizado de JavaScript

Aprende sobre el encabezado que puedes incluir en tus solicitudes para obtener datos completamente renderizados, que puedes guardar en un archivo HTML o como una captura de pantalla PNG.

Si la página que deseas extraer requiere cargar JavaScript para cargar dinámicamente todos los datos necesarios en el DOM, en lugar de configurar y usar por tu cuenta un Headless Browser, puedes incluir el "X-Oxylabs-Render: html" encabezado en tus solicitudes. Todas las solicitudes con este encabezado incluido se renderizarán por completo, y todos los datos se almacenarán en un archivo HTML o en una captura de pantalla PNG (según el parámetro pasado).

La renderización de JavaScript tarda más en extraer la página. Al usar renderización de JavaScript, establece el valor del tiempo de espera del lado cliente en 180 segundos.

Este parámetro tiene dos valores disponibles:

  • html (HTML de una página renderizada)

  • png (bytes sin procesar que se pueden guardar como PNG)

Ejemplos de código

curl -k -v -x https://unblock.oxylabs.io:60000 \
-U 'USERNAME:PASSWORD' \
'https://ip.oxylabs.io/location' \
-H 'X-Oxylabs-Render: html'

Extracción del HTML de un sitio web

En este ejemplo, renderizaremos la página de inicio de YouTube y extraeremos el contenido de la página. Normalmente, la página de inicio de Youtube se vería así si se usa Web Unblocker sin renderización de Javascript:

Ejemplo de página de Youtube sin renderización de JavaScript

Añadir el "X-Oxylabs-Render: html" encabezado, como se muestra en los ejemplos de abajo, habilitará la renderización de Javascript y devolverá el HTML de una página renderizada:

El archivo HTML abierto en un navegador debería verse así:

Obtener una captura de pantalla de una página completamente renderizada

Para obtener una captura de pantalla en formato PNG en lugar del HTML de la página, es necesario proporcionar el "X-Oxylabs-Render: png" encabezado.

La respuesta contendrá bytes sin procesar de una imagen que se puede guardar en formato PNG y abrir como en el siguiente ejemplo:

Ejemplo de página de Youtube como captura de pantalla en formato PNG

Forzar el renderizado en páginas específicas

Para una extracción exitosa, algunos tipos de páginas de dominios específicos requieren renderizado debido a su contenido dinámico. Nuestro sistema aplica automáticamente el renderizado para estas páginas, incluso si el usuario no lo establece explícitamente.

Queremos que nuestros usuarios sean plenamente conscientes de esto al extraer las siguientes páginas:

Este enfoque ofrece la mejor experiencia posible de extracción, garantizando la precisión y fiabilidad de los datos de estas páginas exigentes.

Si deseas desactivar la renderización, envía el encabezado de renderización sin un valor

¿Te fue útil?