For the complete documentation index, see llms.txt. This page is also available as Markdown.

Optimización del tráfico

Aprende sobre estrategias clave para optimizar el tráfico de Headless Browser al usar Playwright y Puppeteer

Tus scripts de automatización suelen descargar recursos innecesarios, como imágenes, hojas de estilo, fuentes y otros archivos multimedia. Estos archivos consumen ancho de banda y pueden ralentizar tus operaciones de scraping.

Puedes bloquear por completo la carga de estos recursos innecesarios. Al interceptar las solicitudes de red y bloquear de forma selectiva los archivos multimedia, puedes centrarte solo en los datos que realmente necesitas.

Estos fragmentos de código funcionan con Playwright y Puppeteer para bloquear recursos multimedia antes de que se descarguen:

async def block_resources(route):
    request = route.request
    resource_type = request.resource_type
    if resource_type in ['image', 'stylesheet', 'media', 'font']:
        await route.abort()
    else:
        await route.continue_()
await page.route('**/*', block_resources)

¿Te fue útil?