Renderização de JavaScript

Aprenda a usar um parâmetro render na Web Scraper API para que você possa raspar páginas dinâmicas de forma eficiente.

Se a página que você deseja rastrear requer JavaScript para carregar dinamicamente todos os dados necessários no DOM, você pode incluir um render parâmetro em suas requisições em vez de configurar e usar manualmente um navegador headless. Requisições com este parâmetro serão totalmente renderizadas, e os dados serão armazenados em um arquivo HTML ou em uma captura de tela PNG, dependendo do parâmetro especificado.

HTML

Defina o render parâmetro para html para obter a saída bruta da página renderizada.

PNG (Captura de tela)

Defina o render parâmetro para png para obter uma captura de tela codificada em Base64 da página renderizada.

circle-info

Se você quiser rastrear uma imagem e baixá-la, consulte esta seção.

Exemplo de requisição

curl --user "user:pass" \
'https://realtime.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "universal", "url": "https://www.example.com", "render": "html"}'
circle-exclamation
circle-exclamation

Forçando renderização em páginas específicas

Para um rastreamento bem-sucedido, alguns tipos de páginas de domínios específicos exigem renderização devido ao seu conteúdo dinâmico. Nosso sistema aplica automaticamente a renderização para essas páginas, mesmo que não seja explicitamente definida pelo usuário.

circle-exclamation

Queremos que nossos usuários estejam plenamente cientes disso ao rastrear as seguintes páginas:

Essa abordagem fornece a melhor experiência possível de rastreamento, garantindo precisão e confiabilidade dos dados dessas páginas desafiadoras.

Se você desejar desativar a renderização, pode fazê-lo adicionando o seguinte parâmetro às suas requisições:

Instruções do navegador

Com nosso Headless Browser você também pode executar várias instruções do navegador como clicar, rolar, inserir, aguardar e mais. Leia mais:

Instruções do navegadorchevron-right

Atualizado

Isto foi útil?