Instruções do navegador

Informações sobre como definir instruções do navegador ao usar a Web Scraper API para lidar com páginas dinâmicas complexas.

Você pode definir suas próprias instruções de navegador que são executadas ao renderizar JavaScript.

circle-check

Uso

Para usar instruções de navegador, forneça um conjunto de browser_instructions ao criar um job.

Digamos que você queira pesquisar o termo pizza boxes em um site.

Um exemplo de parâmetros de job seria o seguinte:

Passo 1. Você deve fornecer o "render": "html" parâmetro.

Passo 2. Instruções de navegador devem ser descritas no "browser_instructions" campo.

As instruções de navegador de exemplo acima especificam que o objetivo é inserir um termo de pesquisa pizza boxes em um campo de busca, clicar search no botão e esperar 5 segundos para o conteúdo carregar.

O resultado raspado deve ser parecido com o seguinte:

O HTML raspado deve ser assim:

Obtendo recursos do navegador

Fornecemos uma instrução de navegador independente para obter recursos do navegador.

A função é definida aqui:

Usando fetch_resource resultará no retorno do job com a primeira ocorrência de um recurso Fetch/XHR que corresponda ao formato fornecido em vez do HTML que está sendo alvo.

Digamos que queremos direcionar um recurso GraphQL que é buscado ao visitar uma página de produto organicamente no navegador. Iremos fornecer as informações do job da seguinte forma:

Essas instruções resultarão em um resultado como este:

Lista de instruções de navegador suportadas

Lista de instruçõeschevron-right

Códigos de status

Veja nossos códigos de resposta descritos aqui.

Códigos de status em relação à validação de instruções estão documentados aqui.

Erros e avisos

Se houver um erro ou aviso resultante de suas ações de navegação, você o encontrará no resultado sob as chaves browser_instructions_error ou browser_instructions_warnings. Por exemplo, se você enviou as seguintes instruções de navegador e o xpath esperado não for localizado na página, o resultado incluirá um aviso.

browser_instructions:

Resultados:

Erros e avisos possíveis

Ocorreu um erro inesperado ao converter instruções de navegador em ações.

Ocorreu um erro inesperado ao executar {action.type} instruções de navegador.

Ação {action.type} expirou.

Não foi possível encontrar o tipo de seletor {selector.type} com valor {selector.value} na página.

Atualizado

Isto foi útil?