Pesquisa de imagens

Extraia resultados da Pesquisa Google Imagens com dados analisados, incluindo listagens orgânicas de imagens, URLs das imagens, domínios de origem, títulos, buscas sugeridas e informações da pesquisa.

O google_search source foi projetado para recuperar resultados da Pesquisa Google (SERPs). Esta subpágina apresenta especificamente dados relacionados à Pesquisa de Imagens do Google. Para explorar outros tipos de resultado, leia aqui: Pesquisa na Web, Pesquisa de notícias.

Explorar saída dicionário de dados para cada recurso do Image SERP, oferecendo uma breve descrição, captura de tela, trecho de código JSON parseado e uma tabela que define cada campo parseado. Navegue pelos detalhes usando a navegação do lado direito ou rolando a página para baixo.

Exemplos de solicitação

Nos exemplos abaixo, fazemos uma solicitação para obter páginas de resultados de pesquisa de Imagens para o termo de pesquisa adidas.

udm

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "google_search",
        "query": "adidas",
        "parse": true,
        "context": [
            {
                "key": "udm",
                "value": "2"
            }
        ]
    }'

tbm

Usamos o método de integração Realtime síncrona em nossos exemplos. Se você quiser usar Proxy Endpoint ou a integração assíncrona Push-Pull , consulte a seção métodos de integração .

Valores dos parâmetros da solicitação

Genérico

Opções básicas de configuração e personalização para fazer scrape dos resultados da pesquisa de Imagens do Google.

Parâmetro
Descrição
Valor padrão

source

Define o scraper.

google_search

query

A palavra-chave ou frase para pesquisar.

-

context: udm

Para obter resultados da pesquisa de Imagens, defina o valor como 2. Encontre outros valores aceitos aqui.

-

context: tbm

Para obter resultados da pesquisa de Imagens, defina o valor como isch. Outros valores aceitos: app, blg, bks, dsc, nws, pts, plcs, rcp, lcl.

-

render

Habilita a renderização de JavaScript quando definido como html. Mais informações.

-

parse

Retorna dados analisados quando definido como true. Explore a saída dicionário de dados.

false

callback_url

URL para seu endpoint de callback. Mais informações

-

user_agent_type

Tipo de dispositivo e navegador. A lista completa pode ser encontrada aqui.

desktop

- parâmetro obrigatório

- udm e tbm os parâmetros de contexto não podem ser usados juntos em uma única solicitação de scraping; selecione um deles. Usar ambos simultaneamente pode causar conflitos ou comportamento inesperado.

Operadores avançados de pesquisa do Google

Ao raspar, pode ser útil combinar operadores avançados de pesquisa do Google com sua consulta. Isso permite personalizar o escopo da pesquisa, garantindo que os resultados sejam mais relevantes e focados. Explore estes comandos especiais aqui e aqui. Veja um exemplo abaixo.

Localização

Adapte os resultados de busca para locais geográficos e idiomas específicos.

Parâmetro
Descrição
Valor padrão

geo_location

A localização geográfica para a qual o resultado deve ser adaptado. Usar este parâmetro corretamente é extremamente importante para obter os dados certos. Para mais informações, leia sobre nossas geo_location estruturas de parâmetros aqui.

-

locale

valor do cabeçalho Accept-Language Mais informações.

-

Paginação

Controles para gerenciar a paginação e a recuperação dos resultados da pesquisa.

Parâmetro
Descrição
Valor padrão

start_page

Número da página inicial.

1

pages

Número de páginas para recuperar.

1

Filtragem

Opções para filtrar e refinar os resultados de busca com base em vários critérios.

Parâmetro
Descrição
Valor padrão

context:safe_search

Pesquisa segura. Defina como true para ativá-la.

false

context: tbs

tbs parâmetro. Esse parâmetro funciona como um contêiner para outros parâmetros menos óbvios do Google, como limitar/ordenar resultados por data, além de outros filtros, alguns dos quais dependem do tbm (por exemplo, tbs=app_os:1 só está disponível com o valor tbm ). Mais informações app. aqui.

-

Outros

Configurações e controles avançados adicionais para requisitos especializados.

Parâmetro
Descrição
Valor padrão

context: fpstate

Definir o valor de fpstate como aig fará o Google carregar mais apps. Este parâmetro só é útil se usado em conjunto com o parâmetro render .

-

context: nfpr

true desativará a autocorreção ortográfica

false

Parâmetros de contexto

Todos os parâmetros de contexto devem ser adicionados ao array context como objetos com pares key e ). Mais informações , por exemplo:

Dados estruturados

A SERP Scraper API é capaz de extrair um objeto HTML ou JSON que contém resultados de pesquisa do Google, oferecendo dados estruturados sobre vários elementos da página de resultados.

google_search saída estruturada de imagens

Nós apenas fazemos parse dos resultados de pesquisa de imagens para desktop pesquisas.

Dicionário de dados de saída

Exemplo de HTML

Estrutura JSON

A saída estruturada da Pesquisa de Imagens do Google inclui campos como URL, page, resultados, e outros. A tabela abaixo apresenta uma lista detalhada de cada recurso de SERP que analisamos, junto com sua descrição e tipo de dado. A tabela também inclui alguns metadados.

O número de itens e campos para um tipo de resultado específico pode variar dependendo da consulta de pesquisa.

Chave (results.images)
Descrição
Tipo

url

A URL da página de pesquisa do Google.

string

resultados

Um dicionário contendo os resultados da pesquisa.

array

results.organic

Uma lista de resultados não pagos com seus respectivos detalhes.

array

resaults.search_information

Uma lista de detalhes para a consulta de pesquisa enviada.

object

results.suggested_searches

Uma lista de pesquisas sugeridas exibida logo abaixo da consulta de pesquisa original.

array

parse_status_code

O código de status do trabalho de análise. Você pode ver os códigos de status do parser descritos aqui.

integer

created_at

O timestamp em que o trabalho de scraping foi criado.

timestamp

updated_at

O timestamp em que o trabalho de scraping foi concluído.

timestamp

page

Número da página relativo à paginação da SERP do Google.

integer

job_id

O ID do trabalho associado ao trabalho de scraping.

string

status_code

O código de status do trabalho de scraping. Você pode ver os códigos de status do scraper descritos aqui.

integer

Nas seções a seguir, os trechos de código JSON analisados são abreviados quando há mais de um item disponível para o tipo de resultado.

Orgânico

A seção organic Pesquisa de Imagens mostra listagens não pagas nos resultados da Pesquisa de Imagens do Google, organizadas por relevância pelo algoritmo do Google. Esses resultados são apresentados aos usuários que buscam conteúdo visual e são exibidos em uma seção dedicada, distinta de outros tipos de resultado de pesquisa.

Chave (results.organic)
Descrição
Tipo

pos

Um indicador exclusivo que denota a posição da imagem na lista.

string

link

A URL do site onde a imagem está размещada.

array

image

A URL da imagem.

array

title

O título do artigo onde a imagem está размещada.

object

domain

O domínio do site que contém o resultado da imagem.

array

pos_overall

Um indicador exclusivo que denota a posição da imagem na lista.

integer

Informações de pesquisa

informações de pesquisa é uma seção que fornece detalhes sobre a consulta de pesquisa. Ela inclui informações como o termo de pesquisa original e, se aplicável, quaisquer autocorreções feitas pelo Google.

Chave (results.search_information)
Descrição
Tipo

query

O termo de pesquisa original.

string

showing_results_for

O termo de pesquisa para o qual os resultados da pesquisa são exibidos. query e showing_results_for pode ser diferente se o Google tiver corrigido automaticamente o termo de pesquisa fornecido.

array

Pesquisas sugeridas

O suggested_searches (array) na Pesquisa de Imagens do Google fornece uma lista de termos de pesquisa sugeridos relacionados à consulta original. Os usuários podem explorar essas opções adicionais de pesquisa para refinar ou ampliar sua pesquisa de imagens.

Atualizado

Isto foi útil?