Perplexity

Aprenda como raspar respostas do Perplexity e obter dados estruturados usando o Web Scraper API. Encontre exemplos de código abrangentes e amostras de saída.

O perplexity a fonte perplexity permite que você envie prompts e capture respostas completas diretamente do Perplexity. Ela retorna tanto o texto gerado quanto metadados relevantes em um formato estruturado, além de uma versão em Markdown do resultado.

Amostras de requisição

Os exemplos de código abaixo ilustram como enviar prompts ao Perplexity e recuperar respostas analisadas.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "perplexity",
        "prompt": "top 3 smartphones in 2025, compare pricing across US marketplaces",
        "geo_location": "United States",
        "parse": true
    }'
circle-info

Por padrão, todas as requisições ao Perplexity usam renderização JavaScript. Certifique-se de definir um timeout suficiente (por exemplo, 180s) ao usar o método de integração Realtime.

Nossos exemplos usam o Realtime (método de integração síncrono). Para usar Proxy Endpoint ou Push-Pull (assíncrono), consulte a página de métodos de integração .

circle-exclamation

Valores dos parâmetros de requisição

Genérico

Parâmetros básicos de configuração e setup para raspar respostas do Perplexity.

Parâmetro
Descrição
Valor Padrão

source

Define o scraper.

perplexity

prompt

O prompt ou pergunta a ser enviado ao Perplexity.

-

parse

Retorna dados analisados quando definido como true.

false

geo_location

Especifique um país para enviar o prompt a partir dele. Mais informações.

-

callback_url

URL para o seu endpoint de callback. Mais informações.

-

- parâmetro obrigatório

Dados estruturados

A Web Scraper API retorna ou um documento HTML ou um objeto JSON da saída do Perplexity, que contém dados estruturados da página de resultados.

chevron-rightperplexity saída estruturadahashtag

Dicionário de dados de saída

Exemplo de HTML

Estrutura JSON

A perplexity saída inclui campos como url, model, answer_results, e mais. A tabela abaixo detalha os elementos da página que nós analisamos, junto com descrições, tipos de dados e metadados relevantes.

circle-info

O número de itens e campos para um tipo de resultado específico pode variar dependendo do prompt enviado.

Campo
Descrição
Tipo

url

A URL da conversa do Perplexity.

string

page

Número da página.

integer

content

Um objeto contendo dados da página do Perplexity analisados.

object

model

Modelo do Perplexity usado para gerar a resposta.

string

prompt_query

O prompt original enviado ao Perplexity.

string

displayed_tabs

Abas exibidas na interface do Perplexity (por exemplo, shopping, images).

list

answer_results

A resposta completa do Perplexity contendo texto ou conteúdo aninhado.

list or string

answer_results_md

A resposta inteira renderizada em formato Markdown.

string

related_queries

Uma lista de consultas relacionadas ao prompt principal.

list

top_images

Uma lista das principais imagens com seus títulos e URLs.

array

inline_products

Uma lista de produtos embutidos com títulos, preços, links e outros metadados.

array

additional_results.hotels_results

Uma lista de hotéis com títulos, URLs, endereços e outros detalhes do hotel.

array

additional_results.places_results

Uma lista de locais com títulos, URLs, coordenadas,, e outros metadados.

array

additional_results.videos_results

Uma lista de vídeos com miniaturas, títulos, URLs e fontes.

array

additional_results.shopping_results

Uma lista de itens de compra com títulos, preços, URLs e outros metadados do produto.

array

additional_results.sources_results

Uma lista de fontes citadas com seus títulos e URLs.

array

additional_results.images_results

Uma lista de imagens relacionadas com títulos, URLs das imagens e URLs das páginas de origem.

array

parse_status_code

Código de status da operação de parsing.

integer

created_at

O carimbo de data/hora quando o trabalho de scraping foi criado.

timestamp

updated_at

O carimbo de data/hora quando o trabalho de scraping foi finalizado.

timestamp

job_id

O ID do job associado ao trabalho de scraping.

string

geo_location

Localização do proxy de onde o prompt foi enviado.

string

status_code

O código de status do trabalho de scraping. Você pode ver os códigos de status do scraper descritos here.

integer

parser_type

O tipo de parser usado para decompor o conteúdo HTML.

string

Resultados adicionais e produtos embutidos

Junto com a resposta principal da IA, retornamos dados extras em additional_results, tais como

  • images_results

  • sources_results

  • shopping_results

  • videos_results

  • places_results

  • hotels_results

Esses arrays são extraídos das abas da página de resultados original e são incluídos somente se houver conteúdo relevante disponível:

Além disso, o inline_products array contém produtos que estão diretamente embutidos na resposta:

Atualizado

Isto foi útil?