Perplexity

Aprenda como raspar respostas do Perplexity e obter dados estruturados usando a Web Scraper API. Encontre exemplos de código abrangentes e amostras de saída.

O perplexity a fonte permite que você envie prompts e capture respostas completas diretamente do Perplexity. Ela retorna tanto o texto gerado quanto metadados relevantes em um formato estruturado, juntamente com uma versão em Markdown do resultado.

Amostras de requisição

Os exemplos de código abaixo ilustram como enviar prompts ao Perplexity e recuperar respostas parseadas.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "perplexity",
        "prompt": "top 3 smartphones in 2025, compare pricing across US marketplaces",
        "geo_location": "United States",
        "parse": true
    }'
circle-info

Por padrão, todas as requisições ao Perplexity usam renderização em JavaScript. Certifique-se de definir um timeout suficiente (por exemplo, 180s) ao usar o método de integração Realtime.

Nossos exemplos usam o Realtime (método de integração síncrono). Para usar Proxy Endpoint ou Push-Pull (assíncrono), consulte a página de métodos de integração .

circle-exclamation

Valores dos parâmetros de requisição

Genérico

Configuração básica e parâmetros de configuração para extrair respostas do Perplexity.

Parâmetro
Descrição
Valor Padrão

source

Define o scraper.

perplexity

prompt

O prompt ou pergunta a ser enviado ao Perplexity.

-

parse

Retorna dados analisados quando definido como true.

false

geo_location

Especifique um país para enviar o prompt a partir de. Mais informações.

-

callback_url

URL do seu endpoint de callback. Mais informações.

-

- parâmetro obrigatório

Dados estruturados

A Web Scraper API retorna ou um documento HTML ou um objeto JSON da saída do Perplexity, que contém dados estruturados da página de resultados.

chevron-rightperplexity saída estruturadahashtag

Dicionário de dados de saída

Exemplo de HTML

Estrutura JSON

A perplexity saída inclui campos como url, model, answer_results, e mais. A tabela abaixo descreve os elementos da página que analisamos, junto com descrições, tipos de dados e metadados relevantes.

circle-info

O número de itens e campos para um tipo de resultado específico pode variar dependendo do prompt enviado.

Campo
Descrição
Tipo

url

A URL da conversa do Perplexity.

string

página

Número da página.

inteiro

conteúdo

Um objeto contendo os dados da página Perplexity analisados.

object

model

Modelo Perplexity usado para gerar a resposta.

string

prompt_query

O prompt original enviado ao Perplexity.

string

displayed_tabs

Abas exibidas na interface do Perplexity (por exemplo, shopping, images).

list

answer_results

A resposta completa do Perplexity contendo texto ou conteúdo aninhado.

list or string

answer_results_md

A resposta completa renderizada em formato Markdown.

string

related_queries

Uma lista de consultas relacionadas ao prompt principal.

list

top_images

Uma lista das principais imagens com seus títulos e URLs.

array

inline_products

Uma lista de produtos embutidos com títulos, preços, links e outros metadados.

array

additional_results.hotels_results

Uma lista de hotéis com títulos, URLs, endereços e outros detalhes do hotel.

array

additional_results.places_results

Uma lista de locais com títulos, URLs, coordenadas,, e outros metadados.

array

additional_results.videos_results

Uma lista de vídeos com miniaturas, títulos, URLs e fontes.

array

additional_results.shopping_results

Uma lista de itens de compra com títulos, preços, URLs e outros metadados do produto.

array

additional_results.sources_results

Uma lista de fontes citadas com seus títulos e URLs.

array

additional_results.images_results

Uma lista de imagens relacionadas com títulos, URLs das imagens e URLs das páginas de origem.

array

parse_status_code

Código de status da operação de parsing.

inteiro

created_at

O carimbo de data/hora quando o trabalho de scraping foi criado.

timestamp

updated_at

O carimbo de data/hora quando o trabalho de scraping foi finalizado.

timestamp

job_id

O ID do job associado ao trabalho de scraping.

string

geo_location

Localização do proxy de onde o prompt foi enviado.

string

status_code

O código de status do trabalho de scraping. Você pode ver os códigos de status do scraper descritos here.

inteiro

parser_type

O tipo de parser usado para dividir o conteúdo HTML.

string

Resultados adicionais e produtos embutidos

Além da resposta principal da IA, retornamos dados extras sob additional_results, tais como

  • images_results

  • sources_results

  • shopping_results

  • videos_results

  • places_results

  • hotels_results

Esses arrays são extraídos das abas na página de resultados original e são incluídos apenas se houver conteúdo relevante disponível:

Além disso, o inline_products array contém produtos que estão diretamente incorporados na resposta:

Atualizado

Isto foi útil?