For the complete documentation index, see llms.txt. This page is also available as Markdown.

Perplexity

Extraia respostas do Perplexity enviando prompts, com dados analisados incluindo texto da resposta, saída em Markdown, consultas relacionadas, fontes citadas, imagens, produtos em linha e mais.

O perplexity source permite enviar prompts e capturar respostas completas diretamente do Perplexity. Ele retorna tanto o texto gerado quanto metadados relevantes em um formato estruturado, junto com uma versão em Markdown do resultado.

Exemplos de solicitação

Os exemplos de código abaixo mostram como enviar prompts para o Perplexity e recuperar respostas analisadas.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "perplexity",
        "prompt": "3 melhores smartphones em 2025, compare os preços entre marketplaces dos EUA",
        "geo_location": "Estados Unidos",
        "parse": true
    }'

Por padrão, todas as solicitações ao Perplexity usam renderização JavaScript. Certifique-se de definir um timeout suficiente (por exemplo, 180s) ao usar o método de integração Realtime.

Usamos o método de integração Realtime síncrona em nossos exemplos. Se você quiser usar Proxy Endpoint ou a integração assíncrona Push-Pull , consulte a seção métodos de integração .

Valores dos parâmetros da solicitação

Genérico

Configuração básica e parâmetros de configuração para extrair respostas do Perplexity.

Parâmetro
Descrição
Valor padrão

source

Define o scraper.

perplexity

prompt

O prompt ou pergunta a enviar ao Perplexity.

-

parse

Retorna dados analisados quando definido como true.

false

geo_location

Especifique um país de onde enviar o prompt. Mais informações.

-

callback_url

URL para seu endpoint de callback. Mais informações

-

- parâmetro obrigatório

Dados estruturados

Web Scraper API retorna um documento HTML ou um objeto JSON da saída do Perplexity, que contém dados estruturados da página de resultados.

perplexity saída estruturada

Dicionário de dados de saída

Exemplo de HTML

Estrutura JSON

A saída estruturada perplexity a saída inclui campos como url, model, answer_results, e mais. A tabela abaixo detalha os elementos da página que analisamos, junto com descrições, tipos de dados e metadados relevantes.

O número de itens e campos para um tipo específico de resultado pode variar dependendo do prompt enviado.

Campo
Descrição
Tipo

url

A URL da conversa do Perplexity.

string

page

Número da página.

integer

content

Um objeto que contém os dados analisados da página do Perplexity.

object

model

Modelo do Perplexity usado para gerar a resposta.

string

prompt_query

O prompt original enviado ao Perplexity.

string

displayed_tabs

Abas exibidas na interface do Perplexity (por exemplo, compras, imagens).

lista

answer_results

A resposta completa do Perplexity contendo texto ou conteúdo aninhado.

lista ou string

answer_results_md

Toda a resposta renderizada em formato Markdown.

string

related_queries

Uma lista de consultas relacionadas ao prompt principal.

lista

top_images

Uma lista das principais imagens com seus títulos e URLs.

array

inline_products

Uma lista de produtos embutidos com títulos, preços, links e outros metadados.

array

additional_results.hotels_results

Uma lista de hotéis com títulos, URLs, endereços e outros detalhes do hotel.

array

additional_results.places_results

Uma lista de locais com títulos, URLs, coordenadas, e outros metadados.

array

additional_results.videos_results

Uma lista de vídeos com miniaturas, títulos, URLs e fontes.

array

additional_results.shopping_results

Uma lista de itens de compras com títulos, preços, URLs e outros metadados do produto.

array

additional_results.sources_results

Uma lista de fontes citadas com seus títulos e URLs.

array

additional_results.images_results

Uma lista de imagens relacionadas com títulos, URLs das imagens e URLs das páginas de origem.

array

parse_status_code

Código de status da operação de análise.

integer

created_at

O timestamp em que o trabalho de scraping foi criado.

timestamp

updated_at

O timestamp em que o trabalho de scraping foi concluído.

timestamp

job_id

O ID do trabalho associado ao trabalho de scraping.

string

geo_location

Localização do proxy a partir da qual o prompt foi enviado.

string

status_code

O código de status do trabalho de scraping. Você pode ver os códigos de status do scraper descritos aqui.

integer

parser_type

O tipo de parser usado para dividir o conteúdo HTML.

string

Resultados adicionais e produtos embutidos

Além da resposta principal da IA, retornamos dados extras em additional_results, como

  • images_results

  • sources_results

  • shopping_results

  • videos_results

  • places_results

  • hotels_results

Esses arrays são extraídos das abas da página original de resultados e são incluídos apenas se houver conteúdo relevante disponível:

Além disso, o inline_products array contém produtos que estão diretamente incorporados na resposta:

Atualizado

Isto foi útil?