For the complete documentation index, see llms.txt. This page is also available as Markdown.

Perplexity

Extrae respuestas de Perplexity enviando prompts, con datos analizados que incluyen texto de respuesta, salida en Markdown, consultas relacionadas, fuentes citadas, imágenes, productos en línea y más.

El perplexity source te permite enviar prompts y capturar respuestas completas directamente desde Perplexity. Devuelve tanto el texto generado como metadatos relevantes en un formato estructurado, junto con una versión Markdown del resultado.

Ejemplos de solicitud

Los ejemplos de código a continuación ilustran cómo enviar prompts a Perplexity y recuperar respuestas analizadas.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "perplexity",
        "prompt": "top 3 smartphones in 2025, compare pricing across US marketplaces",
        "geo_location": "United States",
        "parse": true
    }'

De forma predeterminada, todas las solicitudes a Perplexity usan renderizado JavaScript. Asegúrate de establecer un tiempo de espera suficiente (por ejemplo, 180s) al usar el método de integración Realtime.

Usamos el método de integración síncrona Realtime en nuestros ejemplos. Si deseas usar Proxy Endpoint o la integración asíncrona Push-Pull consulta la sección de métodos de integración .

Valores de los parámetros de solicitud

Genérico

Configuración básica y parámetros de configuración para extraer respuestas de Perplexity.

Parámetro
Descripción
Valor predeterminado

source

Establece el scraper.

perplexity

Configuración básica y opciones de personalización para extraer ChatGPT.

El prompt o pregunta que se enviará a Perplexity.

-

parse

Devuelve datos analizados cuando se establece en true.

false

geo_location

Especifica un país desde el que enviar el prompt. Más información.

-

callback_url

URL de tu endpoint de callback. Más información

-

- parámetro obligatorio

Datos estructurados

Web Scraper API devuelve un documento HTML o un objeto JSON de la salida de Perplexity, que contiene datos estructurados de la página de resultados.

perplexity salida estructurada

Diccionario de datos de salida

Ejemplo HTML

Estructura JSON

La salida estructurada perplexity la salida incluye campos como url, model, answer_results, y más. La tabla siguiente desglosa los elementos de la página que analizamos, junto con descripciones, tipos de datos y metadatos relevantes.

El número de elementos y campos para un tipo de resultado específico puede variar según el prompt enviado.

Campo
Descripción
Tipo

url

La URL de la conversación de Perplexity.

string

page

Número de página.

integer

contenido

Un objeto que contiene datos analizados de la página de Perplexity.

object

model

Modelo de Perplexity usado para generar la respuesta.

string

prompt_query

El prompt original enviado a Perplexity.

string

displayed_tabs

Pestañas mostradas en la interfaz de Perplexity (por ejemplo, compras, imágenes).

lista

answer_results

La respuesta completa de Perplexity que contiene texto o contenido anidado.

lista o cadena

answer_results_md

Toda la respuesta renderizada en formato Markdown.

string

related_queries

Una lista de consultas relacionadas con el prompt principal.

lista

top_images

Una lista de imágenes destacadas con sus títulos y URLs.

array

inline_products

Una lista de productos en línea con títulos, precios, enlaces y otros metadatos.

array

additional_results.hotels_results

Una lista de hoteles con títulos, URLs, direcciones y otros detalles del hotel.

array

additional_results.places_results

Una lista de lugares con títulos, URLs, coordenadas y otros metadatos.

array

additional_results.videos_results

Una lista de videos con miniaturas, títulos, URLs y fuentes.

array

additional_results.shopping_results

Una lista de artículos de compra con títulos, precios, URLs y otros metadatos del producto.

array

additional_results.sources_results

Una lista de fuentes citadas con sus títulos y URLs.

array

additional_results.images_results

Una lista de imágenes relacionadas con títulos, URLs de imagen y URLs de la página de origen.

array

parse_status_code

Código de estado de la operación de análisis.

integer

created_at

La marca de tiempo cuando se creó el trabajo de scraping.

timestamp

updated_at

La marca de tiempo cuando terminó el trabajo de scraping.

timestamp

job_id

El ID del trabajo asociado con el trabajo de scraping.

string

geo_location

Ubicación del proxy desde la que se envió el prompt.

string

status_code

El código de estado del trabajo de scraping. Puedes ver los códigos de estado del scraper descritos aquí.

integer

parser_type

El tipo de analizador usado para desglosar el contenido HTML.

string

Resultados adicionales y productos en línea

Junto con la respuesta principal de IA, devolvemos datos extra bajo additional_results, como

  • images_results

  • sources_results

  • shopping_results

  • videos_results

  • places_results

  • hotels_results

Estas matrices se extraen de las pestañas de la página de resultados original y solo se incluyen si hay contenido relevante disponible:

Además, la inline_products matriz contiene productos que están directamente incrustados en la respuesta:

Última actualización

¿Te fue útil?