Documentation has been updated: see help center and changelog in one place.

Perplexity

Aprende cómo raspar respuestas de Perplexity y obtener datos estructurados usando Web Scraper API. Encuentra ejemplos de código completos y muestras de salida.

El perplexity source te permite enviar prompts y capturar respuestas completas directamente desde Perplexity. Devuelve tanto el texto generado como metadatos relevantes en un formato estructurado, junto con una versión en Markdown del resultado.

Solicitar ejemplos

Los ejemplos de código a continuación ilustran cómo enviar prompts a Perplexity y recuperar respuestas parseadas.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "perplexity",
        "prompt": "top 3 smartphones in 2025, compare pricing across US marketplaces",
        "geo_location": "Estados Unidos",
        "parse": true
    }'

Por defecto, todas las solicitudes a Perplexity usan renderizado JavaScript. Asegúrate de establecer un timeout suficiente (p. ej. 180s) al usar el método de integración Realtime.

Nuestros ejemplos usan el Realtime (método de integración síncrono). Para usar Proxy Endpoint o Push-Pull (asíncrono), consulta el métodos de integración página.

Valores de parámetros de la solicitud

Genérico

Parámetros básicos de configuración para scrapear respuestas de Perplexity.

Parámetro
Descripción
Valor predeterminado

source

Establece el scraper.

perplexity

prompt

El prompt o pregunta para enviar a Perplexity.

-

parse

Devuelve datos parseados cuando se establece en true.

false

geo_location

Especifique un país desde el cual enviar el prompt. Más información.

-

callback_url

URL de su endpoint de callback. Más información.

-

- parámetro obligatorio

Datos estructurados

Web Scraper API devuelve ya sea un documento HTML o un objeto JSON con la salida de Perplexity, que contiene datos estructurados de la página de resultados.

perplexity salida estructurada

Diccionario de datos de salida

Ejemplo HTML

Estructura JSON

La perplexity la salida incluye campos como url, model, answer_results, y más. La tabla a continuación desglosa los elementos de la página que parseamos, junto con descripciones, tipos de datos y metadatos relevantes.

El número de elementos y campos para un tipo de resultado específico puede variar según el prompt enviado.

Campo
Descripción
Tipo

url

La URL de la conversación en Perplexity.

string

page

Número de página.

integer

contenido

Un objeto que contiene datos parseados de la página de Perplexity.

object

model

Modelo de Perplexity usado para generar la respuesta.

string

prompt_query

El prompt original enviado a Perplexity.

string

displayed_tabs

Pestañas mostradas en la interfaz de Perplexity (p. ej., shopping, images).

lista

answer_results

La respuesta completa de Perplexity que contiene texto o contenido anidado.

lista o string

answer_results_md

La respuesta completa renderizada en formato Markdown.

string

related_queries

Una lista de consultas relacionadas con el prompt principal.

lista

top_images

Una lista de imágenes principales con sus títulos y URLs.

array

top_sources

Una lista de fuentes citadas principales con sus títulos, fuentes y URLs.

array

inline_products

Una lista de productos inline con títulos, precios, enlaces y otros metadatos.

array

additional_results.hotels_results

Una lista de hoteles con títulos, URLs, direcciones y otros detalles del hotel.

array

additional_results.places_results

Una lista de lugares con títulos, URLs, coordenadas,, y otros metadatos.

array

additional_results.videos_results

Una lista de videos con miniaturas, títulos, URLs y fuentes.

array

additional_results.shopping_results

Una lista de artículos de compra con títulos, precios, URLs y otros metadatos de producto.

array

additional_results.sources_results

Una lista de fuentes citadas con sus títulos y URLs.

array

additional_results.images_results

Una lista de imágenes relacionadas con títulos, URLs de imagen y URLs de la página origen.

array

parse_status_code

Código de estado de la operación de parseo.

integer

created_at

La marca de tiempo cuando se creó el trabajo de scraping.

timestamp

updated_at

La marca de tiempo cuando el trabajo de scraping fue finalizado.

timestamp

job_id

El ID del trabajo asociado con la tarea de scraping.

string

geo_location

Ubicación del proxy desde la cual se envió el prompt.

string

status_code

El código de estado del trabajo de scraping. Puede ver los códigos de estado del scraper descritos aquí.

integer

parser_type

El tipo de parser usado para descomponer el contenido HTML.

string

Resultados adicionales y productos inline

Junto con la respuesta principal de la IA, devolvemos datos adicionales bajo additional_results, como

  • images_results

  • sources_results

  • shopping_results

  • videos_results

  • places_results

  • hotels_results

Estos arrays se extraen de las pestañas en la página de resultados original y se incluyen solo si hay contenido relevante disponible:

Además, el inline_products array contiene productos que están directamente incrustados en la respuesta:

Última actualización

¿Te fue útil?