circle-check
Documentation has been updated: see help center and changelog in one place.

Perplexity

Aprende a raspar respuestas de Perplexity y obtener datos estructurados usando Web Scraper API. Encuentra ejemplos de código completos y muestras de salida.

El perplejidad la fuente te permite enviar indicaciones y capturar respuestas completas directamente desde Perplexity. Devuelve tanto el texto generado como metadatos relevantes en un formato estructurado, junto con una versión en Markdown del resultado.

Muestras de solicitud

Los ejemplos de código a continuación ilustran cómo enviar indicaciones a Perplexity y recuperar respuestas analizadas.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "perplexity",
        "prompt": "top 3 smartphones in 2025, compare pricing across US marketplaces",
        "geo_location": "United States",
        "parse": true
    }'
circle-info

De forma predeterminada, todas las solicitudes a Perplexity utilizan renderizado JavaScript. Asegúrate de establecer un tiempo de espera suficiente (p. ej., 180s) al usar el método de integración Realtime.

Nuestros ejemplos usan el Realtime (método de integración síncrono). Para usar Proxy Endpoint o Push-Pull (asíncrono), consulta la página de métodos de integración página.

circle-exclamation

Valores de parámetros de la solicitud

Genérico

Parámetros básicos de configuración para extraer respuestas de Perplexity.

Parámetro
Descripción
Valor predeterminado

source

Establece el scraper.

perplejidad

prompt

La indicación o pregunta que se envía a Perplexity.

-

parse

Devuelve datos analizados cuando se establece en true.

false

geo_location

Especifica un país desde el cual enviar la indicación. Más información.

-

callback_url

URL a tu endpoint de callback. Más información.

-

- parámetro obligatorio

Datos estructurados

Web Scraper API devuelve ya sea un documento HTML o un objeto JSON con la salida de Perplexity, que contiene datos estructurados de la página de resultados.

chevron-rightperplejidad salida estructuradahashtag

Diccionario de datos de salida

Ejemplo HTML

Estructura JSON

La perplejidad salida incluye campos tales como url, modelo, answer_results, y más. La tabla a continuación desglosa los elementos de la página que analizamos, junto con descripciones, tipos de datos y metadatos relevantes.

circle-info

El número de elementos y campos para un tipo de resultado específico puede variar según la indicación enviada.

Campo
Descripción
Tipo

url

La URL de la conversación de Perplexity.

string

página

Número de página.

integer

contenido

Un objeto que contiene los datos de la página de Perplexity analizados.

object

modelo

Modelo de Perplexity usado para generar la respuesta.

string

prompt_query

La indicación original enviada a Perplexity.

string

displayed_tabs

Pestañas mostradas en la interfaz de Perplexity (p. ej., shopping, images).

list

answer_results

La respuesta completa de Perplexity que contiene texto o contenido anidado.

list or string

answer_results_md

La respuesta completa renderizada en formato Markdown.

string

related_queries

Una lista de consultas relacionadas con la indicación principal.

list

top_images

Una lista de imágenes principales con sus títulos y URLs.

array

inline_products

Una lista de productos en línea con títulos, precios, enlaces y otros metadatos.

array

additional_results.hotels_results

Una lista de hoteles con títulos, URL, direcciones y otros detalles del hotel.

array

additional_results.places_results

Una lista de lugares con títulos, URL, coordenadas, y otros metadatos.

array

additional_results.videos_results

Una lista de videos con miniaturas, títulos, URL y fuentes.

array

additional_results.shopping_results

Una lista de artículos de compras con títulos, precios, URL y otros metadatos del producto.

array

additional_results.sources_results

Una lista de fuentes citadas con sus títulos y URL.

array

additional_results.images_results

Una lista de imágenes relacionadas con títulos, URL de imagen y URL de la página fuente.

array

parse_status_code

Código de estado de la operación de análisis.

integer

created_at

La marca de tiempo cuando se creó el trabajo de scraping.

timestamp

updated_at

La marca de tiempo cuando se finalizó el trabajo de scraping.

timestamp

job_id

El ID del trabajo asociado con el trabajo de scraping.

string

geo_location

Ubicación del proxy desde la cual se envió la solicitud.

string

status_code

El código de estado del trabajo de scraping. Puedes ver los códigos de estado del scraper descritos here.

integer

parser_type

El tipo de parser utilizado para descomponer el contenido HTML.

string

Resultados adicionales y productos en línea

Junto con la respuesta principal de la IA, devolvemos datos extra bajo additional_results, como

  • images_results

  • sources_results

  • shopping_results

  • videos_results

  • places_results

  • hotels_results

Estas matrices se extraen de las pestañas en la página de resultados original y se incluyen solo si hay contenido relevante disponible:

Además, el inline_products array contiene productos que están directamente incrustados en la respuesta:

Última actualización

¿Te fue útil?