Transcripción de YouTube
Aprende cómo raspar transcripciones de vídeos de YouTube usando Web Scraper API. Conoce sus parámetros y ejemplos prácticos.
Puedes obtener las transcripciones de videos de YouTube proporcionando un ID de video de YouTube y un language_code al youtube_transcript .
Las transcripciones son distintas de los subtítulos y los subtítulos ocultos (CC). Para extraer subtítulos y CC, usa el YouTube Subtitles .
Solicitar ejemplos
Los siguientes ejemplos muestran cómo obtener la transcripción en inglés de un video de YouTube, específicamente cuando la transcripción fue proporcionada por el subidor.
curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
"source": "youtube_transcript",
"query": "WOD0mZnu-j0",
"context": [
{
"key": "language_code",
"value": "en"
},
{
"key": "transcript_origin",
"value": "uploader_provided"
}
]
}'import requests
from pprint import pprint
# Estructurar payload.
payload = {
'source': 'youtube_transcript',
'query': 'WOD0mZnu-j0',
'context': [
{
'key': 'language_code',
'value': 'en'
},
{
'key': 'transcript_origin',
'value': 'uploader_provided'
}
]
}
# Obtener respuesta.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Imprime la respuesta JSON con el resultado.
pprint(response.json())Usamos el método de integración síncrono Realtime en nuestros ejemplos. Si desea usar Proxy Endpoint, o asíncrono Push-Pull para la integración, consulte los Métodos de integración sección.
Valores de parámetros de la solicitud
Genérico
source
Establece el scraper.
youtube_transcript
query
ID de video de YouTube.
-
contexto: language_code
Especifica el idioma de la transcripción. Encuentra los valores disponibles aquí.
NOTA: Si el proporcionado language_code no tiene una transcripción coincidente en el video de YouTube, el resultado devuelve un 404 estado.
-
contexto:
transcript_origin (opcional)
Especifica si recuperar transcripciones que son auto_generated o uploader_provided.
auto_generated
- parámetro obligatorio
Última actualización
¿Te fue útil?

