Transcrição do YouTube
Saiba como raspar transcrições de vídeos do YouTube usando a Web Scraper API. Saiba mais sobre seus parâmetros e exemplos práticos.
Você pode obter transcrições de vídeos do YouTube fornecendo um ID de vídeo do YouTube e um language_code para o youtube_transcript source.
Transcrições são diferentes de legendas e closed captions (CC). Para extrair legendas e closed captions, use o YouTube Subtitles source.
Amostras de requisição
Os exemplos a seguir demonstram como recuperar a transcrição em inglês de um vídeo do YouTube, especificamente quando a transcrição foi fornecida pelo remetente.
curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
"source": "youtube_transcript",
"query": "WOD0mZnu-j0",
"context": [
{
"key": "language_code",
"value": "en"
},
{
"key": "transcript_origin",
"value": "uploader_provided"
}
]
}'import requests
from pprint import pprint
# Estruturar payload.
payload = {
'source': 'youtube_transcript',
'query': 'WOD0mZnu-j0',
'context': [
{
'key': 'language_code',
'value': 'en'
},
{
'key': 'transcript_origin',
'value': 'uploader_provided'
}
]
}
# Obter resposta.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('user', 'pass1'),
json=payload,
)
# Imprima a resposta JSON com o resultado.
pprint(response.json())Usamos o método de integração síncrono Realtime em nossos exemplos. Se você quiser usar Proxy Endpoint, ou integração assíncrona Push-Pull consulte os Métodos de Integração da seção.
Valores dos parâmetros da requisição
Genérico
source
Define o scraper.
youtube_transcript
query
ID do vídeo do YouTube.
-
contexto: language_code
Especifica o idioma da transcrição. Encontre os valores disponíveis aqui.
NOTA: Se o language_code for fornecido sem uma transcrição correspondente no vídeo do YouTube, o resultado retorna um 404 status.
-
contexto:
transcript_origin (opcional)
Especifica se deve recuperar transcrições que são auto_generated ou uploader_provided.
auto_generated
- parâmetro obrigatório
Atualizado
Isto foi útil?

