YouTube 下载器
了解如何使用 Web Scraper API 下载 YouTube 视频和音频内容。了解参数和云存储设置选项。
该 youtube_download 该 source 提供您所选 YouTube 视频的音/视频内容。请注意,由于数据量可能很大,此 source 仅可通过异步方式使用 Push-Pull integration 和 Cloud Storage 功能可用。
YouTube Downloader 的工作原理
通过 API 提交:
一个或多个 YouTube 视频 ID;
云存储详情。
获取 API 响应,确认您下载视频的请求已被成功接受。
在我们系统处理完视频后,尽快在指定的云存储位置获取视频。
注意:
下载器默认使用 720p 视频分辨率。如果 720p 不可用,下载器将选择低于 720p 的最佳可用质量。您可以使用
context: video_quality参数。您可以下载最长 3 小时的视频。
下载时间限制为 1 小时。
输入参数值
source
设置要使用的爬虫。
youtube_download
query
YouTube 视频 ID。
-
storage_type
云服务的存储类型(gcs, s3 或 s3_compatible)
-
storage_url
您希望将结果上传到的云存储位置的 bucket 名称(针对 AWS S3)或 URL(针对其他兼容 S3 的存储)。
-
context:
download_type
指定是下载 音频, 视频,或两者 - audio_video.
audio_video
context:
video_quality
设置视频质量: best, worst,或一个分辨率 - 480, 720, 1080, 1440, 2160(4K).
720
提交单个任务
端点
输入
按下面示例在 JSON 载荷中提供任务参数:
批量任务
您可以在单个批量请求中提交最多 5,000 个视频 ID。
端点
重要: 使用 /batch 端点时,您只能提交 query参数值。所有其他参数应为单一值。
输入
API 将以 JSON 对象响应,包含为每个创建的任务返回的任务信息。任务状态将为 pending 直到下载完成为止。
检查任务状态
如果您在提交任务时提供了有效的 回调 URL 我们将在完成后通过向指定的回调 URL 发送一个 JSON 载荷 来通知您。
但是,如果您提交任务时未使用 回调服务,您可以手动检查任务状态。从 href 字段中检索 URL,该字段位于提交任务后收到的响应消息的 rel:self 部分。用于检查任务状态的 URL 将类似于以下形式: http://data.oxylabs.io/v1/queries/12345678900987654321。查询此 URL 将返回任务信息,包括其当前 status.
端点
云存储
您可以将 YouTube 视频交付到 Google Cloud Storage, Amazon S3, Alibaba OSS, 或 其他兼容 S3 的云存储.
内容文件将出现在您的云存储位置,并将根据以下命名模式之一命名:
{video_id}_{job_id}.mp4– 视频 文件{video_id}_{job_id}.m4a– 音频 文件
存储参数
storage_type
您的云存储类型。
gcs (Google Cloud Storage);
s3 (AWS S3);
s3_compatible (其他兼容 S3 的存储解决方案)。
storage_url
您的云存储 URL
任意 s3 或 gcs 存储桶名称;
任意 s3-兼容 存储 URL。
Google Cloud Storage 设置
要将您的任务结果上传到 Google Cloud Storage 存储桶,请 为我们的服务 设置特殊权限 如我们在 Google Cloud Storage 文档.
Amazon S3 设置
要将作业结果上传到您的 Amazon S3 存储桶,请为我们的服务设置访问权限。为此,请前往 https://s3.console.aws.amazon.com/ → S3 → 存储 → 存储桶名称 (如果您没有,请新建一个) → 权限 → 存储桶策略.
使用下面的 bucket 策略(不要忘记在 YOUR_BUCKET_NAME):
此策略允许我们向您的 bucket 写入、向您授予对已上传文件的访问权限,并知道 bucket 的位置。
Alibaba Cloud OSS 设置
为了将结果保存到您的 Alibaba Cloud 对象存储服务 (OSS),您必须创建 ACCESS_KEY_ID 和 ACCESS_KEY_SECRET 并使用它们来形成存储 URL。请按照我们在 Alibaba Cloud OSS 文档 .
兼容 S3 的存储设置
如果您希望将结果交付到其他兼容 S3 的存储位置,您必须包含您桶的 ACCESS_KEY:SECRET 认证字符串中包含您的存储桶 storage_url 字段的值:
最后更新于
这有帮助吗?

