下载器

按视频 ID 下载 YouTube 音频和视频内容,视频质量可配置到 4K,并直接传送到你的云存储。

youtube_download 源提供您选择的 YouTube 视频的音频/视频内容。请注意,由于数据量可能很大,此源仅通过异步 Push-Pull 集成Cloud Storage 功能可用。

YouTube 下载器的工作原理

  1. 通过 API 提交:

    • 一个或多个 YouTube 视频 ID;

    • 云存储详细信息。

  2. 获取 API 响应,确认您下载视频的请求已成功被接受。

  3. 一旦我们系统处理完视频,即可在指定的云存储位置获取这些视频。

circle-check

输入参数值

参数
说明
默认值

source

设置爬虫来源。

youtube_download

query

YouTube 视频 ID。

-

storage_type

云服务的存储类型(gcs, s3s3_compatible)

-

storage_url

您希望将结果上传到的云存储位置的存储桶名称(针对 AWS S3)或 URL(针对其他 S3 兼容存储)。

-

callback_url

您的回调端点 URL。 更多信息

-

context: download_type

指定要下载 audio, video,或两者 - audio_video.

audio_video

context: video_quality

设置视频质量: best, worst,或一个分辨率 - 480, 720, 1080, 1440, 2160(4K).

720

提交单个作业

端点

输入

在 JSON 有效载荷中提供作业参数,如下例所示:

批量作业

您可以在单次批量请求中提交最多 5,000 个视频 ID。

端点

circle-exclamation

输入

API 将以 JSON 对象响应,其中包含为每个创建的作业返回的作业信息。作业状态将在 pending 直到下载完成为止。

检查作业状态

如果您在提交作业时提供了有效的 callback URL ,我们将在完成时通过向指定的回调 URL 发送一个 JSON 有效载荷来通知您。

然而,如果您在未使用 callback service的情况下提交了作业,您可以手动检查作业状态。从提交作业后收到的响应消息的 rel:self 部分的 href 字段中检索该 URL。用于检查作业状态的 URL 将类似于以下内容: http://data.oxylabs.io/v1/queries/12345678900987654321请求该 URL 将返回作业信息,包括其当前 status.

端点

云存储

您可以将 YouTube 视频传送到 Google Cloud Storage, Amazon S3, Alibaba OSS, 其他 S3 兼容云存储.

内容文件将出现在您的云存储位置,并将根据以下命名模式之一命名:

  • {video_id}_{job_id}.mp4 – 对于视频

  • {video_id}_{job_id}.m4a – 对于音频

存储参数

参数
说明
有效值

storage_type

您的云存储类型。

gcs (Google Cloud Storage);

s3 (AWS S3); s3_compatible (其他 S3 兼容存储解决方案)。

storage_url

您的云存储 URL

任意 s3gcs 存储桶名称;

任意 s3-compatible 存储 URL。

Google Cloud Storage 设置

要将作业结果上传到您的 Google Cloud Storage 存储桶,请 为我们的服务设置特殊权限 ,如我们的 Google Cloud Storage documentation.

Amazon S3 设置

要将作业结果上传到您的 Amazon S3 存储桶,请为我们的服务设置访问权限。为此,请前往 https://s3.console.aws.amazon.com/arrow-up-rightS3存储Bucket Name (如果您没有,请创建一个新的)权限存储桶策略.

使用下面的存储桶策略(不要忘记在 YOUR_BUCKET_NAME):

"Resource": "arn:aws:s3:::YOUR_BUCKET_NAME/*"

此策略允许我们向您的存储桶写入,向您授予对已上传文件的访问权限,并知道存储桶的位置。

Alibaba Cloud OSS 设置 为了将结果保存到您的 Alibaba Cloud 对象存储服务 (OSS),您必须创建 ACCESS_KEY_ID ACCESS_KEY_SECRET 并使用它们来形成存储 URL。请按照我们的 .

"storage_url": "https://ACCESS_KEY_ID:ACCESS_KEY_SECRET@BUCKET_NAME.oss-REGION.aliyuncs.com/FOLDER_NAME"

S3 兼容存储设置 如果您希望将结果传送到其他 S3 兼容的存储位置,您需要在有效载荷的 value 中包含您存储桶的 storage_url ACCESS_KEY:SECRET

最后更新于

这有帮助吗?