YouTube 下载器
了解如何使用 网页爬虫 API 下载 YouTube 视频和音频内容。了解其参数和云存储设置选项。
该 youtube_download source 提供您选择的 YouTube 视频的音频/视频内容。请注意,由于可能存在的大量数据,此来源仅通过异步 Push-Pull 集成 和 云存储 功能 可用。
如需 YouTube 下载器的免费试用,请与我们的 销售团队.
YouTube 下载器的工作原理
通过 API 提交:
一个或多个 YouTube 视频 ID;
云存储详情。
获取 API 响应,确认您的下载视频请求已成功被接受。
一旦我们系统处理完毕,您即可在指定的云存储位置获取视频。
注意:
下载器默认使用 720p 视频分辨率。如果 720p 不可用,下载器将选择低于 720p 的最佳可用质量。您可以使用
context: video_quality参数来覆盖此行为。您可以下载最多 12 小时长度的视频。
下载时间限制为 1 小时。
输入参数值
source
设置爬虫。
youtube_download
query
YouTube 视频 ID。
-
storage_type
云服务的存储类型(gcs, s3 或 s3_compatible)
-
storage_url
您希望将结果上传到的云存储位置的存储桶名称(适用于 AWS S3)或 URL(适用于其他兼容 S3 的存储)。
-
context:
download_type
指定是下载 audio, video,或两者 - audio_video.
audio_video
context:
video_quality
设置视频质量: best, worst,或一个分辨率 - 480, 720, 1080, 1440, 2160(4K).
720
提交单个作业
端点
输入
按下面示例在 JSON 有效载荷中提供作业参数:
批量作业
在单个批量请求中,您最多可以提交 5,000 个视频 ID。
端点
重要: 使用 /batch 端点时,您只能提交 query参数值的列表。所有其他参数应为单一值。
输入
API 将以 JSON 对象响应,包含为每个创建的作业的信息。作业状态将在 pending 直到下载完成为止。
检查作业状态
如果您在提交作业时提供了有效的 回调 URL 我们将在完成时通过向指定的回调 URL 发送一个 JSON 载荷 来通知您。
但是,如果您在提交作业时未使用 回调 服务,您可以手动检查作业状态。请从提交作业后收到的响应消息的 href 字段中检索 URL,位于 rel:self 部分。用于检查作业状态的 URL 将类似于以下内容: http://data.oxylabs.io/v1/queries/12345678900987654321查询该 URL 将返回作业信息,包括其当前 status.
端点
云存储
您可以将 YouTube 视频交付到 Google Cloud Storage, Amazon S3, Alibaba OSS, 或 其他兼容 S3 的云存储.
内容文件将出现在您的云存储位置,并将根据以下其中一种命名模式命名:
{video_id}_{job_id}.mp4– 用于视频{video_id}_{job_id}.m4a– 用于音频
存储参数
storage_type
您的云存储类型。
gcs (Google Cloud Storage);
s3 (AWS S3);
s3_compatible (其他兼容 S3 的存储解决方案)。
storage_url
您的云存储 URL
任何 s3 或 gcs 存储桶名称;
任何 s3-compatible 存储 URL。
Google Cloud Storage 设置
要将作业结果上传到您的 Google Cloud Storage 存储桶,请为我们的服务 设置特殊权限 如我们在 Google Cloud Storage 文档.
"storage_url": "bucket_name/path"
Amazon S3 设置 要将作业结果上传到您的 Amazon S3 存储桶,请为我们的服务设置访问权限。为此,请前往 https://s3.console.aws.amazon.com/ → https://s3.console.aws.amazon.com/ S3 https://s3.console.aws.amazon.com/ 存储 存储桶名称 https://s3.console.aws.amazon.com/ (如果您没有,请创建一个新的) https://s3.console.aws.amazon.com/ 权限.
存储桶策略 使用下面的存储桶策略(别忘了在):
"s3:PutObjectAcl"
"Resource": "arn:aws:s3:::YOUR_BUCKET_NAME/*"
此策略允许我们向您的存储桶写入,为您提供对已上传文件的访问,并了解存储桶的位置。 Alibaba Cloud OSS 设置 为了将结果保存到您的 Alibaba Cloud 对象存储服务 (OSS),您必须创建 ACCESS_KEY_ID 和 ACCESS_KEY_SECRET .
中概述的说明操作
"storage_type": "s3_compatible", "storage_url": "https://ACCESS_KEY_ID:ACCESS_KEY_SECRET@BUCKET_NAME.oss-REGION.aliyuncs.com/FOLDER_NAME" 兼容 S3 的存储设置 storage_url 如果您希望将结果交付到其他兼容 S3 的存储位置,您需要在有效载荷的
最后更新于
这有帮助吗?

