流量与计费

了解 网页爬虫API 的流量和计费、流量用量的计算方式,以及哪些结果会计费。

流量用量

网页爬虫API 统计 结果. 结果 指从网页中成功获取的不同内容实体(例如网页 HTML)。

  • 成功结果 (计费):目标网站中所有包含 2xx4xx 状态码的结果都计为成功,并按计费处理。

  • 失败结果 (不计费):其他结果都计为失败,不计费。

状态码 429 (请求过多)不计费。这通常发生在您超过速率限制时。如果您经常遇到这种情况,请联系您的客户经理以提高限制。

有关响应代码的更多信息,请参阅 响应代码表.

计费

您将按成功提取数据的结果数量计费。

由于我们系统错误导致的抓取失败尝试(5xx6xx 状态码)不会被计入,您也无需为其付费。

请查看下面的几个计费案例示例:

案例示例 #1 - 成功的抓取尝试

您创建了一个抓取任务,网页爬虫API 经过三次尝试才成功从网站获取到有效内容。您只会为最后一次成功尝试的结果付费。

Case 1

案例示例 #2 - 因我们的错误导致抓取失败

您创建了一个因我们的错误而失败的抓取任务,例如我们已达到内部重试上限。在这种情况下,您无需为收到的结果付费。

Case 2

案例示例 #3 - 因客户端错误导致抓取失败

您创建了一个因您一侧的错误而失败的抓取任务。您将为此结果付费。

Case 3

这有帮助吗?