了解 网页爬虫API 的流量和计费、流量用量的计算方式,以及哪些结果会计费。
网页爬虫API 统计 结果. 结果 指从网页中成功获取的不同内容实体(例如网页 HTML)。
成功结果 (计费):目标网站中所有包含 2xx 或 4xx 状态码的结果都计为成功,并按计费处理。
2xx
4xx
失败结果 (不计费):其他结果都计为失败,不计费。
状态码 429 (请求过多)不计费。这通常发生在您超过速率限制时。如果您经常遇到这种情况,请联系您的客户经理以提高限制。
429
有关响应代码的更多信息,请参阅 响应代码表.
如果响应包含 2xx 或 4xx 状态码,且结果不包含预期信息,我们仍然将其计为成功结果。
您将按成功提取数据的结果数量计费。
由于我们系统错误导致的抓取失败尝试(5xx 和 6xx 状态码)不会被计入,您也无需为其付费。
5xx
6xx
如果请求因您一侧的故障或错误而导致失败,您仍然需要付费。
请查看下面的几个计费案例示例:
您创建了一个抓取任务,网页爬虫API 经过三次尝试才成功从网站获取到有效内容。您只会为最后一次成功尝试的结果付费。
您创建了一个因我们的错误而失败的抓取任务,例如我们已达到内部重试上限。在这种情况下,您无需为收到的结果付费。
您创建了一个因您一侧的错误而失败的抓取任务。您将为此结果付费。
这有帮助吗?