使用统计
了解如何使用简单请求检查网页爬虫 API 的使用统计。
您可以通过提交免费检查您的使用统计信息 一个 API 请求。
以下端点用于使用统计查询:
GET https://data.oxylabs.io/v2/stats输入
默认情况下,API 将返回未过滤的(所有时间、所有来源)使用统计。如果需要,您可以获取分组和/或过滤后的统计信息。
您可以在同一查询中组合两个或更多参数,例如按天分组统计并按来源过滤。
group_by
启用显示每日、每月或每年使用统计(而不是显示总计统计)
天, 月, 年
https://data.oxylabs.io/v2/stats?group_by=day
date_from
较低的日期边界。最好与以下一起使用 date_to.
任意日期,格式为 Y-m-d 格式。
https://data.oxylabs.io/v2/stats?date_from=2022-01-17
date_to
较高的日期边界。最好与以下一起使用 date_from.
任意日期,格式为 Y-m-d 格式。
https://data.oxylabs.io/v2/stats?date_to=2022-06-17
source
允许您获取单个的使用统计 source 您选择的。
任何有效的 source 值分隔。
https://data.oxylabs.io/v2/stats?source=universal
product
此过滤器适用于遗留用户(在 2024 年 9 月 25 日之前创建的账户)。
允许您获取所选单个产品的使用统计。仅在您使用相同用户名访问多个网页爬虫 API 时适用。
serp_scraper_api;
ecommerce_scraper_api ; web_scraper_api
https://data.oxylabs.io/v2/stats?product=serp_scraper_api
下面的查询返回每月统计。
curl --user "user:pass1" 'https://data.oxylabs.io/v2/stats?group_by=month'import requests
from pprint import pprint
# 从统计端点获取响应。
response = requests.request(
method='GET',
url='https://data.oxylabs.io/v2/stats',
auth=('user', 'pass1'),
)
# 将美化后的 JSON 响应打印到 stdout。
pprint(response.json())<?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://data.oxylabs.io/v2/stats");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CUSTOMREQUEST, "GET");
curl_setopt($ch, CURLOPT_USERPWD, "user" . ":" . "pass1");
$result = curl_exec($ch);
echo $result;
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close ($ch);
?>输出
该 v2/stats 输出包含使用统计信息,包括产品级别统计(电商爬虫 API / SERP 爬虫 API / 网页爬虫 API)。产品级统计被分解为来源级统计,进一步分为 HTML 和解析结果的单独统计。参见 数据字典 部分以了解每个输出键的含义。
示例输出
{
"meta": {
"group_by": null,
"date_from": null,
"date_to": null,
"source": null,
"product": null
},
"data": {
"products": [
{
"all_count": 5837,
"mode_callback_count": 5514,
"mode_realtime_count": 315,
"mode_superapi_count": 8,
"contenttype_parsed_count": 56,
"contenttype_html_count": 5781,
"render_count": 3,
"geo_location_count": 2330,
"average_response_time": 88.54,
"request_traffic": 4685091,
"response_traffic": 602064208,
"title": "serp_scraper_api",
"sources": [
{
"all_count": 5616,
"mode_callback_count": 5414,
"mode_realtime_count": 194,
"mode_superapi_count": 8,
"render_count": 0,
"geo_location_count": 2190,
"average_response_time": 91.59,
"request_traffic": 4550507,
"response_traffic": 585423946,
"title": "serp_source1",
"parsed": false
},
{
"all_count": 1,
"mode_callback_count": 0,
"mode_realtime_count": 1,
"mode_superapi_count": 0,
"render_count": 0,
"geo_location_count": 1,
"average_response_time": 11,
"request_traffic": 0,
"response_traffic": 0,
"title": "serp_source2",
"parsed": false
}
]
}
]
}
}数据字典
data
所有统计数据的容器。
JSON 对象
products
产品级统计对象的列表。
JSON 数组
all_count
结果的总数量。
整数
mode_callback_count
通过 Push-Pull 集成方法满足的结果数量。
整数
mode_realtime_count
通过 Realtime 集成方法满足的结果数量。
整数
mode_superapi_count
通过 Proxy Endpoint 集成方法满足的结果数量。
整数
contenttype_parsed_count
解析结果的数量。
整数
contenttype_html_count
HTML 结果的数量。
整数
render_count
通过执行 JavaScript 满足的结果数量。
整数
geo_location_count
通过用户定义的 geo_location 参数值满足的结果数量。
整数
average_response_time
平均响应时间(秒)。
浮点数
request_traffic
总 request 流量(字节)。
整数
response_traffic
总 响应的 流量(字节)。
整数
title
产品或来源名称。
字符串
sources
属于特定产品的来源列表。
字符串
parsed
指示 JSON 对象中的数据是否涉及解析结果。
布尔值
最后更新于
这有帮助吗?

