Documentation has been updated: see help center and changelog in one place.

使用统计

了解如何使用简单请求检查网页爬虫 API 的使用统计。

您可以通过提交免费检查您的使用统计信息 一个 API 请求。

以下端点用于使用统计查询:

GET https://data.oxylabs.io/v2/stats

输入

默认情况下,API 将返回未过滤的(所有时间、所有来源)使用统计。如果需要,您可以获取分组和/或过滤后的统计信息。

您可以在同一查询中组合两个或更多参数,例如按天分组统计并按来源过滤。

参数
说明
有效值
URL 示例

group_by

启用显示每日、每月或每年使用统计(而不是显示总计统计)

, ,

https://data.oxylabs.io/v2/stats?group_by=day

date_from

较低的日期边界。最好与以下一起使用 date_to.

任意日期,格式为 Y-m-d 格式。

https://data.oxylabs.io/v2/stats?date_from=2022-01-17

date_to

较高的日期边界。最好与以下一起使用 date_from.

任意日期,格式为 Y-m-d 格式。

https://data.oxylabs.io/v2/stats?date_to=2022-06-17

source

允许您获取单个的使用统计 source 您选择的。

任何有效的 source 值分隔。

https://data.oxylabs.io/v2/stats?source=universal

product 此过滤器适用于遗留用户(在 2024 年 9 月 25 日之前创建的账户)。

允许您获取所选单个产品的使用统计。仅在您使用相同用户名访问多个网页爬虫 API 时适用。

serp_scraper_api;

ecommerce_scraper_api ; web_scraper_api

https://data.oxylabs.io/v2/stats?product=serp_scraper_api

下面的查询返回每月统计。

curl --user "user:pass1" 'https://data.oxylabs.io/v2/stats?group_by=month'

输出

v2/stats 输出包含使用统计信息,包括产品级别统计(电商爬虫 API / SERP 爬虫 API / 网页爬虫 API)。产品级统计被分解为来源级统计,进一步分为 HTML 和解析结果的单独统计。参见 数据字典 部分以了解每个输出键的含义。

示例输出

{
    "meta": {
        "group_by": null,
        "date_from": null,
        "date_to": null,
        "source": null,
        "product": null
    },
    "data": {
        "products": [
            {
                "all_count": 5837,
                "mode_callback_count": 5514,
                "mode_realtime_count": 315,
                "mode_superapi_count": 8,
                "contenttype_parsed_count": 56,
                "contenttype_html_count": 5781,
                "render_count": 3,
                "geo_location_count": 2330,
                "average_response_time": 88.54,
                "request_traffic": 4685091,
                "response_traffic": 602064208,
                "title": "serp_scraper_api",
                "sources": [
                    {
                        "all_count": 5616,
                        "mode_callback_count": 5414,
                        "mode_realtime_count": 194,
                        "mode_superapi_count": 8,
                        "render_count": 0,
                        "geo_location_count": 2190,
                        "average_response_time": 91.59,
                        "request_traffic": 4550507,
                        "response_traffic": 585423946,
                        "title": "serp_source1",
                        "parsed": false
                    },
                    {
                        "all_count": 1,
                        "mode_callback_count": 0,
                        "mode_realtime_count": 1,
                        "mode_superapi_count": 0,
                        "render_count": 0,
                        "geo_location_count": 1,
                        "average_response_time": 11,
                        "request_traffic": 0,
                        "response_traffic": 0,
                        "title": "serp_source2",
                        "parsed": false
                    }
                ]
            }
        ]
    }
}

数据字典

说明
类型

meta

所有提交统计的容器 查询参数.

-

data

所有统计数据的容器。

JSON 对象

products

产品级统计对象的列表。

JSON 数组

all_count

结果的总数量。

整数

mode_callback_count

通过 Push-Pull 集成方法满足的结果数量。

整数

mode_realtime_count

通过 Realtime 集成方法满足的结果数量。

整数

mode_superapi_count

通过 Proxy Endpoint 集成方法满足的结果数量。

整数

contenttype_parsed_count

解析结果的数量。

整数

contenttype_html_count

HTML 结果的数量。

整数

render_count

通过执行 JavaScript 满足的结果数量。

整数

geo_location_count

通过用户定义的 geo_location 参数值满足的结果数量。

整数

average_response_time

平均响应时间(秒)。

浮点数

request_traffic

request 流量(字节)。

整数

response_traffic

响应的 流量(字节)。

整数

title

产品或来源名称。

字符串

sources

属于特定产品的来源列表。

字符串

parsed

指示 JSON 对象中的数据是否涉及解析结果。

布尔值

最后更新于

这有帮助吗?