Documentation has been updated: see help center and changelog in one place.

解析函数列表

发现自定义解析器支持的完整函数列表:regex、XPath、CSS 等。

您可以在以下位置找到每个函数的用法示例: 解析函数示例 页面。

HTML 处理

element_text

  • 名称: element_text

  • 说明:从中提取文本 html。去除前导和末尾空白。

  • 参数:不适用

  • 有效输入类型: html

  • 预期输出类型: str

xpath

  • 名称: xpath

  • 说明:在给定输入值上执行 XPath 表达式。如果执行未产生结果,则使用数组中的下一个表达式。表达式中可以使用 XSLT 函数。支持 XPath 1.0。支持 XSLT 1.0。

  • 参数:

    • xpath_expressions

      • 类型: [str]

      • 必需: true

  • 有效输入类型:

    • html

  • 预期输出类型:

    • [str]

    • [html]

    • str

    • float

    • bool

xpath_one

  • 名称: xpath_one

  • 说明:与 xpath的工作方式相同,但即使提供的 XPath 选择了多个值,也只返回第一个值。

  • 参数:

    • xpath_expressions

      • 类型: [str]

      • 必需: true

  • 有效输入类型:

    • html

  • 预期输出类型:

    • str

    • html

    • str

    • float

    • bool

css

  • 名称: css

  • 说明:在给定输入值上执行 CSS 表达式。如果执行未产生结果,则使用数组中的下一个表达式。 请注意, css 函数的输出始终是包含 HTML 元素(包括起始和结束标签)的 JSON 数组。如果您想提取元素的内容,可以随后执行 element_text 函数。

  • 参数:

    • css_expressions

      • 类型: [str]

      • 必需: true

  • 有效输入类型:

    • html

  • 预期输出类型:

    • [html_element]

css_one

  • 名称: css_one

  • 说明:与 css,但即使提供的 CSS 表达式选择了多个值,也只返回第一个值。 请注意, css_one 函数的输出始终是一个 HTML 元素(包括起始和结束标签)。如果您想提取元素的内容,可以随后执行 element_text 函数。

  • 参数:

    • css_expressions

      • 类型: [str]

      • 必需: true

  • 有效输入类型:

    • html

  • 预期输出类型:

    • html_element

字符串操作

amount_from_string

  • 名称: amount_from_string

  • 说明:在字符串中查找首次出现的数值并将其转换为浮点数。

  • 参数:不适用

  • 有效输入类型:

    • str

  • 预期输出类型:

    • float

amount_range_from_string

  • 名称: amount_range_from_string

  • 说明:查找字符串中出现的所有数值并将它们转换为浮点数。

  • 参数:不适用

  • 有效输入类型:

    • str

  • 预期输出类型:

    • [float]

join

  • 名称: join

  • 说明:将字符串列表连接为单个字符串。连接后的值由 separator 值分隔。

  • 参数:

    • separator

      • 类型: str

      • 必填: false

      • 默认: ""

  • 有效输入类型:

    • [str]

  • 预期输出类型:

    • str

regex_find_all

  • 名称: regex_find_all

  • 说明:查找与给定正则表达式匹配的所有字符串。

  • 参数:

    • regex_pattern

      • 类型: str

      • 必填: true

  • 有效输入类型:

    • str

  • 预期输出类型:

    • [str]

  • 名称: regex_search

  • 说明:查找与给定正则表达式匹配的字符串。返回指定的匹配组(默认为 0).

  • 参数:

    • regex_pattern

      • 类型: str

      • 必填: true

    • group_to_return

      • 类型: int

      • 必填: false

      • 默认: 0

  • 有效输入类型:

    • str

  • 预期输出类型:

    • str

regex_substring

  • 名称: regex_substring

  • 说明:查找与给定正则表达式匹配的字符串。返回指定的匹配组(默认为 0).

  • 参数:

    • regex_pattern

      • 类型: str

      • 必填: true

    • group_to_return

      • 类型: int

      • 必填: false

      • 默认: 0

  • 有效输入类型:

    • str

  • 预期输出类型:

    • str

通用

length

  • 名称: length

  • 说明:获取数组的长度。如果输入为多维数组,则函数在最内层数组上工作。

  • 参数:不适用

  • 有效输入类型:

    • [OneDimensionalArray]

  • 预期输出类型:

    • int

select_nth

  • 名称: select_nth

  • 说明:返回第 n 个数组元素。使用零基索引。支持负索引以选择数组的最后一个(-1)、倒数第二个(-2)、… 项。

  • 参数:

    • index

      • 类型: int

      • 必填: true

  • 有效输入类型:

    • [AnyType]

  • 预期输出类型:

    • AnyType

convert_to_float

  • 名称: convert_to_float

  • 说明:将字符串或整数转换为浮点数。

  • 参数:不适用

  • 有效输入类型:

    • str

    • int

  • 预期输出类型:

    • float

convert_to_int

  • 名称: convert_to_int

  • 说明:将字符串或浮点数转换为整数。

  • 参数:不适用

  • 有效输入类型:

    • str

    • float

  • 预期输出类型:

    • int

convert_to_str

  • 名称: convert_to_str

  • 说明:将整数或浮点数转换为字符串。

  • 参数:不适用

  • 有效输入类型:

    • int

    • float

  • 预期输出类型:

    • 字符串

数学

average

  • 名称: average

  • 说明:计算数组中数值的平均值。

  • 参数:

    • round_precision

      • 类型: int

      • 必填: false

  • 有效输入类型:

    • [int]

    • [float]

  • 预期输出类型:

    • float

max

  • 名称: max

  • 说明:查找数组中的最大值。

  • 参数:不适用

  • 有效输入类型:

    • [float]

    • [int]

  • 预期输出类型:

    • float

    • int

min

  • 名称: min

  • 说明:查找数组中的最小值。

  • 参数:不适用

  • 有效输入类型:

    • [float]

    • [int]

  • 预期输出类型:

    • float

    • int

product

  • 名称: product

  • 说明:返回所有数组值的乘积。

  • 参数:不适用

  • 有效输入类型:

    • [float]

    • [int]

  • 预期输出类型:

    • float

    • int

最后更新于

这有帮助吗?