For the complete documentation index, see llms.txt. This page is also available as Markdown.

解析函数示例

自定义解析器 函数的实用示例,涵盖 HTML 处理、字符串操作、数学运算和常见解析任务。

HTML 处理

element_text

示例 HTML

<!DOCTYPE html>
<html>
<body>
    <div id="product">
        <div id="product-description">This is a nice product</div>
        <div id="product-price">    12  3


        </div>
    </div>
</body>
</html>

从 HTML 元素中提取文本并去除空白

{
    "price": {
        "_fns": [
            {
                "_fn": "xpath_one",
                "_args": [".//*[@id='product-price']"]
            },
            {
                "_fn": "element_text"
            }
        ]
    }
}

给定一个字符串值作为输入,什么也不做

xpath

示例 HTML

获取所有描述项

获取第一个描述项

检查描述区元素是否存在

将价格作为数字获取

当前表达式失败时可回退到的多个表达式

XPath | 用于匹配多个表达式的操作符

xpath_one

示例 HTML

返回第一个匹配项

使用 XSLT 函数

字符串操作

amount_from_string

示例 HTML

从字符串中提取金额

amount_range_from_string

示例 HTML

从字符串中提取所有金额

join

示例 HTML

将字符串数组合并为单个字符串

regex_find_all

示例 HTML

查找两个字符之间的所有匹配项

示例 HTML

返回两个字符之间的描述

regex_substring

示例 HTML

用指定值替换文本的一部分

通用函数

convert_to_*

示例 HTML

获取价格变体的数量

获取多维数组中价格变体的数量

示例 HTML:

select_nth

示例 HTML

从数组中选择第一个描述项

从数组中选择最后一个描述项

数学函数

average

示例 HTML

求所有列出价格的平均值

max

示例 HTML

求所有列出价格的最大值

min

示例 HTML

求所有列出价格的平均值

product

示例 HTML

获取不同产品变体的数量

这有帮助吗?