Lista de funções de parsing
Descubra a lista completa de funções suportadas pelo Custom Parser: regex, XPath, CSS e mais.
Você pode encontrar exemplos de uso de cada função em Exemplos de funções de parsing página.
Processamento de HTML
element_text
element_textNome:
element_textDescrição: Extrai texto de
html. Remove espaços em branco no início e no fim.Args: n/a
Tipos de entrada válidos:
htmlTipos de saída esperados:
str
xpath
xpathNome:
xpathDescrição: Executa uma expressão XPath no valor de entrada fornecido. Se a execução não produzir um resultado, a expressão seguinte no array é usada. Funções XSLT podem ser usadas nas expressões. XPath versão 1.0 é suportado. XSLT versão 1.0 é suportado.
Args:
xpath_expressionsTipo:
[str]Obrigatório:
true
Tipos de entrada válidos:
html
Tipos de saída esperados:
[str][html]strfloatbool
xpath_one
xpath_oneNome:
xpath_oneDescrição: Funciona da mesma forma que
xpath, mas retorna apenas o primeiro valor mesmo que mais de um valor seja selecionado pelo XPath fornecido.Args:
xpath_expressionsTipo:
[str]Obrigatório:
true
Tipos de entrada válidos:
html
Tipos de saída esperados:
strhtmlstrfloatbool
css
cssNome:
cssDescrição: Executa uma expressão CSS no valor de entrada fornecido. Se a execução não produzir um resultado, a expressão seguinte no array é usada. Por favor, note que a saída da
cssfunção sempre é um array JSON contendo elementos HTML (incluindo tags de abertura e fechamento). Se você estiver interessado em extrair o conteúdo do elemento, você pode executar aelement_textfunção depois.Args:
css_expressionsTipo:
[str]Obrigatório:
true
Tipos de entrada válidos:
html
Tipos de saída esperados:
[html_element]
css_one
css_oneNome:
css_oneDescrição: Funciona da mesma forma que
css, mas retorna apenas o primeiro valor mesmo que mais de um valor seja selecionado pela expressão CSS fornecida. Por favor, note que a saída dacss_onefunção sempre é um elemento HTML (incluindo tags de abertura e fechamento). Se você estiver interessado em extrair o conteúdo do elemento, você pode executar aelement_textfunção depois.Args:
css_expressionsTipo:
[str]Obrigatório:
true
Tipos de entrada válidos:
html
Tipos de saída esperados:
html_element
Manipulação de strings
amount_from_string
amount_from_stringNome:
amount_from_stringDescrição: Encontra a primeira ocorrência de um valor numérico em uma string e o converte para float.
Args: n/a
Tipos de entrada válidos:
str
Tipos de saída esperados:
float
amount_range_from_string
amount_range_from_stringNome:
amount_range_from_stringDescrição: Encontra todas as ocorrências de valores numéricos em uma string e as converte para floats.
Args: n/a
Tipos de entrada válidos:
str
Tipos de saída esperados:
[float]
join
joinNome:
joinDescrição: Junta uma lista de strings em uma única string. Os valores unidos são separados pelo
separatorvalor.Args:
separatorTipo:
strObrigatório:
falsePadrão:
""
Tipos de entrada válidos:
[str]
Tipos de saída esperados:
str
regex_find_all
regex_find_allNome:
regex_find_allDescrição: Encontra todas as strings que casam com uma expressão RegEx dada.
Args:
regex_patternTipo:
strObrigatório:
true
Tipos de entrada válidos:
str
Tipos de saída esperados:
[str]
regex_search
regex_searchNome:
regex_searchDescrição: Encontra uma string que corresponda à expressão RegEx fornecida. Retorna o grupo correspondente especificado (padrão é
0).Args:
regex_patternTipo:
strObrigatório:
true
group_to_returnTipo:
intObrigatório:
falsePadrão:
0
Tipos de entrada válidos:
str
Tipos de saída esperados:
str
regex_substring
regex_substringNome:
regex_substringDescrição: Encontra uma string que corresponda à expressão RegEx fornecida. Retorna o grupo correspondente especificado (padrão é
0).Args:
regex_patternTipo:
strObrigatório:
true
group_to_returnTipo:
intObrigatório:
falsePadrão:
0
Tipos de entrada válidos:
str
Tipos de saída esperados:
str
Comum
length
lengthNome:
lengthDescrição: Obtém o comprimento do array. Se um array multidimensional for fornecido como entrada, a função operará no array mais interno.
Args: n/a
Tipos de entrada válidos:
[OneDimensionalArray]
Tipos de saída esperados:
int
select_nth
select_nthNome:
select_nthDescrição: Retorna o enésimo elemento do array. Indexação baseada em zero é usada. Suporta índices negativos para selecionar o último (
-1), penúltimo (-2), … item de um array.Args:
indexTipo:
intObrigatório:
true
Tipos de entrada válidos:
[AnyType]
Tipos de saída esperados:
AnyType
convert_to_float
convert_to_floatNome:
convert_to_floatDescrição: Converte uma string ou um int para float.
Args: n/a
Tipos de entrada válidos:
strint
Tipos de saída esperados:
float
convert_to_int
convert_to_intNome:
convert_to_intDescrição: Converte uma string ou um float para int.
Args: n/a
Tipos de entrada válidos:
strfloat
Tipos de saída esperados:
int
convert_to_str
convert_to_strNome:
convert_to_strDescrição: Converte um int ou um float para string.
Args: n/a
Tipos de entrada válidos:
intfloat
Tipos de saída esperados:
string
Matemática
average
averageNome:
averageDescrição: Calcula a média dos valores em um array.
Args:
round_precisionTipo:
intObrigatório:
false
Tipos de entrada válidos:
[int][float]
Tipos de saída esperados:
float
max
maxNome:
maxDescrição: Encontra o maior valor em um array.
Args: n/a
Tipos de entrada válidos:
[float][int]
Tipos de saída esperados:
floatint
min
minNome:
minDescrição: Encontra o menor valor em um array.
Args: n/a
Tipos de entrada válidos:
[float][int]
Tipos de saída esperados:
floatint
product
productNome:
productDescrição: Retorna o produto da multiplicação de todos os valores do array.
Args: n/a
Tipos de entrada válidos:
[float][int]
Tipos de saída esperados:
floatint
Atualizado
Isto foi útil?

