Finside 财芯 文档中心
首页智算智数智视
首页智算智数智视
财芯官网
  1. 财务算子智能建模
  • 财芯简介
  • 开始使用
    • 登录
    • 首页
    • 个人中心
  • 智算
    • 认识算法中心
      • 操作栏
      • 算子选择区
      • 画布区
      • 算子配置区
      • 数据预览区
      • 图层管理区
    • 财务算子智能建模
      • 新建算子流
      • 输入输出
      • 数据准备
      • 数据关联
      • 数据转换
      • 数据质量
      • 扩展编程
      • 文档辅助
      • Python自定义算子
    • 算子流协同组合运算
      • 组合执行
      • 计划执行
  • 智数
    • 数据网盘
    • 我的数据
      • 新增数据源
      • 上传记录
      • 导入记录
      • 数据管理
      • 转交全部文件
      • 切换视图
    • 算子流
      • 管理算子流
      • 导入算子流
      • 运行记录
      • 转交全部文件
      • 切换视图
    • 数据连接
      • 新增数据连接
      • 管理数据连接
      • 导入数据连接
      • 转交所有文件
      • 切换视图
    • 我的报表
      • 管理报表
      • 导入报表
      • 转交全部文件
      • 切换视图
    • 数据分享
      • 我的分享
      • 分享给我
    • 回收站
  • 智视
    • 大屏
      • 大屏管理
      • 组件配置
      • 数据管理
    • BI
      • 工作表
      • 数据关联
      • 看板
      • 看板组件配置
      • 图文报告
      • 大屏与BI组合配置
首页智算智数智视
首页智算智数智视
财芯官网
  1. 财务算子智能建模

数据准备

数据接入后,可通过数据准备算子进行数据的清洗与初步标准化处理。
数据准备算子包括字段选择、数据清理、排序、空值填充、过滤、添加列、删除重复项、查找替换、文本分割、文本拼接、字段长度统计、数值公式计算、日期格式转换、日期提取、动态日期、日期偏移、日期差、唯一ID、条件标签等多种算子。
图片1.png

字段选择#

字段选择算子可以选择为之后的运算保留哪些字段,并可修改字段类型,调整数值类字段的精度,还能调整字段顺序和对字段进行重命名。
算子配置说明如下:
字段名称
展示字段的原名称。
目标类型
调整字段类型,支持选择文本、数值和日期时间三类。
小数位
如果字段是数值格式,可选择保留数值的小数位,通常默认为4位,最大可保留10位。
重命名
可对字段进行重命名。
快速任务
请将《财务部员工信息表》中“员工姓名”字段名修改为“姓名”,去除“电子邮箱地址”字段,将“司龄”字段类型修改为“数值”,并调整起顺序至“政治面貌”字段前。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,在左侧算子配置区依次点击“数据网盘”“我的数据”,选择《财务部员工信息表》,勾选全部字段,点击“保存配置”。
3
操作三
从算子选择区将“字段选择”算子拖拽至画布区,连接“字段选择”算子与“数据输入”算子。
4
操作四
点击“字段选择”算子,打开左侧算子配置区,完成以下操作:
将“员工姓名”字段“重命名”处输入“姓名”;取消“电子邮箱地址”字段选中;
将“司龄”字段的目标类型选择为“数值”,小数位修改为“0”;
鼠标悬浮“司龄”字段上,当鼠标光标变为十字箭头形状,拖动字段“司龄”至“政治面貌”上方。
完成以上操作后,点击“保存配置”。
图片40.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

数据清理#

数据清理算子可以用于对指定字段进行清理和加工,通过数据清理算子可一键去除指定字段中不规范内容,在处理过程中只会清理所勾选的字段中的指定清除内容,表中的其他字段不会受影响,输出的结果直接覆盖在原列内容上。
算子说明如下:
移除NULL行
清除数值均为空的数据行。
移除NULL列
清除数值均为空的数据列。
制表符(TAB)
将所选列中存在的制表符(TAB)清除。
特殊符号(全)
将所选列中存在的特殊字符清除
包括:“ " E ' [ \ ] < > @ # $ % …… & * ^ , ? ! : ; ( ) { } / \ \ , 。 ! ? ; : 、 “ ” ( ) \ " ‘ ’ 【 】 | ~ · … _ ─ - — - ] * ' " ” 。
前后空格
将所选列中数据中的前后空格清除。
特殊符号(用户输入)
允许用户手动输入需要进行清洗的符号,支持新增多个需要进行清洗的符号。
选择清理的列
选择需要清洗的目标类型为文本的字段进行清理,目标类型为数值或者日期时间的字段不可选择。
快速任务
请使用数据清理算子对Excel文件《财务部员工信息表》“最高教育程度”字段中的特殊符号“&”进行清理。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,在左侧算子配置区依次点击“数据网盘”“我的数据”,选择《财务部员工信息表》,勾选全部字段,点击“保存配置”。
3
操作三
从算子选择区将“数据清理”算子拖拽至画布区,连接“数据清理”算子与“数据输入”算子。
4
操作四
点击“数据清理”算子,在左侧算子配置区的“选择需要清除的内容”勾选“特殊符号(用户输入)”,在下方输入栏内输入“&”,“选择清理的列”勾选“最高教育程度”列,点击“保存配置”。
图片39.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

排序#

排序算子可以根据升序或降序对数据表中数据进行排序,可同时选择多个字段作为排序字段,排序算子将按顺序依次排序,并可以对输出个数进行限制。
算子配置说明如下:
分组排序
勾选分组排序后,可选择分组字段,算子会按照分组字段排序,再按照排序字段各组内排序。
当选择了分组排序,限制输出个数为每组的保留个数,否则,为所有数据的保留个数;
当选择了分组排序,排序号值为每组以1为始自增1,否则,从第一条输出数据以1为始自增1;
当分组字段与排序字段重合时,分组字段会以指定的方向排列,否则,以升序方式排列。
排序字段
选择排序字段。
次序
选择排序方式,可选择“升序”“降序”“自定义序列”三种排序方式。
只有当字段是文本类型时,可选择“自定义序列”。
自定义序列
输入序列关键字,算子会按照关键字进行排序,多个关键字使用英文分号隔开。
勾选“是否限制输出个数”
限制输出数量,可自定义输出个数,不修改自定义值的话则默认输出数为20条。
勾选“增加排序号字段到输出”
自定义排序字段,并输出该字段。
快速任务
请使用排序算子对Excel文件《财务部员工信息表》中的“司龄”字段进行降序排序。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,在左侧算子配置区依次点击“数据网盘”“我的数据”,选择《财务部员工信息表》,勾选全部字段,将字段“司龄”的目标类型修改为数值,点击“保存配置”。
3
操作三
从算子选择区将“排序”算子拖拽至画布区,连接“排序”算子与“数据输入”算子。
4
操作四
点击“排序”算子,左侧算子配置区“排序字段”选择“司龄”,“次序”选择“降序”,点击“保存配置”。
图片3.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

空值填充#

空值填充算子可以在数据表中指定字段空值处填充指定数据或参数,字段类型不限。
快速任务
请使用空值填充算子对Excel文件“差旅费报销数据.xlsx”的“业务类型”字段进行填充,将所有空值填充为“国内差旅费”。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“差旅费报销数据.xlsx”。
3
操作三
从算子选择区将“空值填充”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“空值填充”算子,将左侧算子配置区字段“业务类型”的填充值输入为“国内差旅费”,点击“保存配置”。
图片4.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

过滤#

过滤算子可以对数据进行筛选,保留业务处理中需要的有效数据。可以对每一条字段进行精准地筛选定义,支持同时定义多组过滤条件,并支持设置“且”与“或”两类条件关系。配置完成后,算子会根据设定的过滤条件,将符合条件的数据输出至过滤算子的输出端。
在算子配置过程中,支持使用值与字段两种方式配置过滤条件,但只能选择使用其中一种。若条件为“为空”或“不为空”时,无需填写值或者选择字段;若条件为“属于”或“不属于”时,只可填写值为条件,不可选择字段作为条件。
算子配置说明如下:
且&或
选择条件间的关系,同一组内的条件是且的关系,不同组之间的条件是或的关系。
过滤字段
选择用于过滤数值的字段,一个条件只能选取一个过滤字段。
条件
支持选择不同条件,比较过滤字段的数值和值之间的差别,比如选择过滤字段为年级,条件选择“属于”,值输入为“高一”和“高二”,算子即可过滤全部年级为高一或高二的数据。
目标类型为文本的字段支持选择为空/不为空、包含/不包含、属于/不属于和等于/不等于四类;
目标类型为数值和日期时间的字段支持选择为空/不为空、等于/不等于、大于/大于等于、小于/小于等于。
以下是对每种条件的详细说明:
为空/不为空:过滤指定字段下数值为空或者不为空的数据;
包含/不包含:过滤指定字段下数值包含指定值或者不包含的数据;
属于/不属于:“属于”条件可过滤指定字段下数值等于指定的一个或多个值中任意一个值的数据,“不属于”条件可过滤指定字段下的数值不等于全部值的数据;
等于/不等于:“等于”条件可过滤指定字段下数值和指定值完全相等的数据,“不等于”条件可以过滤字段值的字符与指定值不相等的数据;
大于/大于等于:过滤指定字段下数值大于/大于等于指定值的数据;
小于/小于等于:过滤指定字段下数值小于/小于等于指定值的数据。
若条件为“为空”或“不为空”时,无需填写过滤值或者选择字段;若条件为“属于”或“不属于”时,只可使用值进行过滤,不可选择字段过滤。
值
可通过自定义输入或引用参数设置过滤值。
自定义输入:可自行输入过滤值,可设置多个值,值与值之间使用英文分号隔开;
引用参数:可新增或者引用参数作为过滤值。
字段
支持选择字段,用字段下的值作为过滤值,适用于对比列数据,例如比较多位学生的英语成绩是否比数学成绩高,而非对比单个数值时,就可以选择英语成绩作为过滤字段,条件选择大于,字段选择数学成绩。
图片5.png
删除该条件行。
图片6.png
复制该条件行。
图片7.png
在同一条件组内新增条件。
图片8.png
新增条件组,该条件组与其他条件组为或的关系。
快速任务
请筛选《财务部员工信息表》中政治面貌为“中共党员”且婚姻状况为“已婚”的员工。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,在左侧算子配置区依次点击“数据网盘”“我的数据”,选择《财务部员工信息表》,勾选全部字段,点击“保存配置”。
3
操作三
从算子选择区将“过滤”算子拖拽至画布区,连接“过滤”算子与“数据输入”算子。
4
操作四
点击“过滤”算子,左侧算子配置区“过滤字段”中选择“政治面貌”,“条件”选择“等于”,在“值”输入栏内输入“中共党员”;点击“+”,“过滤字段”选择“婚姻状况”,“条件”选择“等于”,在“值”输入栏内输入“已婚”,点击“保存配置”。
图片9.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

添加列#

添加列算子可以在数据表中新增列,满足数据处理需要。支持一次新增多列,并定义每一列的字段类型,用于补充数据或给数据打标签等场景。
算子配置说明如下:
列名
输入新列的名称。
类型
选择新列的目标类型。
填充值
如果添加新列时,不填写填充值,则新增列中的数据默认为空值;若填写填充值,则默认该列下值均为填充值。
填充值既支持手动输入数值,也支持选择参数填充,可通过点击按钮切换。
图片10.png
删除该新增列。
+增加
点击添加新列。
快速任务
请使用添加列算子对Excel文件“差旅费报销数据.xlsx”添加日期时间类型的新列“数据日期”,并通过设置参数填充列值为当前时间。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“差旅费报销数据.xlsx”。
3
操作三
从算子选择区将“添加列”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“添加列”算子,左侧算子配置区列名处输入“数据日期”,类型选择“日期时间”,点击填充值输入框旁的图片7.png按钮,切换为引用参数,选择参数“当前日期时间”,点击“保存配置”。
图片11.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

删除重复项#

删除重复项算子可对所选字段下多行重复的数据进行删除,只保留一条数据,用户可任意指定作为去重依据的字段或字段组合,当选择多个字段组合时,只有所有指定字段下值都相同,算子才会认为其为重复数据。
此外,算子支持对重复数据按照指定字段进行排序,排序字段只能选择去重字段以外的字段。算子会先按照排序字段对重复的数据进行排序,排序后保留重复数据中的第一条数据,并删除其他重复数据。
例如有“同学A,12岁”和“同学A,14岁”两条数据的情况下,使用姓名作为查找重复的条件,使用年龄进行降序排序,那么排序后第一条数据为“同学A,14岁”会被保留,“同学A,12岁”的数据则会被删除。
在配置排序方式时,如果配置了多条排序方式,例如以X字段为识别重复的条件,并对算子依次配置了A字段升序、B字段降序两个排序条件。那么系统将先按照A字段升序的条件对字段进行排序,保留首行数据,清除X字段值重复的数据行。如果A字段排序后存在多条重复值并列首行,算子将再按照B降序条件排序,进一步清除重复数据。
例如有“同学B,12岁,数学97分”“同学B,12岁,数学98分”和“同学B,13岁,数学99分”三条数据时,使用姓名作为查看重复的条件,使用年龄增序、成绩降序作为排序条件,系统会保留“同学B,12岁,数学98分”的数据。
快速任务
请删除Excel文件《财务部员工信息表》字段“员工姓名”中的重复数据,只保留重复数据中司龄最大的数据。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,在左侧算子配置区依次点击“数据网盘”“我的数据”,选择《财务部员工信息表》,勾选全部字段,点击“保存配置”。
3
操作三
从算子选择区将“删除重复项”算子拖拽至画布区,连接“删除重复项”算子与“数据输入”算子。
4
操作四
点击“删除重复项”算子,在左侧算子配置区选择要查找重复项的列为“员工姓名”,排序方式的“字段名称”选择“司龄”,排序选择“降序”,点击“保存配置” 。
图片12.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

查找替换#

查找替换算子可以查找列中的特定字符、空格与空值,并将其统一替换成其他文本,或将其统一清除。在使用查找替换算子时,算子会将查找列中所选字段转换为文本类型,再操作查找和替换。
算子配置说明如下:
查找列
选择需要替换处理的字段。
搜索类型
确定需要搜索查找列中的哪些类型的元素做替换,支持选择字符、空值和空格三种元素。
替换类型
可以选择用字符替换元素,或者直接将元素清除。
替换为
输入替换内容,或者选择替换参数。
图片13.png
点击该按钮,即可删除该条件行。
图片15.png
点击该按钮,即可复制该条件行。
+增加
增加新的查找替换行。
快速任务
请使用查找替换算子将Excel文件“企业信用评级.xlsx”中的评级替换为对应的分数(A级-20分,B级-15分,C级-10分,D级-5分)。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“企业信用评级.xlsx”。
3
操作三
从算子选择区将“查找替换”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“查找替换”算子,左侧算子配置区查找列处选择需要查找替换的字段“本次评级”与“上次评级”,搜索类型选择“搜索字符”,搜索字符处输入字母评级,替换类型选择“用文本替换”,替换为处输入评级对应的分数,点击“保存配置”。
图片16.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

文本分割#

若字段列下值格式相似,都包含相同符号,文本分割算子可以将所选列的值以此符号为分割线,将数据拆分为两列或多列,同时保留原列数据。例如格式为“ABC@DEF@G”的数值,可使用文本分割算子切分为“ABC”“DEF”和“G”。
算子配置说明如下:
分割列
想要进行分割的列。
分割符号
分割列将按照分割符号进行拆分,分割符号需要为分割列数据中存在的符号,也支持按照空格分割。
新增列数
分割后的数据最大分割列数。例如“ABC@DEF@G”依照@分割最多可分为3列,若只填写1列,则只会分割值“ABC”为新列的值。
新增列名后缀起始值
新增列将在分割列名后加数字后缀,起始值可自由选择。例如列名为“邮箱”,新增2列,起始值选择为“1”,则新增列名称为“邮箱1”和“邮箱2”。
快速任务
请使用文本分割算子将Excel文件“财务部员工信息表.xlsx”的字段“出生日期”进行切割,以获取各个员工的出生年份(如员工生日为“1997/01/01”,使用算子从中提取出“1997”作为该员工出生年份)。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“财务部员工信息表.xlsx”。
3
操作三
从算子选择区将“文本分割”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“文本分割”算子,左侧算子配置区分割列选择“出生日期”,分割符号输入“/”,新增列数输入“1”,新增列名后缀起始值输入“1”,点击“保存配置” 。
图片17.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

文本截取#

文本截取算子可以将所选文本格式的列的值按照指定方式进行截取,获得所需值,再通过新增列或覆盖列对其进行展示。
算子配置说明如下:
添加列
添加新列展示截取后的数据。
覆盖列
在截取列上直接覆盖展示截取后的数据。
截取列
需要截取值的列,可与覆盖列为同列。
截取类型
选择截取类型,可按照字符位置截取或符号截取。
截取位置
当选择按位置截取时,支持从头部、尾部、第几个字开始截取。
当选择按符号截取时,支持从第几个指定的字符开始截取,截取到第几个指定的字符结束。
截取长度
当选择按位置截取时,可以调整截取字符的长度。
截取后
可选择截取后的值是保留还是清除。
保留:截取后的值赋值到新列或添加列;
去除:截取后的值清除,剩余的值赋值到新列或添加列。
快速任务
请使用文本截取算子从Excel文件“企业客商信息表.xlsx”对字段“客商名称”进行处理,从客商名称中提取客商所属地区信息(如客商名称为“山西省太原市天联软件有限公司”,使用算子从中提取出“山西省太原市”作为该客商的所属地区)。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“企业客商信息表.xlsx”。
3
操作三
从算子选择区将“文本截取”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“文本截取”算子,左侧算子配置区选择“添加列”,输入添加列名称“所属地区”,截取列选择“客商名称”,截取类型选择“按符号截取”,截取位置的起始设置为从第1个位置开始,但不填写截取符号,并勾选“含起始位置”(即从数据第一个字符开始截取,并保留第一个字符),结束位置设置为从第1个“市”结束,勾选“含结束位置”,勾选截取后的“保留”,点击“保存配置” 。
图片18.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

文本拼接#

文本拼接算子可以将所选列的值和手工输入的值拼接,形成新的值,再新增列或覆盖列展示新值。在配置算子拼接规则时,字段列只能通过引用列区添加,手动输入字段列名无法识别。
算子配置说明如下:
添加列
添加新列并对新列进行命名,新列值为拼接后的数据。
覆盖列
选定原有列,拼接后的数据会直接覆盖原列数据。
引用列
可选择前序算子输出的所有字段,双击字段名称会将字段填入拼接区。
拼接内容展示
选择文本字段,编写拼接公式。此处可以手工输入常亮字符进行拼接,也可引用平台内置的参数,如当前日期、当前年等。例如需为手机号拼接邮箱后缀,则在拼接内容展示区域填入手机号字段,并在字段后输入邮箱后缀即可。
快速任务
请使用文本拼接算子从Excel文件“企业客商信息表.xlsx”对字段“合作年限”进行处理,将纯数字转换为“数字+年”的展示形式(如合作年限为“5”,使用算子将其转换为“5年”)。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“企业客商信息表.xlsx”。
3
操作三
从算子选择区将“文本拼接”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“文本拼接”算子,左侧算子配置区选择“覆盖列”,覆盖列选择“合作年限”,在“拼接内容展示”处输入文本拼接内容“‘合作年限’年”,点击“保存配置” 。
图片19.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

字段长度统计#

字段长度统计算子可以统计指定列的字符长度,再根据新增列或覆盖列的方式展示字段长度统计值。
算子配置说明如下:
添加列
添加新列,新一列的值即为字段统计长度。
覆盖列
选定原有字段,用字段统计长度替换原有字段下的值。
统计列
选择需要统计字符长度的字段。
快速任务
请使用字段长度统计算子统计Excel文件“企业客商信息表.xlsx”中的字段“联系方式”的字符长度。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“企业客商信息表.xlsx”。
3
操作三
从算子选择区将“字段长度统计”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“字段长度统计”算子,左侧算子配置区选择“添加列”,输入添加列名称“字符长度”,统计列选择“联系方式”,点击“保存配置”。
图片20.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

数值公式计算#

数值公式计算算子可以对数值类型字段配置计算公式,对数据进行加减乘除及基本函数处理,用户可以添加列或者在原有列进行计算,同时其他无需处理的数据仍会进行保留。
算子配置说明如下:
输出列
可选择数据处理后的输出方式,支持选择“添加列”或者“覆盖列”两类方式。
列名称
输出列为添加列时,需要输入新列名称;
输出列为覆盖列时,下拉选择原有列,无法修改列名称。
列类型
输出列为添加列时,可修改列类型;
输出列为覆盖列时,无法修改列类型。
创建规则
点击“创建规则”,在弹出的创建规则界面,可以配置该字段的函数规则,可以选择添加数值、文本、数值函数和符号配置公式。
操作
点击删除图标中兴新云财芯平台操作手册-作品原创性声明.png,对应字段即被删除,不会再进行相应数据处理。
新增
可以创建新的字段。
以下是对创建规则界面的详细说明:
规则编辑区
在这里进行计算公式配置,可点击添加字段和参数,支持手动输入或点击添加函数和运算符号。
若有括号,先计算括号内再计算括号外。
字段
支持点击输入前序算子中数值类型的字段。
参数
支持点击输入数值类型的参数,参数来自【算法中心-采集-参数管理】。
函数
支持点击输入求和、平均值、最大值、最小值、绝对数等函数。选择函数,算子底部可自动带出函数说明与使用示例可供参考。
符号
支持点击输入加、减、乘、除等运算符号。
图片21.png
快速任务
请使用数值公式计算算子计算Excel文件“各产品生产成本明细.xlsx”中材料成本在生产总成本中的占比。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“各产品生产成本明细.xlsx”,并将字段“生产总成本”和“材料成本”的目标类型修改为“数值”。
3
操作三
从算子选择区将“数值公式计算”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“数值公式计算”算子,左侧算子配置区选择“添加列”,列名称输入“材料成本占比”,点击“创建规则”,输入规则“材料成本/生产总成本”,点击“保存”。设置完成后,点击“保存配置”。
图片22.png
图片23.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

日期格式转换#

日期格式转换算子可以对日期时间格式的字段转换成指定格式,转换后生成新文本类型的字段,该字段值即为转换后的日期值。
算子配置说明如下:
列名称
选择需要转换格式的日期类型字段。
日期格式
选择转换格式,支持选择多类日期格式,如yyyy-MM-dd、yyyy年M月、某年某月某日等。
快速任务
请使用日期格式替换算子,将Excel文件“财务部员工信息表.xlsx”中字段“出生日期”的日期格式转换为“某年某月某日”。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“财务部员工信息表.xlsx”,并将字段“出生日期”的目标类型修改为“日期时间”。
3
操作三
从算子选择区将“日期格式转换”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“日期格式转换”算子,左侧算子配置区日期列选择“出生日期”,日期格式选择“某年某月某日”,重命名输入“员工生日”,点击“保存配置”。
图片24.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

日期提取#

日期提取算子可以提取日期格式字段中的年度、月度、季度、周数等数据。
算子配置说明如下:
添加列
添加新列,新增列的值为原日期中提取出的数据。
覆盖列
选择原有字段,日期提取出的数据会覆盖该字段列原有的值。
来源列
选择需要提取的日期类型字段。
转换类型
选择提取日期数据的类型,支持选择年度、季度、月份、周数、日期等。
快速任务
请使用日期提取算子获取Excel文件“差旅费报销数据.xlsx”中字段“单据日期”中的月份数据(如单据日期为“2024-5-14”,使用算子从中提取出“5”作为该单据的报销月份)。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“差旅费报销数据.xlsx”,将字段“单据日期”的目标类型修改为“日期时间”。
3
操作三
从算子选择区将“日期提取”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“日期提取”算子,左侧算子配置区选择“添加列”,输入添加列名称“报销月份”,来源列选择“单据日期”,转换类型选择“月份”,点击“保存配置”。
图片25.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

动态日期#

动态日期算子可以配置日期的动态取值,支持选择当前时间或指定日期。
算子配置说明如下:
添加列
添加新列,新增列的值为动态日期。
覆盖列
选择原有字段,动态日期数据会覆盖该字段列原有的值。
列取值
支持选择取值当前时间或指定日期。
当日:系统会取当前日期为值;
指定日期:根据配置的取值规则生成日期值,点击左上角小字切换。
若配置固定值,系统会取填写的值;若配置偏移值,系统会以当前日期为基准进行偏移计算。0代表不偏移,正数代表增加,负数代表减少。
快速任务
请使用动态日期算子获取系统当前日期,作为数据采集日期,添加入Excel文件“差旅费报销数据.xlsx”。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“差旅费报销数据.xlsx”。
3
操作三
从算子选择区将“动态日期”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“动态日期”算子,左侧算子配置区选择“添加列”,输入添加列名称“数据日期”,列取值选择“当日”,点击“保存配置”。
图片26.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

日期偏移#

日期偏移算子可以将日期值按照规则进行向前向后偏移取值。
算子配置说明如下:
添加列
添加新列,新增列的值为偏移后的日期。
覆盖列
选择原有字段,偏移后的日期会覆盖该字段列原有的值。
日期列
选择想要偏移处理的日期类型字段。
偏移至
可对日期列进行年份、月份、日期的偏移。0代表不偏移,正数代表增加,负数代表减少。
快速任务
请使用日期偏移算子将Excel文件“超市会员信息表.xlsx”中的会员注册日向未来偏移一年,计算出这些会员的到期日期。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“超市会员信息表.xlsx”,将字段“会员注册日”的目标类型修改为“日期时间”。
3
操作三
从算子选择区将“日期偏移”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“日期偏移”算子,左侧算子配置区选择“添加列”,输入添加列名称“会员到期日”,日期列选择“会员注册日”,偏移至输入“1年”,点击“保存配置”。
图片27.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

日期差#

日期差算子可以计算两个日期指定单位的差值,并将结果展示在新列或覆盖已有列中。
算子配置说明如下:
添加列
添加新列,新增列的值为日期差。
覆盖列
选择原有字段,日期差会覆盖该字段列原有的值。
日期列
选择需要求差值的日期,计算逻辑为日期2减日期1。
日期差值单位
可选择想要差值计算的单位,支持按照年、季度、月、周、天、时、分、秒等单位计算。
此处日期差依照实际日历进行计算,例如2024-3-12和2024-3-15为3月的同一周,那么日差为3天,周差为0周,月差为0月。
计算方式
算子支持选择两种计算方式:截取到差值单位算差和完整日期时间算差。
选择完整日期时间算差时,还可以剔除节假日计算日期差。
截取到差值单位算差:该方法表示计算时,会先预处理所有日期值,将差值单位中选择的单位后的值都取为0,然后再做差。
例如:
日期1=2024-05-27 10:20:57
日期2=2024-06-28 22:19:03
选择差值单位为“天”,计算方式选择“截取到差值单位算差”,则计算时只会计算2024-05-27 00:00:00和2024-06-28 00:00:00之间的时间差,计算结果为32天,不会计算两个日期时、分、秒不同导致的天数差。
完整日期时间算差:该方法指先算秒差,再按照单位计算。
例如:
日期1=2024-05-27 10:20:57
日期2=2024-06-28 22:19:03
选择差值单位为“天”,计算方式选择“完整日期时间算差”,不选择剔除节假日,此时会计算两个日期时、分、秒不同导致的天数差,计算结果为32.5天;
小数位计算逻辑解释:
差值分=秒差/60,差值时=秒差/60/60,差值天=秒差/60/60/24,差值周=天差/7,差值月=天差/30,差值季度=天差/90,差值年=天差/365
剔除节假日作差:若计算时间差时,需要剔除节假日,例如按天发放员工差旅补贴时,节假日不发放补贴,因此需要剔除节假日。
此时计算方式选择“完整日期时间算差”,勾选“剔除节假日”,上传自定义节假日范围数据表,指定被剔除时间的开始时间字段和结束时间字段,即可剔除。
例如:
日期1=2024-05-27 10:20:57
日期2=2024-06-28 22:19:03
需剔除2024-05-31 00:00:00到2024-06-02 00:00:00之间的时间,可点击“模板示例”,下载模板。
参考模板制作数据表如下:
剔除开始时间剔除结束时间
2024-05-31 00:00:002024-06-02 00:00:00
将该表上传至数据网盘,将其配置入算子,将列1指定为剔除开始时间,列2指定为剔除结束时间即可。
注意:
剔除节假日时,需要确保节假日范围表中的日期时间没有交集重复,否则可能重复剔除。
例如节假日范围表里面有两行数据,分别是2024/10/1-10/7,2024/10/2-10/7,而待扣除的日期为2024/10/1-2024/10/31,算子计算时会匹配到两个扣除范围,因此扣掉13天。
快速任务
请使用日期差算子计算Excel文件“差旅费报销数据.xlsx”中,字段“单据日期”和“出差日期”之间的日期差。数据表可通过扫描附录三的二维码下载。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“差旅费报销数据.xlsx”,将字段“单据日期”和“出差日期”的目标类型修改为“日期时间”。
3
操作三
从算子选择区将“日期差”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“日期差”算子,左侧算子配置区选择“添加列”,输入添加列名称“日期差”,日期列1选择“出差日期”,日期列2选择“单据日期”,日期差值单位选择“天”,计算方式选择“截取到差值单位算差”,点击“保存配置”,如图所示:
图片28.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

唯一ID#

唯一ID算子可以给每行数据分配一个唯一的标识符,并将结果展示在新列中,或覆盖已有列的值。
算子配置说明如下:
添加列
添加新列,新增列的值为唯一值。
覆盖列
选择原有字段,唯一值会覆盖该字段列原有的值。
赋值规则
可选择自增序列和UUID两种规则。
自增序列:以起始值为第一个值,逐一自增1。
UUID:为每行生成一组长度为32位的通用唯一标识符,标识符由数字和小写字母组成。
起始值
当选择自增序列时,会以起始值作为第一个值,起始值最大为9999。
快速任务
请使用唯一ID算子为Excel文件“差旅费报销数据.xlsx”中各报销单据生成唯一标识符。数据表可通过扫描附录三的二维码下载。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“差旅费报销数据.xlsx”。
3
操作三
从算子选择区将“唯一ID”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“唯一ID”算子,左侧算子配置区选择“添加列”,输入添加列名称“标识符”,赋值规则选择“UUID”,点击“保存配置”。
图片29.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

条件标签#

条件标签算子可以根据不同的过滤条件,给数据行打上不同的分类标签,完成对数据行的分组。
算子配置说明如下:
添加列
添加新列,新增列的值为标签值。
覆盖列
选择原有字段,标签值会覆盖该字段列原有的值。
标签名称
选择打标方式,设置标签名称。标签最少设置两个,当设置好标签后,满足条件的打标签1,其余不满足条件的打标签2,多个标签原理相同。
选择输入文本,可手动输入标签名称;
选择引用字段,可选择数据中字段作为标签名称。
标签规则
通过过滤字段和条件配置,过滤出需要打上标签的数据行。过滤条件设置可参考2.2.3.5过滤算子的说明进行配置。
图片30.png
点击按钮即可新增条件标签。
图片31.png
点击按钮即可复制此条条件标签。
图片32.png
点击按钮即可删除该条件标签。
图片33.png
点击按钮即可收起该标签内容。
快速任务
请使用条件标签算子为Excel文件“02-培训考试分数.xlsx”中各员工考试分数进行评价打标签(85分以上为优秀,71-85分为良好,60-70分为一般,60分以下为不及格)。数据表可通过扫描附录三的二维码下载。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“02-培训考试分数.xlsx”,将字段“最终成绩”的目标类型修改为“数值”。
3
操作三
从算子选择区将“条件标签”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“条件标签”算子,左侧算子配置区选择“添加列”,输入添加列名称“考试评价”,配置标签名称及打标签条件如下所示。操作完成后,点击“保存配置”。
图片34.png
标签1:标签文字选择“输入文本”,标签名称输入“优秀”,条件设置为:过滤字段“最终成绩(满分100)”-条件“大于”-值“85”。
标签2:标签文字选择“输入文本”,标签名称输入“良好”,条件设置如下,条件间为“且”的关系:
条件1:过滤字段“最终成绩(满分100)”-条件“小于等于”-值“85”;
条件2:过滤字段“最终成绩(满分100)”-条件“大于”-值“70”。
标签3:标签文字选择“输入文本”,标签名称输入“一般”,条件设置如下,条件间为“且”的关系:
条件1:过滤字段“最终成绩(满分100)”-条件“小于等于”-值“70”;
条件2:过滤字段“最终成绩(满分100)”-条件“大于等于”-值“60”。
标签4:标签文字选择“输入文本”,标签名称输入“不及格”。
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。

抽样#

抽样算子可用于对数据进行随机抽样,分析人员可自行设定分组和样本数,并通过设置随机种子确保输出重复样本。
随机种子是分析人员设置的固定数值,只要给定相同的随机种子,抽样算子将始终产生相同的随机数序列,确保抽样的可重复性和结果的可验证性。
例如使用抽样算子从五十个员工中抽取一名员工,设置随机种子为“999”时抽取到员工小王,那么以后再抽取员工时,只要使用相同的随机种子“999”,就永远能抽取到员工小王。
算子配置说明如下:
分组字段
选择分组字段,对数据进行分组。分组后,系统会在各组分别进行抽样。
样本类型
选择抽样类型,设定抽样个数,支持“随机N行”和“随机N%行”两种类型。
抽样数N可通过手工输入、动态参数和前序算子三种方式设置。当抽样数大于数据总量时,系统会抽取与展示全部数据。
确定性输出
设置控制确定性输出的随机种子,可输入大于等于1的整数作为随机种子,最大15位。点击图片35.png,可切换模式,引用参数作为随机种子。
快速任务
请使用抽样算子随机抽取3条表格附件《财务部员工信息表》中的员工数据。
操作指引
1
操作一
进入算法中心,点击“新建”,进入算子流配置页面。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入表格附件《财务部员工信息表》。
3
操作三
从算子选择区将“抽样”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“抽样”算子,打开算子配置区。不选择分组字段,样本类型选择“随机N行”,N选择“手动输入”,输入值为“3”,不勾选“确定性输出”,完成后点击“保存配置”。
图片36.png
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。
上一页
输入输出
下一页
数据关联
Built with