数据转换算子包括行转列算子、列转行算子、数据透视算子、累加算子、同比算子、环比算子、记录计数算子。行转列#
行转列算子可以对数据进行转置,将表中指定字段对应的值由横向数据行转换成纵向数据列。以下表为例,将“姓名”和“性别”下的行数据转为列数据,设置原表头字段合并后的列名称为“字段”,设置原表头字段下的数据合并后的列名称为“数据”:选择并到一列中的列名称
指需要转换的字段,选择需要转换的字段时,未被选到的字段,将按照所选字段的数量展开。
生成列
展示在“选择并到一列中的列名称”处所选字段的名称。
数值列
展示在“选择并到一列中的列名称”处所选字段对应数值。
请使用行转列算子将Excel文件“2021年产销数据表.xlsx”中的“生产量”和“销售量”由行转换成列。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“2021年产销数据表.xlsx”。
3
操作三
从算子选择区将“行转列”算子拖拽至画布区,连接“行转列”算子与“数据输入”算子。
4
操作四
点击“行转列”算子,在选择并到一列中的列名称处勾选“生产量”与“销售量”,生成列设置中“生成列名称”输入“产销类型”,“数值列名称”输入“数量”,点击“保存配置”。
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。
列转行#
列转行算子可将表中某列的数据提取为字段名,即转换成表头,同时获取其他列的列数值作为新列下的行数值,即将纵向数据转为横向数据。展开列名称
选择要展开为表头的列。
数值列名称
选择取值列(用于取得展开后各列下对应的值)。
新增列名称
输入展开列内原有的数据作为新增列的字段名称,填写n个值,则对应新增n列数据。
函数
可根据数值列的字段类型选择不同类型的函数,数值列中的值会根据所选函数计算输出,此项可不填。只有当选择的数值列为数值类型时,算子才可选择求和及均值两类函数。
输出字段名前缀
根据所选函数自动生成输出字段名前缀,如果不填写该项,则最终输出的列名称与的输入的新增列名称相同。
分组字段
填写函数后,可选择字段作为排序和分组的依据,非必填项。
请使用列转行算子对Excel文件“2021年产销数据表.xlsx”,计算大型客车、中型客车和轻型客车本年各自的生产量。
2
操作二
点击画布自动带出的“数据输入”算子,打 开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“2021年产销数据表.xlsx”,将字段“时间”的目标类型修改为“日期时间”,将字段“生产量”和“销售量”的目标类型修改为“数值”,点击“保存配置”。
3
操作三
将“列转行”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“列转行”算子,打开配置区,“展开列名称”选择“类型”,“数值列名称”选择“生产量”,在“新增列名称”中新增三列,分别输入列名称为“大型客车”“中型客车”“轻型客车”,“函数”选择“求和”,不输入“输出字段名前缀”,不选择“分组字段”。设置完成后,点击“保存配置”。
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。
新增列名称必须是展开列中已有的值,不填写的项目将不会出现在结果表中。
数据透视#
数据透视算子可以将同一类型数据进行分组汇总后输出。视算子运算逻辑是按照分组字段将原始数据分组,最后在每个分组内,按照统计字段下所选的处理字段和函数,计算并输出分组统计后的结果。分组字段
选择需要分组的字段。
处理字段
需要使用函数计算的字段。
函数
支持选择计数、非空值计数、非重复值计数、非重复且非空值计数、空值计数、字符拼接、求和、均值、最大值、最小值等多个函数。
输出字段名选择函数后系统自动生成输出字段名,格式为:函数名+原字段名;
同一字段可以选择多次,即同一字段可以设置多个统计规则。
数据透视算子对选择字段配置函数时,不同的数据类型支持的函数不同,具体说明如下:计数
对所选的处理字段列下的全部数值进行计数,一个值算为1个个数。
空值计数
对所选的处理字段列下的空值进行计数。
非空值计数
对所选的处理字段列下的空值以外的数值进行计数。
去重计数
对所选的处理字段列下的数值进行去重计数。例如对A,B,C,A四个名称进行去重计数,计数结果为3。
去重且非空值计数
对所选的处理字段列下的数值进行去重、去空值计数。
非重复值计数
对所选的处理字段列下的数值统计未重复数值的个数。重复值会被计数0,非重复值计数1次,单个空值计数1,多个空值计数0。例如对A,B,C,A四个名称进行去重计数,计数结果为2,A因为存在重复值计数为0。
非重复且非空值计数
对所选的处理字段列下的数值统计未重复且非空值数值的个数。重复值和空值计数为0,非重复且非空值计数为1。
字符拼接
合并、拼接显示所选字段列中的所有值。
求和
对所选的处理字段求和。
均值
对所选的处理字段列求平均值。
最大值
对所选的处理字段列求最大值。
最小值
对所选的处理字段列求最小值。
请使用数据透视算子计算Excel文件“2021年产销数据表.xlsx”中各类型客车生产量的总量和均值。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“2021年产销数据表.xlsx”,将字段“生产量”和“销售量”的目标类型修改为“数值”,点击“保存配置”。
3
操作三
从算子选择区将“数据透视”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“数据透视”算子,左侧算子配置区分组字段选择“类型”,统计字段中配置两条计算规则,处理字段均选择“生产量”,函数选择“求和”和“均值”,输出字段名分别输入为“总生产量”和“各月生产量均值”。设置完成后,点击“保存配置”。
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。
数据透视算子配置函数时根据数据类型不同,在函数选择时系统会自动显示当前数据类型支持的函数,如果在运算时发现没有想使用的函数,可运用“字段类型转换”算子对处理字段类型进行修改。
累加算子可以计算指定字段在特定时间维度下的累加值。算子运算逻辑是按照分组字段、时间字段和时间维度将原始数据分组后,对计算字段进行累加,并输出计算后的结果。分组字段
选择需要分组的字段。
时间字段
只能选择字段类型为时间日期类型的字段。
时间维度
可选全部、年、季、月。当选择“年”时,根据所选的时间字段,按年度对计算字段进行累加;当选择“季”时,根据所选的时间字段,按季度对计算字段进行累加;当选择“月”时,根据所选的时间字段,按年度+月度对计算字段进行累加;当选择“全部”时,根据所选的时间字段,对计算字段进行累加,如果时间字段具体到时分秒,那么累加时也会具体到时分秒。
计算字段
只能选择字段类型为数值类型的字段。
输出字段名
当选择了计算字段后,默认为“字段名称+累加”,支持用户自定义输出字段名称。
请使用累加算子计算Excel文件“2021年产销数据表.xlsx”中各类型客车2021年的销售总量。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“2021年产销数据表.xlsx”,将字段“时间”的目标类型修改为“日期时间”,将字段“销售量”的目标类型修改为“数值”,点击“保存配置”。
3
操作三
从算子选择区将“累加”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“累加”算子,在左侧算子配置区“分组字段”选择“类型”,在“时间维度”勾选“年”,下拉菜单选择“时间”,在“计算字段”选择“销售量”,在“输出字段名称”输入“销售总量”,点击“保存配置”。
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。
累加算子配置时,“时间字段”与“计算字段”均对字段类型有对应要求,请确保字段类型符合系统要求。
同比算子可以计算指定字段在特定时间维度下的同比值。同比算子的逻辑是按照分组字段、时间字段和时间维度将原始数据分组后,计算所选计算字段的同比值,并输出计算后的结果。分组字段
选择需要分组的字段。
时间字段
只能选择字段类型为时间日期类型的字段。
时间维度
可选年、季度、月三类时间维度计算同比。
计算字段
只能选择字段类型为数值类型的字段。
输出字段名
当选择了计算字段后,默认为字段名称+同比。支持用户自定义输出字段名称。
请使用同比算子计算Excel文件“2021-2022年产销数据表.xlsx”中各类型客车生产量的年同比值。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“2021-2022年产销数据表.xlsx”,将字段“时间”的目标类型修改为“日期时间”,将字段“生产量”的目标类型修改为“数值”,点击“保存配置”。
3
操作三
从算子选择区将“同比”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“同比”算子,在左侧算子配置区“分组字段”选择“类型”,“时间维度”勾选“年”,时间字段选择“时间”,计算字段选择“生产量”,输出字段名称填写“生产量同比”。设置完成后,点击“保存配置”。
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。
同比算子配置时,“时间字段”与“计算字段”均对字段类型有对应要求,请确保字段类型符合系统要求。
环比算子可以计算指定列在特定时间维 度下的环比值。算子运算逻辑是按照分组字段、时间字段和时间维度将原始数据分组后,计算所选计算字段的环比值,并输出计算后的结果。分组字段
选择需要分组的字段。
时间字段
只能选择字段类型为时间日期类型的字段。
时间维度
可选年、季度、月、日为时间维度,计算环比值。
计算字段
只能选择字段类型为数值类型的字段。
输出字段名
当选择了计算字段后,默认为字段名称+环比。支持用户自定义输出字段名称。
请使用环比算子计算Excel文件“2021-2022年产销数据表.xlsx”中各类型客车每月销售量的环比值。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“2021-2022年产销数据表.xlsx”,将字段“时间”的目标类型修改为“日期时间”,将字段“生产量”的目标类型修改为“数值”,点击“保存配置”。
3
操作三
从算子选择区将“同比”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
点击“环比”算子,左侧算子配置区分组字段选择“类型”,时间维度勾选“月”,时间字段选择“时间”,计算字段选择“销售量”,输出字段名称填写“销售量环比”。设置完成后,点击“保存配置”。
5
操作五
保存并执行算子流,在数据预览区查看算子流运算结果。
环比算子配置时,“时间字段”与“计算字段”均对字段类型有对应要求,请确保字段类型符合系统要求。
记录计数#
记录计数算子可以计算通过数据流的行数,返回计数结果。记录计数算子无需配置,连接前置算子即可。请使用记录计数算子统计Excel文件“考核成绩表.xlsx”中的总数据条数。
2
操作二
点击画布自动带出的“数据输入”算子,打开配置页面,选择本地上传文件或从数据网盘引用数据,输入Excel文件“考核成绩表.xlsx”。
3
操作三
从算子选择区将“记录计数”算子拖拽至画布区,与“数据输入”算子连接。
4
操作四
保存并执行算子流,在数据预览区查看算子流运算结果。