当前位置：首页 > news >正文

怎样用 esProc 将数据集中重复内容置空

news 来源：原创 2025/4/22 5:32:57

某库表的前两个字段会同时出现重复值，比如下面的前 3 条记录。

现在要将所有的重复值改成 null，换句话说，按前 2 个字段分组后（等价于按其中 1 个字段分组），只保留组内第一条不变，其他记录的前两个字段改成 null。

计算结果像下面这样：

SQL分组后必须立刻汇总，不能保持分组子集继续计算，也没有天然的组内行号，代码比较难写。

esProc提供了丰富的计算函数，可以保持分组子集继续计算，有天然的行号，包括组内行号：esProc Web Try

A1：加载数据。

A2：用 group 函数按第 1 个字段分组，但不汇总。

Picture1png

每组是一个集合，可以通过点击展开，如图是前两组。

Picture2png

A2：用 run 函数修改各组数据，当成员在组内的序号大于 1 时，将前两个字段改为 null。~ 表示当前组，# 表示组内序号。

Picture3png

A3：合并各组。

Picture4png

上面分步骤的代码有利于学习和调试，熟练后 A2-A4 可以合为一句：

=A1.group(Column_A).run(~.(if(#!=1,Column_A=Column_B=null))).conj()

esProc是开源免费的，下载试用~

.NET WPF 三维模型

蓝桥杯 16.对局匹配

解析三大中间件：Nginx、Apache与Tomcat

C#常用LINQ

ubuntu学习day4

ubuntu--安装双系统

规则引擎 - Easy Rules

Spark和Hadoop的区别和联系

【AI提示词】数据分析专家

系统安全及应用

一个关于相对速度的假想的故事-3

Linux 入门十一：Linux 网络编程