美文网首页PowerQuery
标记PowerQuyery重复数据

标记PowerQuyery重复数据

作者: PowerQuery | 来源:发表于2016-05-08 15:30 被阅读259次

有时候我们不能删除重复数据,而是需要将其标记出来,或者筛选出来。

可以用PowerQuery的分组功能来实现标记重复数据。

1.选中要标记重复数据的列,点击左上角的“分组依据”【图1】。

图1

2.在分组设定窗口,可以看到PowerQuery将对Name列进行计数,如果是唯一值,则计数结果为1;如果包含重复值,则计数结果将大于1;将计数列重名为一个容易理解的名字;然后点击右边的+号,新增一列,在“操作”栏,选择新增的那一列的向下小三角,展开选项,选择最底下的“所有行”,这一步的目的是返回包含所有列的表格,因为我们只想标记出重复值,而不想对表格结构作出大的更改。【图3】设定好之后点击“确定”,回到PowerQuery数据预览窗口。

图3

3.我们现在可以看到重复数据标记结果了:重复的值会在计数列显示为大于1的整数。本例中,是第三行的“li”重复了,所以"Name计数"列显示为2。我们可以简单在“Name计数列”进行筛选【图4】

图4

4.然后,我们需要将数据还原,因为我们只想标记,不想删除或做别的处理,所以我们点击最后一列的展开按钮,展开表格,然后选择要展开的列,因为已经有Name列了,所以我们取消勾选“Name”列,我们也把最后的“使用原始列名作为前缀”选项取消勾选,因为这里我们不会搞混列名,所以不需要前缀。如果我们筛选大于1的重复值,并展开包括所有行的表格,最后得到的结果如【图5】所示。

图5

5.仔细观察展开的列和表格原始列的顺序,发现发生了变化,这是PowerQuery一个不太如人意的地方,如果顺序很重要,必须重新排序。对于列数少的表格,我们可以手工排序;如果列数很多,就必须采用别的办法。我将专门建立一个帖子

相关文章

  • 标记PowerQuyery重复数据

    有时候我们不能删除重复数据,而是需要将其标记出来,或者筛选出来。 可以用PowerQuery的分组功能来实现标记重...

  • 关于spss的一点常识

    数据清洗 删除重复 数据-标记重复个案-把需要参考的都拖入右边定义-生成0代表重复,1代表不重复-在01这一列右键...

  • 如何找出Excel两列中重复的数据

    找出如下两列数据的重复项 方法一 使用数据 最简单最快的标记方法 1. 选中这两列数据 2. 高亮重复项 点菜单栏...

  • 关于Excel的一点常识

    数据清洗 重复找出来 1函数法:COUNTIF(range,criteria)标记每个数据出现过几次 例如COUN...

  • 学习office——Excel之条件格式与公式

    一、使用简单的条件格式 1、为特定范围的数值标记特殊颜色 2、查找重复值 3、为数据透视表中的数据制作数据条 ①【...

  • 数组标记判断重复

    最近在LeetCode上做算法题遇到这样一道题如下图: 我的思路是:用三层for循环来暴力求解,第一层for循环是...

  • RxJS groupBy标记重复

    最近收到一个需求:开发了一个报名功能,因为一些特殊原因,用户可以重复报名,但是要在前端标记出来哪些用户是重复报名的...

  • 用PowerQuery判定同一行是否有重复值

    有下面这样的表,如果同一行中有重复的数字,则标记“相同”;如果没有重复的数字,则标记“ok”。

  • 删除线性表中的重复数据-使用单链表实现

    tag 重复数据 线性表 单链表 思想 使用双指针法,同时标记前后两个数据,这里有一点,如果只有一个数据,那就直接...

  • iOS_XML与JSON解析

    XML与JSON简介 XML 可扩展标记语言 用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据...

网友评论

    本文标题:标记PowerQuyery重复数据

    本文链接:https://www.haomeiwen.com/subject/spusrttx.html