如何使用Excel查找大量相似数据?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用Excel查找大量相似数据?相关的知识,希望对你有一定的参考价值。

现有A、B、C、D、E、F、G很多表,其中A表,是BCDEFG的汇总,由于工作疏漏或者其他原因,造成A汇总表和其他表数据的不一致。现在需要将汇总表A表中遗漏的其他各表的数据找出来。也需要将A表中多余的数据剔除掉。每个表都有成千上万的数据,一个一个找肯定是不行的。
请问各位高手,有没有简便易行的方法?请各位不吝赐教。。。O(∩_∩)O谢谢。。。

使用Excel查找大量相似数据的具体操作步骤如下:

1、首先在Excel上打开要进行操作的文档,节奏在此页面中点击选中要进行操作的单元格。

2、接着在此页面内点击上方的“条件格式”选项。

3、然后在下方的下拉框内点击“空出显示单元格规则”。


4、接着在弹出来的框内点击“值”左侧的下拉按钮,选择“重复”选项,然后在“设置为”下拉菜单中选择“自定义格式”选项。


5、然后就会弹出来一个对话框,在此框内点击“填充”栏目选项。


6、然后在此页面的下方的背景色栏目中点击要进行设置的颜色,也就是相似数据突显出来的颜色,然后就完成了,系统就会自动检测相似数据,检测到了则会以刚进行选择的颜色显示出来。




参考技术A   操作方法如下:
  1、假设这两个表没有在一个excel里面,把它们移动到同一个表中。
  2、Vlookup函数的语法:
  VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
  lookup_value:要查找的值,数值、引用或文本字符串
  table_array:要查找的区域,数据表区域
  col_index_num:返回数据在区域的第几列数,正整数
  range_lookup:模糊匹配,TRUE(或不填) /FALSE
  3、找出两列相同的数据:
  用的公式是=VLOOKUP(A2,Sheet2!A:B,1,0)
  公式的含义是在sheet2工作表的A:B区域的首列中查找等于a2的值,找到后,返回该区域第1列(即E列)的同行的值。最后的参数0表示精确查找。
  4、找出两列所对应的数据:
  用的公式是=VLOOKUP(A2,Sheet2!$A$2:B150,2,0)
  公式的含义是在sheet2工作表的A2:B150区域中查找符合条件显示B列的值,找到后,返回该区域第2列(即F列)的同行的值。最后的参数0表示精确查找。
  5、完成上面四步以后,最后一步比较简单,直接拉填充柄填充下面的空白处即可,查找到对应的数据会直接显示,如果没有找到刚显示#N/A。
参考技术B 回答

Excel查找大量相似数据的具体操作步骤如下:

1、首先在Excel上打开要进行操作的文档,节奏在此页面中点击选中要进行操作的单元格。

2、接着在此页面内点击上方的“条件格式”选项。

3、然后在下方的下拉框内点击“空出显示单元格规则”。

4、接着在弹出来的框内点击“值”左侧的下拉按钮,选择“重复”选项,然后在“设置为”下拉菜单中选择“自定义格式”选项。

5、然后就会弹出来一个对话框,在此框内点击“填充”栏目选项。

6、然后在此页面的下方的背景色栏目中点击要进行设置的颜色,也就是相似数据突显出来的颜色,然后就完成了,系统就会自动检测相似数据,检测到了则会以刚进行选择的颜色显示出来。

参考技术C

方法/步骤

1,移动或者复制表的方法:

    假设这两个表没有在一个excel里面,把它们移动到同一个表中,移动方法:Vlookup函数的语法:

    VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)

    lookup_value:要查找的值,数值、引用或文本字符串

    table_array:要查找的区域,数据表区域

    col_index_num:返回数据在区域的第几列数,正整数

    range_lookup:模糊匹配,TRUE(或不填) /FALSE


2,找出两列相同的数据:

    用的公式是=VLOOKUP(A2,Sheet2!A:B,1,0)

    公式的含义是在sheet2工作表的A:B区域的首列中查找等于a2的值,找到后,返回该区域第1列(即E列)的同行的值。最后的参数0表示精确查找。


3,找出两列所对应的数据:

    用的公式是=VLOOKUP(A2,Sheet2!$A$2:B150,2,0)

    公式的含义是在sheet2工作表的A2:B150区域中查找符合条件显示B列的值,找到后,返回该区域第2列(即F列)的同行的值。最后的参数0表示精确查找。


4,最后一步比较简单,直接拉填充柄填充下面的空白处即可,查找到对应的数据会直接显示,如果没有找到刚显示#N/A。


注意事项

一定要先输入=号才会自动计算

如果表太大,可以把表格里的公式去掉,先复制数据,粘贴时只粘贴值就可以。

参考技术D 利用VLOOKUP公式,在分表中写公式,总表为查找范围。那么分表中,找不出来的数据,就是总表中遗漏的
删除的话,在总表写公式,分表为查找范围,找不到的,也就是错误的、多余的数据
当然你总表中如果有重复的数据,用排序后IF判断公式,可以找出来重复的数据追问

可不可以说的详细一点,怎么使用vlooup编辑公式查询?

追答

如果你不会VLOOKUP公式,我一下子是跟你说不清楚的
你玩这么多数据,这些最基本的公式还是建议你学习一下
网上找找相关的用法,比如百度百科里搜VLOOKUP

本回答被提问者采纳

如何从从excel文件派生的大量字典中的值列表中查找最小值和最大值

【中文标题】如何从从excel文件派生的大量字典中的值列表中查找最小值和最大值【英文标题】:How to find min and max values from list of values in large set of dictionary derived from excel file 【发布时间】:2021-08-18 02:46:50 【问题描述】:

我是使用 Python 处理字典和 Pandas 的新手。我有一个 excel 文件,其中包含名为 sensor 和 values 的列,传感器也可以重复,但它们的值可能不同。我将它们转换为字典,将重复的传感器与其值合并。现在,我有一个字典,其中包含传感器及其值作为列表(下面给出示例)。我想从它们的值列表中返回所有具有最低和最高值的键。值也可以重复。

'Sensor1': [0.427, 0.13, 0.129, 0.124], 'sensor2': [2.376, 2.376, 0.712, 0.618.208, 0.133], 'sensor3': [0.21, 0.139], 'sensor4': [0.237, 0.123], 'sensor5': [0.997, 0.806, 6.78]

我希望输出是

sensor1 0.124 0.427
sensor2 0.133 2.376
sensor3 0.139 0.21
.
.
.

我尝试过的代码只给了我第一组键值对,即

senor1 0.124 0.427

代码-

df = pd.read_excel("sensor.xlsx")
a=df.set_index('sensor')['values'].to_dict()
b=k: g["values"].to_list() for k,g in df.groupby("sensor")
for k,v in b.items():
    _max, _min = max(v), min(v)
    print(k, " ", _min, " ",  _max)

我的 excel 文件很大,此代码不适用于该文件。请帮忙,在此先感谢!

【问题讨论】:

所以您是说b.items() 只返回一个键值对,还是还有其他问题?你的问题不是很清楚。 @MarkRansom 嗨,我稍微编辑了这个问题。是的,b.items() 返回一个键值对。 【参考方案1】:

如果您已经有了字典,那么您可以将数据加载到数据框中并评估 min/maxaxis = 1

data = 'Sensor1': [0.427, 0.13, 0.129, 0.124], 'sensor2': [2.376, 2.376, 0.712, 0.618208, 0.133], 'sensor3': [0.21, 0.139], 'sensor4': [0.237, 0.123], 'sensor5': [0.997, 0.806, 6.78]

df = pd.DataFrame.from_dict(data, orient='index') 
df = pd.concat([df.min(1) , df.max(1)], axis =1)

或者你可以使用:

df = df.agg(['min', 'max'], axis='columns')  # suggested by @Cyttorak 

输出

            0      1
Sensor1  0.124  0.427
sensor2  0.133  2.376
sensor3  0.139  0.210
sensor4  0.123  0.237
sensor5  0.806  6.780

如果要将上述输出转换回dict

result = df.T.to_dict('list')

【讨论】:

df.agg(['min', 'max'], axis='columns')

以上是关于如何使用Excel查找大量相似数据?的主要内容,如果未能解决你的问题,请参考以下文章

如何删除EXCEL表中的大量数据行,要删除的行数大概8万

在excel中的大量数据中,如何查找出相同的四个单元格内容,并引用后面的单元格内容

如何从从excel文件派生的大量字典中的值列表中查找最小值和最大值

Excel如何对短文本进行模糊去重(按相似度去重)?

找个可以把excel中的大量数据自动输入到单位办公系统里的,啥软件能做到批量导入?

如何使用python将大量数据导出到Excel中的小技巧