如何使用Excel查找大量相似数据?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用Excel查找大量相似数据?相关的知识,希望对你有一定的参考价值。
现有A、B、C、D、E、F、G很多表,其中A表,是BCDEFG的汇总,由于工作疏漏或者其他原因,造成A汇总表和其他表数据的不一致。现在需要将汇总表A表中遗漏的其他各表的数据找出来。也需要将A表中多余的数据剔除掉。每个表都有成千上万的数据,一个一个找肯定是不行的。
请问各位高手,有没有简便易行的方法?请各位不吝赐教。。。O(∩_∩)O谢谢。。。
使用Excel查找大量相似数据的具体操作步骤如下:
1、首先在Excel上打开要进行操作的文档,节奏在此页面中点击选中要进行操作的单元格。
2、接着在此页面内点击上方的“条件格式”选项。
3、然后在下方的下拉框内点击“空出显示单元格规则”。
4、接着在弹出来的框内点击“值”左侧的下拉按钮,选择“重复”选项,然后在“设置为”下拉菜单中选择“自定义格式”选项。
5、然后就会弹出来一个对话框,在此框内点击“填充”栏目选项。
6、然后在此页面的下方的背景色栏目中点击要进行设置的颜色,也就是相似数据突显出来的颜色,然后就完成了,系统就会自动检测相似数据,检测到了则会以刚进行选择的颜色显示出来。
1、假设这两个表没有在一个excel里面,把它们移动到同一个表中。
2、Vlookup函数的语法:
VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
lookup_value:要查找的值,数值、引用或文本字符串
table_array:要查找的区域,数据表区域
col_index_num:返回数据在区域的第几列数,正整数
range_lookup:模糊匹配,TRUE(或不填) /FALSE
3、找出两列相同的数据:
用的公式是=VLOOKUP(A2,Sheet2!A:B,1,0)
公式的含义是在sheet2工作表的A:B区域的首列中查找等于a2的值,找到后,返回该区域第1列(即E列)的同行的值。最后的参数0表示精确查找。
4、找出两列所对应的数据:
用的公式是=VLOOKUP(A2,Sheet2!$A$2:B150,2,0)
公式的含义是在sheet2工作表的A2:B150区域中查找符合条件显示B列的值,找到后,返回该区域第2列(即F列)的同行的值。最后的参数0表示精确查找。
5、完成上面四步以后,最后一步比较简单,直接拉填充柄填充下面的空白处即可,查找到对应的数据会直接显示,如果没有找到刚显示#N/A。 参考技术B 回答
Excel查找大量相似数据的具体操作步骤如下:
1、首先在Excel上打开要进行操作的文档,节奏在此页面中点击选中要进行操作的单元格。
2、接着在此页面内点击上方的“条件格式”选项。
3、然后在下方的下拉框内点击“空出显示单元格规则”。
4、接着在弹出来的框内点击“值”左侧的下拉按钮,选择“重复”选项,然后在“设置为”下拉菜单中选择“自定义格式”选项。
5、然后就会弹出来一个对话框,在此框内点击“填充”栏目选项。
6、然后在此页面的下方的背景色栏目中点击要进行设置的颜色,也就是相似数据突显出来的颜色,然后就完成了,系统就会自动检测相似数据,检测到了则会以刚进行选择的颜色显示出来。
参考技术C方法/步骤
1,移动或者复制表的方法:
假设这两个表没有在一个excel里面,把它们移动到同一个表中,移动方法:Vlookup函数的语法:
VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
lookup_value:要查找的值,数值、引用或文本字符串
table_array:要查找的区域,数据表区域
col_index_num:返回数据在区域的第几列数,正整数
range_lookup:模糊匹配,TRUE(或不填) /FALSE
2,找出两列相同的数据:
用的公式是=VLOOKUP(A2,Sheet2!A:B,1,0)
公式的含义是在sheet2工作表的A:B区域的首列中查找等于a2的值,找到后,返回该区域第1列(即E列)的同行的值。最后的参数0表示精确查找。
3,找出两列所对应的数据:
用的公式是=VLOOKUP(A2,Sheet2!$A$2:B150,2,0)
公式的含义是在sheet2工作表的A2:B150区域中查找符合条件显示B列的值,找到后,返回该区域第2列(即F列)的同行的值。最后的参数0表示精确查找。
4,最后一步比较简单,直接拉填充柄填充下面的空白处即可,查找到对应的数据会直接显示,如果没有找到刚显示#N/A。
注意事项
一定要先输入=号才会自动计算
如果表太大,可以把表格里的公式去掉,先复制数据,粘贴时只粘贴值就可以。
参考技术D 利用VLOOKUP公式,在分表中写公式,总表为查找范围。那么分表中,找不出来的数据,就是总表中遗漏的删除的话,在总表写公式,分表为查找范围,找不到的,也就是错误的、多余的数据
当然你总表中如果有重复的数据,用排序后IF判断公式,可以找出来重复的数据追问
可不可以说的详细一点,怎么使用vlooup编辑公式查询?
追答如果你不会VLOOKUP公式,我一下子是跟你说不清楚的
你玩这么多数据,这些最基本的公式还是建议你学习一下
网上找找相关的用法,比如百度百科里搜VLOOKUP
如何从从excel文件派生的大量字典中的值列表中查找最小值和最大值
【中文标题】如何从从excel文件派生的大量字典中的值列表中查找最小值和最大值【英文标题】:How to find min and max values from list of values in large set of dictionary derived from excel file 【发布时间】:2021-08-18 02:46:50 【问题描述】:我是使用 Python 处理字典和 Pandas 的新手。我有一个 excel 文件,其中包含名为 sensor 和 values 的列,传感器也可以重复,但它们的值可能不同。我将它们转换为字典,将重复的传感器与其值合并。现在,我有一个字典,其中包含传感器及其值作为列表(下面给出示例)。我想从它们的值列表中返回所有具有最低和最高值的键。值也可以重复。
'Sensor1': [0.427, 0.13, 0.129, 0.124], 'sensor2': [2.376, 2.376, 0.712, 0.618.208, 0.133], 'sensor3': [0.21, 0.139], 'sensor4': [0.237, 0.123], 'sensor5': [0.997, 0.806, 6.78]
我希望输出是
sensor1 0.124 0.427
sensor2 0.133 2.376
sensor3 0.139 0.21
.
.
.
我尝试过的代码只给了我第一组键值对,即
senor1 0.124 0.427
代码-
df = pd.read_excel("sensor.xlsx")
a=df.set_index('sensor')['values'].to_dict()
b=k: g["values"].to_list() for k,g in df.groupby("sensor")
for k,v in b.items():
_max, _min = max(v), min(v)
print(k, " ", _min, " ", _max)
我的 excel 文件很大,此代码不适用于该文件。请帮忙,在此先感谢!
【问题讨论】:
所以您是说b.items()
只返回一个键值对,还是还有其他问题?你的问题不是很清楚。
@MarkRansom 嗨,我稍微编辑了这个问题。是的,b.items() 返回一个键值对。
【参考方案1】:
如果您已经有了字典,那么您可以将数据加载到数据框中并评估 min/max
和 axis = 1
。
data = 'Sensor1': [0.427, 0.13, 0.129, 0.124], 'sensor2': [2.376, 2.376, 0.712, 0.618208, 0.133], 'sensor3': [0.21, 0.139], 'sensor4': [0.237, 0.123], 'sensor5': [0.997, 0.806, 6.78]
df = pd.DataFrame.from_dict(data, orient='index')
df = pd.concat([df.min(1) , df.max(1)], axis =1)
或者你可以使用:
df = df.agg(['min', 'max'], axis='columns') # suggested by @Cyttorak
输出
0 1
Sensor1 0.124 0.427
sensor2 0.133 2.376
sensor3 0.139 0.210
sensor4 0.123 0.237
sensor5 0.806 6.780
如果要将上述输出转换回dict
:
result = df.T.to_dict('list')
【讨论】:
或df.agg(['min', 'max'], axis='columns')
以上是关于如何使用Excel查找大量相似数据?的主要内容,如果未能解决你的问题,请参考以下文章
在excel中的大量数据中,如何查找出相同的四个单元格内容,并引用后面的单元格内容
如何从从excel文件派生的大量字典中的值列表中查找最小值和最大值