《谁说菜鸟不会数据分析》数据加工

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《谁说菜鸟不会数据分析》数据加工相关的知识,希望对你有一定的参考价值。

数据加工

一、数据抽取:保留原数据表中某些字段的部分信息,组成一个新字段

  • 字段分列:截取某一字段部分信息
  • 字段合并:几个字段合并为一个新字段
  • 字段匹配:原数据表没有但其他数据表有的字段,有效匹配过了

字段分列

(1)菜单法

选区域--数据--分列

技术分享

 

根据格式特点,选择合适的分隔符号

 

技术分享

技术分享

技术分享

 

这与前面自文本导入数据的文本设置很相似。

(2)函数法

 

left(文本,左边几个)

right(文本,右边几个)

技术分享技术分享

 

字段合并

方法一:&连接

 

技术分享技术分享

方法二:函数concatenate(文本1,文本2,...)

技术分享

 

字段匹配

VLOOKUP(要在区域的第一列中找到的值,包含搜索数据的单元区域,第一列的值是由第一项搜索的值,num,range_lookup)

num: 1,返回第一列的值。2.第二列的值

range_lookup:  1 近似匹配  2.精确匹配

VLOOKUP(查找目标查找范围返回值的列数精确0OR模糊查找1)


 

二、数据计算

1.简单计算:加减乘除

2.函数计算

求平均值与总和sum(),average()

日期加减法

首先,了解如何输入日期。

当前日期:年月日 today()

当前日期:年月日时分 now()

技术分享技术分享

可以用day()函数对日期做计算

技术分享

 

3.用函数DATEDIF计算

函数:DATEDIF(start_date,end_date,unit):返回两个日期之间的年/月/日 间隔数

其中unit的格式有:

“Y" 时间段中的整年数,"M"整月数,”D“天数

”MD“返回天数差,忽略年和月

”YM“返回月数,忽略日和年

”YD“返回天数,忽略日期中的年

 


 

三、数据分组

 vlookup函数

技术分享

 

=VLOOKUP(A2,$D$2:$E$12,2,1) 
为A2、A3……所在列在D2至E12范围内查找。
模糊匹配,所以D列与A列的匹配上,但不能大于A列的数。
第三个参数是2,所以返回的 是D2至E12范围内第二列里的元素。

四、数据转换

1.行列转换(选择性粘贴或Ctrl+Alt+V,选择转置)

2.多选题录入数据方式之间的转换

先介绍二分法和多重分类法

技术分享

技术分享

 

多重分类法转换成二分法--公式法

三个选项在不同单元格:用hlookup、isnumber、if函数

技术分享

 

假设这里面要选3个,以第5行为例,客户选了2 3 4,对应选项为BCD,因为多选题,所以无关顺序,转换成二分法,则要寻找是否有A,是否有B,...以此类推。所以,二分法表格,应该在每个选项下面设置公式,判断客户是否做了这个选项。

F5=IF(ISNUMBER(HLOOKUP(1,B5:D5,1,0)),1,0)   :

HLOOKUP(1,B5:D5,1,0)在B5:D5找1,找到1所在列A列,再找1对应列的第一行数值,如果找到1,则返回1对应列的第一行数值,否则返回#N/A。

 ISNUMBER(HLOOKUP(1,B5:D5,1,0))判断HLOOKUP(1,B5:D5,1,0)是否返回数值,TRUE,则返回FALSE。把这个结果给if函数,最后判断是否有1。

G5=IF(ISNUMBER(HLOOKUP(2,B5:D5,1,0)),1,0)

 

技术分享

 

当多重分类法里的选项全部都输入在同一个单元格,则换一种方式做用search函数取代原来的hlookup函数

技术分享

search函数的第一个参数是要找的数,如果找到,则返回那个数,否则就返回#value,因此也可以用于isnumber函数的判断。上图是这个方法的逻辑路线。从上到下对应函数嵌套的调用顺序。

 

以上是关于《谁说菜鸟不会数据分析》数据加工的主要内容,如果未能解决你的问题,请参考以下文章

谁说菜鸟不会数据分析

谁说菜鸟不会数据分析--读书笔记之第二章

谁说菜鸟不会数据分析-入门篇

《谁说菜鸟不会数据分析》数据处理 之 数据清洗--重复数据的处理

菜鸟 急求SQL数据查询问题 在线等

数据挖掘书籍