利用Python进行数据分析(11)-高阶应用category
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用Python进行数据分析(11)-高阶应用category相关的知识,希望对你有一定的参考价值。
参考技术A 本文中介绍的是pandas的高阶应用-分类数据category一个列中经常会包含重复值,这些重复值是一个小型的不同值的集合。
unique() 和 value_counts() 能够从数组中提取到不同的值并分别计算它们的频率
维度表包含了不同的值,将主要观测值存储为引用维度表的整数键
不同值的数组被称之为数据的类别、字典或者层级
如果不指定顺序,分类转换是无序的。我们可以自己显式地指定
如果在特定的数据集上做了大量的数据分析,将数据转成分类数据有大大提高性能
特殊属性cat提供了对分类方法的访问
在机器学习或统计数据中,通常需要将分类数据转成虚拟变量,也称之为one-hot编码
大数据之高阶函数应用
题目一:高阶函数应用(共计30分)
1)将下列学生存储在一个list,命名为studentsList 中(5分)
2)遍历studentsList,使用高阶函数输出上述内容(5分)
3)创建girlList,boyList,lt18List,gt18List (5分)
4)利用高阶函数遍历studentsList,把所有男生存入boyList (5分)
5)大于等于18岁的存入gt18List (5分)
6)小于18岁的lt18List存入lt18List中 (5分)。
import java.util.{Calendar, Date}
import scala.collection.mutable.ListBuffer
object Test {
def main(args: Array[String]): Unit = {
val studentList: ListBuffer[Tuple3[String, String, Int]] = ListBuffer()
studentList.+= (("张三", "男", 1998))
studentList.+= (("李四", "女", 1997))
studentList.+= (("王五", "男", 1997))
studentList.+= (("宫六", "女", 1999))
studentList.+= (("何七", "女", 1993))
studentList.+= (("周八", "男", 1992))
studentList.+= (("申九", "女", 1999))
studentList.+= (("rose", "女", 2001))
studentList.+= (("Jhon", "男", 2000))
studentList.foreach(println)
val boyList = studentList.filter(tuple => tuple._2=="男")
val year = Calendar.getInstance().get(Calendar.YEAR)
val gt18List = studentList.filter(tuple => year-tuple._3 >= 18)
val lt18List = studentList.filter(tuple => year-tuple._3 < 18)
println("--------------------boyList------------------------")
boyList.foreach(println)
println("--------------------gt18List------------------------")
gt18List.foreach(println)
println("--------------------lt18List------------------------")
lt18List.foreach(println)
}
}
以上是关于利用Python进行数据分析(11)-高阶应用category的主要内容,如果未能解决你的问题,请参考以下文章