利用Python进行数据分析(11)-高阶应用category

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用Python进行数据分析(11)-高阶应用category相关的知识,希望对你有一定的参考价值。

参考技术A 本文中介绍的是pandas的高阶应用-分类数据category​

一个列中经常会包含重复值,这些重复值是一个小型的不同值的集合。

unique() 和 value_counts() 能够从数组中提取到不同的值并分别计算它们的频率

维度表包含了不同的值,将主要观测值存储为引用维度表的整数键

不同值的数组被称之为数据的类别、字典或者层级

如果不指定顺序,分类转换是无序的。我们可以自己显式地指定

如果在特定的数据集上做了大量的数据分析,将数据转成分类数据有大大提高性能

特殊属性cat提供了对分类方法的访问

在机器学习或统计数据中,通常需要将分类数据转成虚拟变量,也称之为one-hot编码

大数据之高阶函数应用

 题目一:高阶函数应用(共计30分)

1)将下列学生存储在一个list,命名为studentsList 中5分)

2)遍历studentsList,使用高阶函数输出上述内容5分)

3)创建girlList,boyList,lt18List,gt18List (5分)

4)利用高阶函数遍历studentsList,把所有男生存入boyList (5分)

5)大于等于18岁的存入gt18List (5分)

6)小于18岁的lt18List存入lt18List中 (5分)。

 

import java.util.{Calendar, Date}

import scala.collection.mutable.ListBuffer

object Test {
def main(args: Array[String]): Unit = {
val studentList: ListBuffer[Tuple3[String, String, Int]] = ListBuffer()
studentList.+= (("张三", "男", 1998))
studentList.+= (("李四", "女", 1997))
studentList.+= (("王五", "男", 1997))
studentList.+= (("宫六", "女", 1999))
studentList.+= (("何七", "女", 1993))
studentList.+= (("周八", "男", 1992))
studentList.+= (("申九", "女", 1999))
studentList.+= (("rose", "女", 2001))
studentList.+= (("Jhon", "男", 2000))

studentList.foreach(println)

val boyList = studentList.filter(tuple => tuple._2=="男")

val year = Calendar.getInstance().get(Calendar.YEAR)
val gt18List = studentList.filter(tuple => year-tuple._3 >= 18)
val lt18List = studentList.filter(tuple => year-tuple._3 < 18)
println("--------------------boyList------------------------")
boyList.foreach(println)
println("--------------------gt18List------------------------")
gt18List.foreach(println)
println("--------------------lt18List------------------------")
lt18List.foreach(println)
}

}

以上是关于利用Python进行数据分析(11)-高阶应用category的主要内容,如果未能解决你的问题,请参考以下文章

大数据之高阶函数应用

大数据之高阶函数应用

Python sorted() 高阶函数

Fabric CA应用与配置

Fabric CA应用与配置

Fabric CA应用与配置