泰坦尼克号
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了泰坦尼克号相关的知识,希望对你有一定的参考价值。
import pandas titanic = pandas.read_csv("titanic_train.csv") # 读取数据 # titanic.head() print titanic.describe() # 每一列的统计
从上图中可以看到,age字段有缺少值,可以用平均值进行填充 titanic["Age"] = titanic["Age"].fillna(titanic["Age"].median()) print titanic.describe()
将male转换成可以计算的int值,并赋值为0
print titanic["Sex"].unique() titanic.loc[titanic["Sex"] == "male","Sex"] = 0 titanic.loc[titanic["Sex"] == "female","Sex"] = 1
print titanic["Embarked"].unique() titanic["Embarked"] = titanic["Embarked"].fillna(‘S‘) titanic.loc[titanic["Embarked"] == "S","Embarked"] = 0 titanic.loc[titanic["Embarked"] == "C","Embarked"] = 1 titanic.loc[titanic["Embarked"] == "Q","Embarked"] = 2
以上是关于泰坦尼克号的主要内容,如果未能解决你的问题,请参考以下文章
Kaggle经典测试,泰坦尼克号的生存预测,机器学习实验----02