泰坦尼克号

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了泰坦尼克号相关的知识,希望对你有一定的参考价值。

技术分享图片

import pandas
titanic = pandas.read_csv("titanic_train.csv") # 读取数据
# titanic.head()
print titanic.describe() # 每一列的统计
技术分享图片

从上图中可以看到,age字段有缺少值,可以用平均值进行填充
titanic["Age"] = titanic["Age"].fillna(titanic["Age"].median())
print titanic.describe()
将male转换成可以计算的int值,并赋值为0
print
titanic["Sex"].unique() titanic.loc[titanic["Sex"] == "male","Sex"] = 0 titanic.loc[titanic["Sex"] == "female","Sex"] = 1
print titanic["Embarked"].unique()

titanic["Embarked"] = titanic["Embarked"].fillna(S)
titanic.loc[titanic["Embarked"] == "S","Embarked"] = 0
titanic.loc[titanic["Embarked"] == "C","Embarked"] = 1
titanic.loc[titanic["Embarked"] == "Q","Embarked"] = 2

 


以上是关于泰坦尼克号的主要内容,如果未能解决你的问题,请参考以下文章

Kaggle经典测试,泰坦尼克号的生存预测,机器学习实验----02

Kaggle经典测试,泰坦尼克号的生存预测,机器学习实验----02

泰坦尼克号生存预测

任务8,泰坦尼克号

泰坦尼克号乘客生存预测(XGBoost)

决策树算法泰坦尼克号乘客生存预测