大数据应用技术课程实践--选题与实践方案
Posted 芸嘻嘻溪
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据应用技术课程实践--选题与实践方案相关的知识,希望对你有一定的参考价值。
一、选题与意义
1.Hadoop平台应用
2.Kaggle分析数据项目
简要说明理由与意义。
Kaggle分析数据项目:亚马孙乐器的评测
https://www.kaggle.com/eswarchandt/amazon-music-reviews
选择第二个题目,Kaggle分析数据项目,理由是Hadoop的平台搭建对我个人能力来说,有些费时费力。
而且对于个人能力和兴趣来说,更加喜欢Kaggle分析数据项目这一个选题。
对通过Python进行数据清洗、数据处理、构建模型、进行应用这些更加熟练和清楚其中原理。
二、实践方案
简要说明理由。
在Kaggle上找到自己感兴趣的数据集,然后下载后,在自己电脑上使用Python对数据进行处理和分析。
个人电脑上已有Python的环境,且有anaconda和Pycharm可以用来进行数据分析。
三、实践任务分解
根据所选的题目,明确实验步骤,分解任务到每天。
1、下载数据集
2、读取数据集并进行数据清洗
3、数据预处理
4、对数据进行可视化
5、根据数据特征选择模型构建并训练
6、预测,分类
7、评估模型
8、完善和总结
四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
第天根据实际情况更新计划表,有必要时调整。
2.
https://www.kaggle.com/competitions
说明:
- 个人项目,不要求组队,确实需要组队的说明理由。
- 边操作边记录;
- 每天完成当天文档;
- 最后综合成课程实践报告。
以上是关于大数据应用技术课程实践--选题与实践方案的主要内容,如果未能解决你的问题,请参考以下文章