大数据应用技术课程实践--选题与实践方案
Posted 162
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据应用技术课程实践--选题与实践方案相关的知识,希望对你有一定的参考价值。
一、选题与意义
1.Hadoop平台应用
选题:Hadoop平台应用。
简要说明理由与意义。
可以让我们熟悉Linux系统、mysql、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用;
了解大数据处理的基本流程;
熟悉数据预处理方法;
熟悉在不同类型数据库之间进行数据相互导入导出;
熟悉使用R语言进行可视化分析;
熟悉使用Elipse编写Java程序操作HBase数据库。
二、实践方案
在自己电脑上根据个人计划的内容分布展开,这样对整个任务的实施都有好处。也能分解压力。
三、实践任务分解
- 安装Linux操作系统
- 安装关系型数据库MySQL
- 安装大数据处理框架Hadoop
- 安装列族数据库HBase
- 安装数据仓库Hive
- 安装Sqoop
- 安装R
- 安装Eclipse
- 对文本文件形式的原始数据集进行预处理
- 把文本文件的数据集导入到数据仓库Hive中
- 对数据仓库Hive中的数据进行查询分析
- 使用Sqoop将数据从Hive导入MySQL
- 使用Sqoop将数据从MySQL导入HBase
- 使用HBase Java API把数据从本地导入到HBase中
- 使用R对MySQL中的数据进行可视化分析
四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
第天根据实际情况更新计划表,有必要时调整。
23号 完成步骤1/2
24号 完成步骤3/4
25号 完成步骤5/6
26号 完成步骤7/8
27号 完成步骤9/10
28号 完成步骤11
29号 完成步骤12
30号 完成步骤13
1号 完成步骤14
2号 完成步骤15
3号 答辩
1.
- 网站用户购物行为分析
- 官网:http://dblab.xmu.edu.cn/post/7499/
- 淘宝双11数据分析与预测
- 官网:http://dblab.xmu.edu.cn/post/8116/
- 电信用户行为分析
- http://dblab.xmu.edu.cn/post/useranalysis/
大数据平台安装软件:
链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
提取码:ao1m
虚拟机镜像文件:
链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw
提取码:q0lt
2.
https://www.kaggle.com/competitions
说明:
- 个人项目,不要求组队,确实需要组队的说明理由。
- 边操作边记录;
- 每天完成当天文档;
- 最后综合成课程实践报告。
- 参考链接:http://dblab.xmu.edu.cn/post/7499/
以上是关于大数据应用技术课程实践--选题与实践方案的主要内容,如果未能解决你的问题,请参考以下文章