你的第一个Hadoop项目是什么?
Posted 九章算法
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了你的第一个Hadoop项目是什么?相关的知识,希望对你有一定的参考价值。
本期免费试听:
美西时间4月1日周一 18:30-20:30
美东时间4月1日周一 21:30-23:30
北京时间4月2日周二 09:30-11:30
课程安排:本课程为网络直播课,每节2小时,共9节,第一节免费试听
报名网址:http://t.cn/RAC7Era
首先给大家介绍的一下《Big Data 项目实战班》的课程项目,包括项目难度、代码量、处理数据量、及课后需要花费的时间。截图部分是该课程的项目成果展示。
1. Google Auto Complete
Google搜索引擎自动补全
通过Wiki 数据集中构建 N-Gram Library
实现搜索引擎的自动补全功能
项目难易程度:⭐️⭐️⭐️☆☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M
2. Article Sentiment Analysis
通过统计文章情感关键词
分析文章所表达的情绪
项目难易程度:⭐️⭐️☆☆☆
预计课后花费时间:3-5 hour
代码量:300-500 code lines
数据规模:50M
3. Page Rank
Google 搜索引擎排名
将通过wiki数据进行页面权重的计算
实现Page Rank这一重要算法
项目难易程度:⭐️⭐️⭐️⭐️☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M
4. Movie Recommender System
电影推荐系统
将应用 Netflix 的数据
给用户推荐他们之前喜欢的电影的相似电影
项目难易程度:⭐️⭐️⭐️⭐️⭐️
预计课后花费时间:6-10 hour
代码量:700-1000 code lines
数据规模:1G
Big Data 课程大纲
Big Data 求职攻略 & Hadoop 入门
Find Job in Big Data Field & Hadoop Introduction
MapReduce项目实战- Google Auto Complete I
MapReduce Project - Google Auto Complete I
MapReduce项目实战- Google Auto Complete II
MapReduce Project - Google Auto Complete II
Hadoop分布式系统
Hadoop Distributed File System
MapReduce 项目实战 - Page Rank I
MapReduce Project - PageRank I
MapReduce 项目实战 - Page Rank II
MapReduce Project - PageRank II
面试大数据常见问题之TopK
MapReduce 项目实战 - 推荐系统 I
MapReduce Project - Recommender System I
MapReduce 项目实战 - 推荐系统 II
MapReduce Project - Recommender System II
常见问题
1. 课程主要讲什么内容?
Hadoop & MapReduce
2. 课程需要有大数据基础吗?
不需要。
3. 课程使用什么语言?
课程使用Java语言,需要基本Java编程能力
4. 课程会讲 Spark 吗?
尽管现在 Spark 等大数据平台都非常火爆,
但是!
熟练掌握和使用一个大数据工具是最重要的。在面试过程中,基本所有的 Big Data 职位都会问到 Hadoop,而是否会 Spark 只是一个额外的加分项,如果不会并不会减分。且学会Hadoop后,上手Spark非常快!
报名请登录 www.jiuzhang.com
以上是关于你的第一个Hadoop项目是什么?的主要内容,如果未能解决你的问题,请参考以下文章