你的第一个Hadoop项目是什么?

Posted 九章算法

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了你的第一个Hadoop项目是什么?相关的知识,希望对你有一定的参考价值。


本期免费试听:

美西时间4月1日周一 18:30-20:30

美东时间4月1日周一 21:30-23:30
北京时间4月2日周二 09:30-11:30

课程安排:本课程为网络直播课,每节2小时,共9节,第一节免费试听

报名网址:http://t.cn/RAC7Era


首先给大家介绍的一下《Big Data 项目实战班》的课程项目,包括项目难度、代码量、处理数据量、及课后需要花费的时间。截图部分是该课程的项目成果展示。

1. Google Auto Complete

Google搜索引擎自动补全

通过Wiki 数据集中构建 N-Gram Library

实现搜索引擎的自动补全功能



项目难易程度:⭐️⭐️⭐️☆☆

预计课后花费时间:5-7 hour

代码量:300-500 code lines

数据规模:50M

2. Article Sentiment Analysis


通过统计文章情感关键词

分析文章所表达的情绪


你的第一个Hadoop项目是什么?


项目难易程度:⭐️⭐️☆☆☆
预计课后花费时间:3-5 hour
代码量:300-500 code lines
数据规模:50M

3. Page Rank

 Google 搜索引擎排名

将通过wiki数据进行页面权重的计算

实现Page Rank这一重要算法


你的第一个Hadoop项目是什么?


项目难易程度:⭐️⭐️⭐️⭐️☆
预计课后花费时间:5-7 hour
代码量:300-500 code lines
数据规模:50M

4. Movie Recommender System

电影推荐系统


将应用 Netflix 的数据

给用户推荐他们之前喜欢的电影的相似电影


你的第一个Hadoop项目是什么?

项目难易程度:⭐️⭐️⭐️⭐️⭐️
预计课后花费时间:6-10 hour
代码量:700-1000 code lines
数据规模:1G


Big Data 课程大纲


1

Big Data 求职攻略 & Hadoop 入门

Find Job in Big Data Field & Hadoop Introduction

2

MapReduce项目实战- Google Auto Complete I

MapReduce Project - Google Auto Complete I

3

MapReduce项目实战- Google Auto Complete II

MapReduce Project - Google Auto Complete II

4

Hadoop分布式系统

Hadoop Distributed File System

5

MapReduce 项目实战 - Page Rank I

MapReduce Project - PageRank I

6

MapReduce 项目实战 - Page Rank II

MapReduce Project - PageRank II

7

面试大数据常见问题之TopK

8

MapReduce 项目实战 - 推荐系统 I 

MapReduce Project - Recommender System I

9

MapReduce 项目实战 - 推荐系统 II

MapReduce Project - Recommender System II


常见问题

1. 课程主要讲什么内容?

Hadoop & MapReduce

2. 课程需要有大数据基础吗?

不需要。

3. 课程使用什么语言?

课程使用Java语言,需要基本Java编程能力

4. 课程会讲 Spark 吗?

尽管现在 Spark 等大数据平台都非常火爆,

但是!

熟练掌握和使用一个大数据工具是最重要的。在面试过程中,基本所有的 Big Data 职位都会问到 Hadoop,而是否会 Spark 只是一个额外的加分项,如果不会并不会减分。且学会Hadoop后,上手Spark非常快!


报名请登录 www.jiuzhang.com

以上是关于你的第一个Hadoop项目是什么?的主要内容,如果未能解决你的问题,请参考以下文章

Jib构建你的第一个java镜像

使用Android studio创建你的第一个项目

快速开启你的第一个项目:TensorFlow项目架构模板

编写你的第一个 Java 版 Raft 分布式 KV 存储

IntelliJ IDEA 运行你的第一个Java应用程序

《hadoop权威指南》关于hive的第一个小例子的演示