准备与大数据相关的设计和架构问题的最佳方法[关闭]

Posted

技术标签:

【中文标题】准备与大数据相关的设计和架构问题的最佳方法[关闭]【英文标题】:Best way to prepare for Design and Architecture questions related to big data [closed] 【发布时间】:2012-08-11 19:00:58 【问题描述】:

最近,我参加了一家公司的现场面试,并被问到与大数据相关的设计问题,例如:获取在时间 t1 和 t2 之间访问网站(比如谷歌)的用户列表。使用什么数据结构,如何处理并发,陈旧数据,需要多少台服务器来存储数据,每台服务器的需求(软件,硬件)等等......

请给我一些书籍/网络参考资料,以增加我在这个新领域的知识。也请提供有关如何回答此类设计问题的见解

【问题讨论】:

hadoop。地图减少,EMR。 【参考方案1】:

this book (free download)(亚马逊:mining of massive datasets)刚刚发布到HN(该线程也有一些有用的 cmets)——从第一次浏览开始,它看起来非常好。你可以读一下。

【讨论】:

谢谢 Andrew。会调查的。

以上是关于准备与大数据相关的设计和架构问题的最佳方法[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

企业架构设计实战大数据架构最佳实践

在 Spark SQL 中将多个小表与大表连接的最佳方法

使用 OOPS 概念和 Java 最佳实践设计高级模式 [关闭]

App 后台架构设计方案 设计思想与最佳实践

库存数据库设计[关闭]

大数据平台架构设计探究