准备与大数据相关的设计和架构问题的最佳方法[关闭]
Posted
技术标签:
【中文标题】准备与大数据相关的设计和架构问题的最佳方法[关闭]【英文标题】:Best way to prepare for Design and Architecture questions related to big data [closed] 【发布时间】:2012-08-11 19:00:58 【问题描述】:最近,我参加了一家公司的现场面试,并被问到与大数据相关的设计问题,例如:获取在时间 t1 和 t2 之间访问网站(比如谷歌)的用户列表。使用什么数据结构,如何处理并发,陈旧数据,需要多少台服务器来存储数据,每台服务器的需求(软件,硬件)等等......
请给我一些书籍/网络参考资料,以增加我在这个新领域的知识。也请提供有关如何回答此类设计问题的见解
【问题讨论】:
hadoop。地图减少,EMR。 【参考方案1】:this book (free download)(亚马逊:mining of massive datasets)刚刚发布到HN(该线程也有一些有用的 cmets)——从第一次浏览开始,它看起来非常好。你可以读一下。
【讨论】:
谢谢 Andrew。会调查的。以上是关于准备与大数据相关的设计和架构问题的最佳方法[关闭]的主要内容,如果未能解决你的问题,请参考以下文章