我应该将哪个库用于大数据项目[关闭]
Posted
技术标签:
【中文标题】我应该将哪个库用于大数据项目[关闭]【英文标题】:which library should I use for big data project [closed] 【发布时间】:2013-11-24 05:29:55 【问题描述】:该项目旨在使用大数据技术分析患者的疾病细胞,以表明哪些治疗可以产生最好的结果和最少的副作用。
但我认为使用 python 或 java 库。我无法决定哪种语言的库对我的项目更有用。如果你有任何经验,你能帮帮我吗?我对大数据一无所知。
【问题讨论】:
什么是“病人的病细胞”,“大数据技术”对您来说意味着什么? 疾病是项目细节的总称。大数据技术意味着巨大的数据。我研究最有效的方法 【参考方案1】:查看Anaconda。它几乎将大数据分析所需的每个库都捆绑到一个安装程序中。
Anaconda 发行版还包括 Disco MapReduce,因此您拥有设置分布式文件系统 MapReduce 场以执行大型分析作业所需的所有工具。
【讨论】:
非常感谢。所以你说python更有用吗? 你可以使用python或java。如果你使用 java,你会想要深入研究 Hadoop。 Java/Hadoop 解决方案比 Disco/python 有更多的主流使用,但学习曲线也更陡峭。以上是关于我应该将哪个库用于大数据项目[关闭]的主要内容,如果未能解决你的问题,请参考以下文章