我应该将哪个库用于大数据项目[关闭]

Posted

技术标签:

【中文标题】我应该将哪个库用于大数据项目[关闭]【英文标题】:which library should I use for big data project [closed] 【发布时间】:2013-11-24 05:29:55 【问题描述】:

该项目旨在使用大数据技术分析患者的疾病细胞,以表明哪些治疗可以产生最好的结果和最少的副作用。

但我认为使用 python 或 java 库。我无法决定哪种语言的库对我的项目更有用。如果你有任何经验,你能帮帮我吗?我对大数据一无所知。

【问题讨论】:

什么是“病人的病细胞”,“大数据技术”对您来说意味着什么? 疾病是项目细节的总称。大数据技术意味着巨大的数据。我研究最有效的方法 【参考方案1】:

查看Anaconda。它几乎将大数据分析所需的每个库都捆绑到一个安装程序中。

Anaconda 发行版还包括 Disco MapReduce,因此您拥有设置分布式文件系统 MapReduce 场以执行大型分析作业所需的所有工具。

【讨论】:

非常感谢。所以你说python更有用吗? 你可以使用python或java。如果你使用 java,你会想要深入研究 Hadoop。 Java/Hadoop 解决方案比 Disco/python 有更多的主流使用,但学习曲线也更陡峭。

以上是关于我应该将哪个库用于大数据项目[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

新闻网站大数据项目

大数据项目1(数据预处理问题)

Scala VS Python:为大数据项目选择哪一个

电商大数据项目-推荐系统实战

大数据项目之dmp用户画像

这个场景是大数据项目吗?