中文「大大大大大」模型开源开放！从吟诗作画写代码到蛋白质预测全都有，源代码可编程API均奉上...

Posted 2022-12-01 QbitAl

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了中文「大大大大大」模型开源开放！从吟诗作画写代码到蛋白质预测全都有，源代码可编程API均奉上...相关的知识，希望对你有一定的参考价值。

鱼羊发自凹非寺
量子位 | 公众号 QbitAI

中文领域的“大大大大大”模型，开源开放了！

一口气10+个大模型联手登场，能写诗、写作文、写代码，还能画画、做视频、看图说话。

戳进主页，不仅代码可下载，Notebook、在线Demo也已就位。

直接就是在线可玩，开箱即用。

炼丹师福音还不止如此。

在这个名为魔搭ModelScope的开源社区里，你甚至可以1行代码就实现模型推理：

△一行pipeline完成模型推理

10行代码搞定调优训练（finetune）：

不得不说，这波开源有点东西。

如此大手笔，确实也并非哪家研究机构的SOLO，而是由国内AI工业界和学界联合推动：

阿里达摩院与CCF开源发展委员会共同发起，首批合作机构包括澜舟科技、智谱AI、深势科技、中国科学技术大学、浙江大学等，阵容蔚为壮观。

更多细节，咱们一起研究研究。

以模型为核心的中文AI开源社区

要说魔搭ModelScope有何不同之处，答案其实就在社区名字里：以模型为中心，搭建AI应用服务。

因此社区刚成立，就已经有300+模型上线，其中包括10多个大模型和150+ SOTA模型。并且其中1/3都支持中文。

就说最近大火的AI画画，在模型库里一搜，就能找到对应的模型。

点进可体验的通义-文本生成图像大模型，即使你完全是AI小白，也能直接体验。

比如让AI生成一张“小鸡戴墨镜唱歌跳舞”的图片。

结果是这样的：

还有更潮酷的。

输入“一张柯基犬在时代广场骑自行车的照片。它戴着墨镜和沙滩帽”，就能得到：

你想要什么样的图片？自己来试试吧，下面是传送门：

红极一时的GPT-3中文复刻版也在魔搭社区上架了，写起古诗来可谓有模有样。

在AI for Science方面，“中国版AlphaFold2”——深势科技的Uni-Fold同样亮相魔搭。

输入蛋白质单体的一级结构，就能在线预测蛋白质的三级结构啦。

此外，会写爽文、以10亿参数轻量化模型登顶CLUE（中文语言理解榜单）的澜舟科技孟子系列模型，智谱AI同时支持101种语言的预训练模型……都能在魔搭上找到并体验。

并且正如前文所说，魔搭提供的不仅仅是模型下载和使用，还把环境安装、推理验证、训练调优、模型部署的一站式服务都搭好了。

环境安装方面，魔搭支持本地环境快捷安装，提供了Python whl包安装和源码安装。

同时也支持云端Notebook免安装，一键就能开启在线Notebook实训平台。

模型推理方面，基于魔搭提供的封装Python SDK，开发者只写一行代码，就能快速验证和使用模型。

模型调优方面，魔搭同样提供了简单易用的调用接口，以及灵活的配置文件设计，实现了10行代码运行一个调优任务。

最后，在模型部署上，魔搭支持云端、本地、设备端等多种部署方式。

值得一提的是，魔搭还给开发者们提供了不少免费算力资源。

其中，8核32G的CPU资源不仅免费，还可无限续杯。

GPU算力方面，则有16小时的免费V100资源可用。并且多贡献多得。

魔搭社区，为什么是现在？

那么，问题来了，这么多家产业界和学术界研究机构，怎么就凑到一块儿搞起新的开源平台来了？

究其根本，其实还是一个AI落地应用，尤其是AI大模型产业化应用的问题。

一方面，我们能看到，AI技术正在各个领域迅猛发展。在顶尖的学界、产业界研究机构里，AI模型们的更新迭代可谓是日新月异。

但另一方面，AI技术本身的门槛仍然很高。尤其是在大模型上，以模型为核心，算法、算力、数据三位一体的重要性更加突显。

更不用说，到了具体的应用层面，由于现在的技术仍无法实现“一个模型打天下”，后续还有大量模型调优、二次开发工作要做。

开源无疑是推动AI技术更快走向大众的神兵利器。

问题是，在今天，尽管GitHub之类的代码托管平台已经非常成熟，但各种开源资源实际上还是非常分散，并且往往被框架、渠道等因素所限制。

也就是说，对于更广大的开发人员来说，现在仍缺少统一的中立社区，能把海量模型、算力、数据高效地汇聚到一处。

就是在这样的背景之下，达摩院等中国AI玩家们一拍即合，共同攒出了魔搭这么一个大招。

简单来说，魔搭社区核心提供的价值就是“模型即服务（Model as a Service，简称MaaS）”：

开源，并且提供开源之后模型的使用服务。

让普通开发者能更低门槛地把模型跑起来。让AI，尤其是AI大模型不再是少数人的游戏。

从这个意义上来说，我们可以将模型分散开源视作AI开源的1.0模式，而魔搭社区则是在探索AI开源2.0时代的新范式。

说到MaaS，其实并非全新概念。

之所以此前并未激起太大水花，与其本身面临的困难不无关系：

一方面，需要AI技术、优质模型本身的积累达到一定数量。

另一方面，围绕模型展开服务也就意味着大量资源的调度。

简而言之，单靠一家公司、一个机构是很难真正做到“模型即服务”的。

因而此中国科研机构们强强联手，积极贡献出一大波先进大模型、SOTA模型，属实不易。

对于本土AI开发者而言，不可谓不是一个好的开始。

阿里巴巴集团资深副总裁、达摩院副院长周靖人还透露，接下来，魔搭社区还会每月上新，达摩院将长期支持社区的维护和发展。

AI时代的新型基础设施

如果将AI技术带来的变革视作第四次工业革命，那么AI技术的落地，终将从依赖专家调参的手工作坊时代，走向工业化大生产时代。

在这其中，预训练模型就是关键所在。

中国计算机学会副理事长、澜舟科技创始人兼CEO周明博士表示：

魔搭这样的AI模型社区堪称AI时代的基础设施，能将预训练模型以较低门槛提供给广大开发者，让AI惠及全社会。

中国科学院院士、CCF开源发展委员会主任王怀民也认为：

开源是AI发展的重要驱动力，魔搭作为新型的AI开源社区，不仅将有力推动AI迈向广泛的落地应用，还将助力中国从开源世界的参与者逐步成长为引领者。

需要正视的是，作为国内第一个MaaS社区，魔搭还只是一个开始。

只有当更多开发者参与其中，在得到模型服务的同时，让AI在各个领域应用落地，不断拓展AI模型新的发展空间和可能性，这样一个开源社区才能真正work。

我们离大规模、可复制的AI大工业时代，才可能更近一步。

那么，你会参与进来吗？

魔搭社区地址：modelscope.cn

点击阅读原文可访问魔搭~

— 完 —

点这里👇关注我，记得标星哦～

以上是关于中文「大大大大大」模型开源开放！从吟诗作画写代码到蛋白质预测全都有，源代码可编程API均奉上...的主要内容，如果未能解决你的问题，请参考以下文章

总结：开放透明的环境对于大数据团队的重要性

电脑大大大问题

中文/英文换行总结

豆瓣9.1分，这本书会大大提升很多开发者的Python编程能力

spark VS Hadoop 两大大数据分析系统深度解读

2019年各大大厂最新php面试题

中文「大大大大大」模型开源开放！从吟诗作画写代码到蛋白质预测全都有，源代码可编程API均奉上...

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI

△一行pipeline完成模型推理

以模型为核心的中文AI开源社区

魔搭社区，为什么是现在？

鱼羊发自凹非寺
量子位 | 公众号 QbitAI