中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上...
Posted QbitAl
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上...相关的知识,希望对你有一定的参考价值。
鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI
中文领域的“大大大大大”模型,开源开放了!
一口气10+个大模型联手登场,能写诗、写作文、写代码,还能画画、做视频、看图说话。
戳进主页,不仅代码可下载,Notebook、在线Demo也已就位。
直接就是在线可玩,开箱即用。
炼丹师福音还不止如此。
在这个名为魔搭ModelScope的开源社区里,你甚至可以1行代码就实现模型推理:
△一行pipeline完成模型推理
10行代码搞定调优训练(finetune):
不得不说,这波开源有点东西。
如此大手笔,确实也并非哪家研究机构的SOLO,而是由国内AI工业界和学界联合推动:
阿里达摩院与CCF开源发展委员会共同发起,首批合作机构包括澜舟科技、智谱AI、深势科技、中国科学技术大学、浙江大学等,阵容蔚为壮观。
更多细节,咱们一起研究研究。
以模型为核心的中文AI开源社区
要说魔搭ModelScope有何不同之处,答案其实就在社区名字里:以模型为中心,搭建AI应用服务。
因此社区刚成立,就已经有300+模型上线,其中包括10多个大模型和150+ SOTA模型。并且其中1/3都支持中文。
就说最近大火的AI画画,在模型库里一搜,就能找到对应的模型。
点进可体验的通义-文本生成图像大模型,即使你完全是AI小白,也能直接体验。
比如让AI生成一张“小鸡戴墨镜唱歌跳舞”的图片。
结果是这样的:
还有更潮酷的。
输入“一张柯基犬在时代广场骑自行车的照片。它戴着墨镜和沙滩帽”,就能得到:
你想要什么样的图片?自己来试试吧,下面是传送门:
红极一时的GPT-3中文复刻版也在魔搭社区上架了,写起古诗来可谓有模有样。
在AI for Science方面,“中国版AlphaFold2”——深势科技的Uni-Fold同样亮相魔搭。
输入蛋白质单体的一级结构,就能在线预测蛋白质的三级结构啦。
此外,会写爽文、以10亿参数轻量化模型登顶CLUE(中文语言理解榜单)的澜舟科技孟子系列模型,智谱AI同时支持101种语言的预训练模型……都能在魔搭上找到并体验。
并且正如前文所说,魔搭提供的不仅仅是模型下载和使用,还把环境安装、推理验证、训练调优、模型部署的一站式服务都搭好了。
环境安装方面,魔搭支持本地环境快捷安装,提供了Python whl包安装和源码安装。
同时也支持云端Notebook免安装,一键就能开启在线Notebook实训平台。
模型推理方面,基于魔搭提供的封装Python SDK,开发者只写一行代码,就能快速验证和使用模型。
模型调优方面,魔搭同样提供了简单易用的调用接口,以及灵活的配置文件设计,实现了10行代码运行一个调优任务。
最后,在模型部署上,魔搭支持云端、本地、设备端等多种部署方式。
值得一提的是,魔搭还给开发者们提供了不少免费算力资源。
其中,8核32G的CPU资源不仅免费,还可无限续杯。
GPU算力方面,则有16小时的免费V100资源可用。并且多贡献多得。
魔搭社区,为什么是现在?
那么,问题来了,这么多家产业界和学术界研究机构,怎么就凑到一块儿搞起新的开源平台来了?
究其根本,其实还是一个AI落地应用,尤其是AI大模型产业化应用的问题。
一方面,我们能看到,AI技术正在各个领域迅猛发展。在顶尖的学界、产业界研究机构里,AI模型们的更新迭代可谓是日新月异。
但另一方面,AI技术本身的门槛仍然很高。尤其是在大模型上,以模型为核心,算法、算力、数据三位一体的重要性更加突显。
更不用说,到了具体的应用层面,由于现在的技术仍无法实现“一个模型打天下”,后续还有大量模型调优、二次开发工作要做。
开源无疑是推动AI技术更快走向大众的神兵利器。
问题是,在今天,尽管GitHub之类的代码托管平台已经非常成熟,但各种开源资源实际上还是非常分散,并且往往被框架、渠道等因素所限制。
也就是说,对于更广大的开发人员来说,现在仍缺少统一的中立社区,能把海量模型、算力、数据高效地汇聚到一处。
就是在这样的背景之下,达摩院等中国AI玩家们一拍即合,共同攒出了魔搭这么一个大招。
简单来说,魔搭社区核心提供的价值就是“模型即服务(Model as a Service,简称MaaS)”:
开源,并且提供开源之后模型的使用服务。
让普通开发者能更低门槛地把模型跑起来。让AI,尤其是AI大模型不再是少数人的游戏。
从这个意义上来说,我们可以将模型分散开源视作AI开源的1.0模式,而魔搭社区则是在探索AI开源2.0时代的新范式。
说到MaaS,其实并非全新概念。
之所以此前并未激起太大水花,与其本身面临的困难不无关系:
一方面,需要AI技术、优质模型本身的积累达到一定数量。
另一方面,围绕模型展开服务也就意味着大量资源的调度。
简而言之,单靠一家公司、一个机构是很难真正做到“模型即服务”的。
因而此中国科研机构们强强联手,积极贡献出一大波先进大模型、SOTA模型,属实不易。
对于本土AI开发者而言,不可谓不是一个好的开始。
阿里巴巴集团资深副总裁、达摩院副院长周靖人还透露,接下来,魔搭社区还会每月上新,达摩院将长期支持社区的维护和发展。
AI时代的新型基础设施
如果将AI技术带来的变革视作第四次工业革命,那么AI技术的落地,终将从依赖专家调参的手工作坊时代,走向工业化大生产时代。
在这其中,预训练模型就是关键所在。
中国计算机学会副理事长、澜舟科技创始人兼CEO周明博士表示:
魔搭这样的AI模型社区堪称AI时代的基础设施,能将预训练模型以较低门槛提供给广大开发者,让AI惠及全社会。
中国科学院院士、CCF开源发展委员会主任王怀民也认为:
开源是AI发展的重要驱动力,魔搭作为新型的AI开源社区,不仅将有力推动AI迈向广泛的落地应用,还将助力中国从开源世界的参与者逐步成长为引领者。
需要正视的是,作为国内第一个MaaS社区,魔搭还只是一个开始。
只有当更多开发者参与其中,在得到模型服务的同时,让AI在各个领域应用落地,不断拓展AI模型新的发展空间和可能性,这样一个开源社区才能真正work。
我们离大规模、可复制的AI大工业时代,才可能更近一步。
那么,你会参与进来吗?
魔搭社区地址:modelscope.cn
点击阅读原文可访问魔搭~
— 完 —
点这里👇关注我,记得标星哦~
以上是关于中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上...的主要内容,如果未能解决你的问题,请参考以下文章