加码中文 AIGC,IDEA 推出“盖亚计划”

Posted AI科技大本营

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了加码中文 AIGC,IDEA 推出“盖亚计划”相关的知识,希望对你有一定的参考价值。

作者 | 伍杏玲

出品 | CSDN

近年来,AIGC 话题火爆 AI 技术人的朋友圈。由于深度学习模型不断完善、开源模式推动,AIGC 的迭代速度呈爆发式发展。据 Gartner 发布的 2022 年需要探索的重要战略技术趋势显示,生成式 AI 是其中引人注目的人工智能技术之一。Gartner 预计到 2025 年,生成式人工智能将占所有生成数据的 10%,而目前这一比例还不到 1%。当前科技巨头们纷纷入局: 

2021年,OpenAI 团队推出人工智能绘画产品 DALL·E,用户输入简单文本或图像生成新的定制化图像,引发热议,今年进而升级到DALL·E 2。随后谷歌和 Meta 也相继发布相关产品,并发展出文字转视频功能。今年 8 月,Stable Diffusion 正式开源,为人们展现 AI 数字生产力在图像生成乃至艺术创作上的强大力量。

在国内,今年 7 月,IDEA 研究院认知计算与自然语言研究中心(IDEA CCNL)开源了第一个中文 CLIP 模型,目前已发布 4 个版本。11 月 1 日,开源了第一个中文版本的 stable diffusion 模型“太乙 Stable Diffusion”,标志着中文 AIGC 时代的到来。

在刚结束的 IDEA 大会,IDEA 研究院创院理事长沈向洋公布了一项重要的 AIGC 项目——“盖亚计划”,该计划旨在更好地助力中国 AIGC 文化产业数字化转型的创新发展。

01 从一图胜千言到一言胜千图,“盖亚计划”重磅发布

伴随算力和数据的数量级增长、大模型的持续迭代,AIGC 发展速度惊人,去年尚处于初级生疏阶段,如今已达到以假乱真的级别。在今年 9 月的科罗拉多州博览会美术比赛中,人工智能绘画《空间歌剧院》获得头奖。

沈向洋表示,“人工智能大模型发展的规模和速度,都到了今天我们不可忽视的地步。最新的技术可以通过一句话,创造出数不清的图像,每张都有自己的特点。可谓从一图胜千言,到了一言胜千图。”

他以高产的达芬奇为例,一些艺术史研究者猜测达芬奇可能不是一个人画这么多画,而是带领徒弟们画的。如今有了 DALL·E 等人工智能技术,每个人都有可能成为“达芬奇”,能低成本地让机器画出自己想要的画,AIGC 能提高数字生产力。

洞悉这些技术趋势变化,2021 年 5 月,IDEA 研究院认知计算与自然语言研究中心发起盖亚计划,致力于在预训练大模型时代,建设认知智能的基础设施,创造具备认知能力的AI数字生产力,推动 AI 学术和产业发展。

02 “盖亚”计划背后的黑科技

盖亚项目分为三层,底层技术基础是中文最大的开源预训练模型体系“封神榜”:GitHub - IDEA-CCNL/Fengshenbang-LM: Fengshenbang-LM(封神榜大模型) 是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。 - GitHub - IDEA-CCNL/Fengshenbang-LM: Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。https://github.com/IDEA-CCNL/Fengshenbang-LM“封神榜”作为以中文驱动的基础生态系统,涵盖预训练大模型、特定任务的微调应用、基准和数据集等,已拥有超过 88 个开源预训练模型,占全球中文开源预训练模型的10%(全球中文开源模型大概在800个)。

第一个中文版“太乙 Stable Diffusion”模型,在 Hugging face 上的一百多个 Stable Diffusion 里排名第三,几周前的下载量已突破 10 万。二郎神 UniMC 模型拥有2亿参数,多次获得FewCLUE/ZeroCLUE等榜单冠军。

“封神榜”开源模型目前参数超 10 亿,将数据和算力沉淀成具有认知能力的预训练模型,目标是成为海量下游任务和各种算法创新研究的坚实基础。

中间为赋能层 GTS 模型自动生产引擎,致力用“AI 生产 AI”,为特定场景以解决具体场景下定制化模型生产面临的人力贵和数据少的困境,快速产出 SOTA 模型,有效为 AI 企业降本增效。据悉,其独创的 GTS 训练体系,已拿到 FewCLUE 榜单冠军,证明机器首次超过人类顶级算法专家水平。

有了 GTS,每个用户可以低成本地生产属于自己的个性化 AIGC 模型。

最上面为应用创新层“方物 AI 创意图库”,用 AIGC 技术打造中文最大图像集合,用机器来帮助扩展人类的想象力。采用最先进的模型和引擎,提供最有价值的用户体验,探索 AIGC 标杆落地应用。

有了这些硬核黑科技的支撑,盖亚计划有效降低推理成本,从降低 AI 成本和服务门槛,如盖亚计划生成单张的图像为 0.2 分人民币,而 Stability 生成单张图像为 0.5 分人民币,OpenAI 生成单张图像 5 分人民币。

目前,“盖亚计划”团队有 40 人,全为毕业于全球顶尖高校的 90 后成员,仅成立的一年多时间里,已发表 14 篇论文,并多次取得 FewClue 和 ZeroClue 冠军。在硬核人才储备和扎实技术支持下,“盖亚计划”生态建设蓬勃发展,目前已达成与华为昇腾和阿里达摩院 Modelscope 共建中国开源模型生态的一致目标。并于清华、港中文、中科大、上交大等高校以及追一科技、小冰等达成模型共建的共识并开展合作,为中国 AIGC 产业高速发展加码助力。

以上是关于加码中文 AIGC,IDEA 推出“盖亚计划”的主要内容,如果未能解决你的问题,请参考以下文章

一句话生成“DC 神奇女侠”,精通中文的国产AIGC神器来袭

抖音阿里加码“源头好物”,为何大厂都有拥抱“土味”的心?

重磅 | 美国AI再加码:投资2.2亿美元新增11个国家AI研究中心,包含2个边缘计算研究中心...

百度用AIGC开启2023“好运中国年”,玩法升级陪你过新春

百度用AIGC开启2023“好运中国年”,玩法升级陪你过新春

全球网友元宵一起创作赏月图,体验百度文心大模型AIGC创造力