专属大模型来了！还有ECS降价40%50款产品免费试用｜阿里云峰会亮点一览

Posted 2023-04-12 云布道师

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了专属大模型来了！还有ECS降价40%50款产品免费试用｜阿里云峰会亮点一览相关的知识，希望对你有一定的参考价值。

4 月 11 日，阿里巴巴集团董事会主席兼 CEO、阿里云智能集团 CEO 张勇在云峰会上表示，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造。

自 2019 年起，阿里即开始进行大模型研究，并在近期推出阶段性的研究成果：通义千问大模型。钉钉、天猫精灵等产品在接入通义千问测试后，变得聪明了很多，像天猫精灵，不仅能回答家里小朋友的各种刁钻问题，还多了一份情感连接，成为更温暖更人性化的智能助手。

阿里巴巴决定未来将所有产品接入通义千问，进行全面改造。张勇表示，面向 AI 时代，所有产品都值得用大模型重做一次，基于这一信念，阿里云希望帮助更多企业用上大模型，让每家企业都能基于“通义千问”，拥有具备自己行业能力的专属大模型。

张勇还表示，让计算成为公共服务是阿里云始终不变的追求，未来核心要做好两件事情：第一，让算力更普惠，推动自研技术和规模化经营的正循环，持续释放技术红利；第二，让 AI 更普及，让每家企业的产品都能接入大模型升级改造，并有能力打造自己的专属大模型。

过去十年，阿里云提供的算力成本下降了 80%，存储成本下降了近 9 成。阿里云将进一步降价，释放技术红利。阿里云通过软硬一体技术的研发，扩大自研 CPU 倚天 710、云数据中心处理器 CIPU、自研数据中心网络等核心技术应用，推动技术创新、规模化运营和成本降低的正循环，不断降低客户用云成本。

此外，阿里云智能 CTO 周靖人宣布发布 ECS 企业级通用算力型 U 实例，价格对比上一代主售实例最高可下降 40%，同时推出对象存储预留空间产品，价格最多可降 70%。此外，阿里云还向开发者推出“飞天免费试用计划”，开放全栈云产品体验，首批推出 50 多款核心产品免费试用，时长最多可达 3 个月。

“成本是企业上云的核心关注点之一，阿里云进一步释放技术红利，为中小企业用户提供优质算力。”周靖人在会上表示，阿里云将进一步深挖“飞天+CIPU”体系潜能，用技术和创新惠及更多中小企业和开发者，降低创新成本。

ECS 企业级实例降价 40% 对象存储预留空间产品最多降 70%

云计算是一种高效的资源使用方式，目前国内数据中心的 CPU 平均利用率在 10% 左右，而在云计算可达传统数据中心的 5 到 10 倍。随着云计算在互联网场景，包括政府、金融、制造等行业不断普及，单位算力的使用成本将不断降低。

为了让更多的企业特别是中小企业更加充分地享受云计算红利，阿里云推出新款通用算力型 ECS 云服务器 Universal 实例（简称 U 实例）。U 实例整合了多种云服务器规格，无需进行复杂的资源配置，售价相比上一代主售实例降幅最高可达 40%，更适合 Web 应用及网站、企业办公类应用、离线数据分析、中小型数据库等典型应用场景，具备与其他同类产品一致的稳定性和用户体验。同时，阿里云还推出了“0 元升配”活动，符合条件的用户可免费升级至第 7 代 ECS 实例。

用户还可通过预留云上存储空间和锁定购买时长，来获得更低的长期存储成本。新发布的对象存储预留空间产品 OSS-RC，用户购买 1TB/年、1PB/年的存储费用相比按量付费分别下降量 36% 和 50%；若选择无地域属性预留空间，10TB/年、1PB/年的存储费用分别可下降 64% 和 70%，更适用于互联网音视频、云相册、数据备份等多种业务场景下的数据存储与管理。

50 多款云产品免费试用

除了帮助用户优化成本外，阿里云还向开发者们抛出橄榄枝，推出“飞天免费试用计划”，面向 1000 万云上开发者，提供包括 ECS、数据库 PolarDB、机器学习 PAI 等在内 50 款云产品的免费试用，时长支持 1 个月、3 个月到长期免费，可支持开发者构建包括在线、大数据类、AI 等不同类型应用，并且支持 serverless 的开发模式。同时还提供完备的产品文档、一键部署的技术解决方案、1000 多门免费课程，让开发者“零门槛”体验云服务。

全面 serverless 化支撑组装式研发

为了降低云上开发门槛，阿里云广泛布局 serverless、弹性容器、函数计算等产品技术，引导开发者进行组装式开发，非技术人员也可以参与到开发中来。

以高德地图为例，得益于 Serverless 的零运维特性，客户端开发人员可独立开发和发布卡片、气泡等精准服务，使用函数计算实现多变的业务逻辑。这些后端服务又能沉淀为可复用业务模块，支持独立迭代，风险大幅降低。目前，高德采用组装式开发模式构建的新平台已承载 100% 的生产流量，业务规模达到百万 QPS。功能交付时间从天缩短至小时，整体成本降低了 38%。

“以模块化、可编程、可视化、服务化为特征的组装式开发将成为未来主流的开发范式。”周靖人表示，阿里云正全面推动核心云产品 Serverless 化，以此支撑组装式开发范式的应用和普及。

阿里云全栈云产品免费试用操作步骤如下

点击文末“阅读原文”立即免费试用。

专属大模型来了！还有ECS降价40%、50款产品免费试用｜阿里云峰会亮点一览

单卡就能运行AI画画模型，小白也能看懂的教程来了，还有100万卡时免费NPU算力可用丨昇思MindSpore...

允中发自凹非寺
量子位 | 公众号 QbitAI

昇思MindSpore首个可训练的diffusion模型DDPM马上要和大家见面了，操作简单，可训练+推理，单卡即可运行，欢迎广大产学研开发者使用启智社区免费Ascend NPU算力体验。

最近爆火的AI绘图，相信大家并不陌生了。

从AI绘图软件生成的作品打败一众人类艺术家，斩获数字艺术类冠军，到如今DALL.E、Imagen、novelai等国内外平台遍地开花。

也许你也曾点开过相关网站，尝试让AI描绘你脑海中的风景，又或者上传了一张自己帅气/美美的照片，然后对着最后生成的糙汉哭笑不得。

那么，在你感受AI绘图魅力的同时，有没有想过（不你肯定想过），它背后的奥妙究竟是什么？

△美国科罗拉多州技术博览会中获得数字艺术类冠军的作品——《太空歌剧院》

一切，都要从一个名为DDPM的模型说起…

DDPM是什么？

DDPM模型，全称Denoising Diffusion Probabilistic Model，可以说是现阶段diffusion模型的开山鼻祖。

不同于前辈GAN、VAE和flow等模型，diffusion模型的整体思路是通过一种偏向于优化的方式，逐步从一个纯噪音的图片中生成图像。

△现在已有生成图像模型的对比

有的小伙伴可能会问了，什么是纯噪音图片？

很简单，老式电视机没信号时，伴随着“刺啦刺啦”噪音出现的雪花图片，就属于纯噪音图片。

而DDPM在生成阶段所做的事情，就是把这些个“雪花”一点点移除，直到清晰的图像露出它的庐山真面目，我们把这个阶段称之为“去噪”。

△纯噪音图片：老电视的雪花屏

通过描述，大家可以感受到，去噪其实是个相当复杂的过程。

没有一定的去噪规律，可能你忙活了好半天，到最后还是对着奇形怪状的图片欲哭无泪。

当然，不同类型的图片也会有不同的去噪规律，至于怎么让机器学会这种规律，有人灵机一动，想到了一种绝妙的方法：

既然去噪规律不好学，那我为什么不先通过加噪的方式，先把一张图片变成纯噪音图像，再把整个过程反着来一遍呢？

这便奠定了diffusion模型整个训练-推理的流程：先在前向过程（forward process）通过逐步加噪，将图片转换为一个近似可用高斯分布的纯噪音图像；

紧接着在反向过程（reverse process）中逐步去噪，生成图像；

最后以增大原始图像和生成图像的相似度作为目标，优化模型，直至达到理想效果。

△DDPM的训练-推理流程

到这里，不知道大家的接受度怎样？如果感觉没问题，轻轻松松的话，准备好，我要开始上大招（深入理论）啦。

1.1.1 前向过程（forward process）

前向过程又称为扩散过程（diffusion process），整体是一个参数化的马尔可夫链（Markov chain）。从初始数据分布x₀~q(x)出发，每步在数据分布中添加高斯噪音，持续T次。其中从第t-1步x_t-1到第t步x_t的过程可以用高斯分布表示为：

通过合适的设置，随着t不断增大，原始数据x₀会逐渐失去他的特征。我们可以理解为，在进行了无限次的加噪步骤后，最终的数据x_T会变成没有任何特征，完全是随机噪音的图片，也就是我们最开始说的“雪花屏”。

在这个过程中，每一步的变化是可以通过设置超参β_t来控制，在我们知晓最开始的图片是什么的前提下，前向加噪的整个过程可以说是已知且可控的，我们完全能知道每一步的生成数据是什么样子。

但问题在于，每次的计算都需要从起始点出发，结合每一步的过程，慢慢推导至你想要的某步数据x_t，过于麻烦。好在因为高斯分布的一些特性，我们可以一步到位，直接从x₀得到x_t。

注意，这里的和为组合系数，本质上是超参的β_t表达式。

1.1.2 反向过程（reverse process）

和前向过程同理，反向过程也是一个马尔可夫链（Markov chain），只不过这里用到的参数不同，至于具体参数是什么，这个就是我们需要机器来学习的部分啦。

在了解机器如何学习前，我们首先思考，基于某一个原始数据x₀，从第t步x_t，精准反推回第t-1步x_t-1的过程应该是怎样的？

答案是，这个仍可以用高斯分布表示：

注意这里必须要考虑x₀，意思是反向过程最后生成图像还是要与原始数据有关。输入猫的图片，模型生成的图像应该是猫，输入狗的图片，生成的图像也应该和狗相关。若是去除掉x₀，则会导致无论输入哪种类型的图片训练，最后diffusion生成的图像都一样，“猫狗不分”。

经过一系列的推导，我们发现，反向过程中的参数和，竟然还是可以用x₀，x_t，以及参数β_t，表示出来的，是不是很神奇~

当然，机器事先并不知道这个真实的反推过程，它能做到的，只是用一个大概近似的估计分布去模拟，表示为p₀(x_t-1|x_t)。

1.1.3 优化目标

在最开始我们提到，需要通过增大原始数据和反向过程最终生成数据的相似度来优化模型。在机器学习中，我们计算该相似度参考的是交叉熵（cross entropy）。

关于交叉熵，学术上给出的定义是“用于度量两个概率分布间的差异性信息”。换句话讲，交叉熵越小，模型生成的图片就越和原始图片接近。但是，在大多数情况下，交叉熵是很难或者无法通过计算得出的，所以我们一般会通过优化一个更简单的表达式，达到同样的效果。

Diffusion模型借鉴了VAE模型的优化思路，将variational lower bound（VLB，又称ELBO）替代cross entropy来作为最大优化目标。通过无数步的分解，我们最终得到：

看到这么复杂的公式，好多小伙伴肯定头都大了。但不慌，这里需要关注的，只是中间的L_t-1罢了，它表示的是x_t和x_t-1之间估计分布p₀(x_t-1|x_t)和真实分布q(x_t-1|x_t,x₀)的差距。差距越小，模型最后生成图片的效果就越好。

1.1.4 上代码

在了解完DDPM背后的原理，接下来就让我们看看DDPM模型究竟是如何实现…

才怪啦。相信看到这里的你，肯定也不想遭受成百上千行代码的洗礼。

好在MindSpore已经为大家提供了开发完备的DDPM模型，训练推理两手抓，操作简单，单卡即可运行，想要体验效果的小伙伴，只需要先

pip install denoising-diffusion-mindspore

然后，参考如下代码配置参数：

对重要的参数进行一些解析：

GaussianDiffusion

image_size: 图片大小
timesteps: 加噪步数
sampling_timesteps: 采样步数，为提升推理性能，需小于加噪步数

Trainer

folder_or_dataset: 对应图片中的path, 可以是已下载数据集的路径（str），也可以是已做好数据处理的VisionBaseDataset, GeneratorDataset 或 MindDataset
train_batch_size：batch大小
train_lr: 学习率
train_num_steps: 训练步数

如何借助启智社区运算DDPM模型？

DDPM模型运算可使用启智社区的NPU算力，具体操作可以参考下方的视频。

悄悄打一个广告，启智社区联合MindSpore为大家发福利啦，一年份100万卡时的免费算力，快去启智社区（https://openi.pcl.ac.cn/）体验吧~

“进阶版”DDPM模型MindDiffusion

DDPM只是Diffusion这个故事的开篇。目前，已有无数的研究人员被其背后瑰丽的世界所吸引，纷纷投身其中。

在不断优化模型的同时，他们也逐渐开发了Diffusion在各个领域的应用。

其中，包括了计算机视觉领域的图像优化、inpainting、3D视觉、自然语言处理中的text-to-speech、AI for Science领域的分子构象生成、材料设计等。

更有来自斯坦福大学计算机科学系的博士生Eric Zelikman大开脑洞，尝试将DALLE-2与最近另一个大火的对话模型ChatGPT相结合，制作出了温馨的绘本故事。

△DALLE-2 + ChatGPT合力完成的，关于一个名叫“罗比”的小机器人的故事

不过最广为大众所知的，应该还是它在文生图（text-to-image）方面的应用。输入几个关键词或者一段简短的描述，模型便可以为你生成相对应的图画。

比如，输入“城市夜景赛博朋克格雷格·路特科夫斯基”，最后生成的便是一张色彩鲜明，颇具未来科幻风格的作品。

再比如，输入“莫奈撑阳伞的女人月亮梦幻”，生成的便是一张极具有朦胧感的女人画像，色彩搭配的风格有木有让你想起莫奈的《睡莲》？

想要写实风格的风景照作为屏保？没问题！

△乡村田野屏保

想要二次元浓度多一点的？也可以！

△来自深渊风景绘画写实风格

以上这些图片，均是由MindDiffusion平台的下的悟空画画制作而成的哦，悟空画画是基于扩散模型的中文文生图大模型，由华为诺亚团队携手中软分布式并行实验室，昇腾计算产品部联合开发。

模型基于Wukong dataset训练，并使用昇思框架（MindSpore）+昇腾（Ascend）软硬件解决方案实现。

跃跃欲试的小伙伴先别着急，为了让大家拥有更好的体验，更多自行开发的空间，我们打算让MindDiffusion中的模型同样也具备可训练、可推理的特性，预计在明年就要和大家见面啦，敬请期待。

欢迎大家头脑风暴，生成各种别具风格的作品哦~

（据去内部打探情报的同事说，有人已经开始尝试“张飞绣花”、“刘华强砍瓜”、“古希腊神大战哥斯拉”了。ummmm，怎么办，突然就很期待成品了呢(ಡωಡ)）

One More Thing

最后的最后，在Diffusion爆火的如今，有人也曾发出过疑问，它为什么可以做到如此的大红大紫，甚至风头开始超过GAN网络？

Diffusion的优势突出，劣势也很明显；它的诸多领域仍是空白，它的前方还是一片未知。

为什么却有那么多的人在孜孜不倦地对它进行研究呢？

兴许，马毅教授的一番话，可以给我们提供一种解答。

但diffusion process的有效性、以及很快取代GAN也充分说明了一个简单道理：

几行简单正确的数学推导，可以比近十年的大规模调试超参调试网络结构有效得多。

或许，这就是Diffusion模型的魅力吧。

参考链接（可滑动查看）：

[1]https://medium.com/mlearning-ai/ai-art-wins-fine-arts-competition-and-sparks-controversy-882f9b4df98c

[2]Jonathan Ho, Ajay Jain, and Pieter Abbeel. Denoising Diffusion Probabilistic Models. arXiv:2006.11239, 2020.

[3]Ling Yang, Zhilong Zhang, Shenda Hong, Runsheng Xu, Yue Zhao, Yingxia Shao, Wentao Zhang, Ming-Hsuan Yang, and Bin Cui. Diffusion models: A comprehensive survey of methods and applications. arXiv preprint arXiv:2209.00796, 2022.

[4]https://lilianweng.github.io/posts/2021-07-11-diffusion-models

[5]https://github.com/lvyufeng/denoising-diffusion-mindspore

[6]https://zhuanlan.zhihu.com/p/525106459

[7]https://zhuanlan.zhihu.com/p/500532271

[8]https://www.zhihu.com/question/536012286

[9]https://mp.weixin.qq.com/s/XTNk1saGcgPO-PxzkrBnIg

[10]https://m.weibo.cn/3235040884/4804448864177745

以上是关于专属大模型来了！还有ECS降价40%50款产品免费试用｜阿里云峰会亮点一览的主要内容，如果未能解决你的问题，请参考以下文章