AI性能调优:过去已解,未来可知?
Posted 戴尔商用客户端解决方案
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AI性能调优:过去已解,未来可知?相关的知识,希望对你有一定的参考价值。
去
年我曾写过一篇,看了的朋友应该对以DPO(Dell Precision Optimizer)为代表工作站优化软件及其性能提升有一定了解。
由用户反馈知改进
在一共65位投票读者中,已经使用工作站调优软件(通常随品牌工作站免费附带)的比例达到40%;直接使用操作系统默认设置而不做优化的占26%;对工作站调优软件有兴趣,但不确定其应用程序是否被支持占比20%;最后还有9%的高级用户选择手动优化工作站的操作系统、显卡等性能相关设置。
注:根据进一步的读者留言,意识到选D的读者也可能符合B的情况,反之亦然。
简单总结一下,可能有60%左右的工作站用户尚未使用厂商提供的调优软件,大致分为以下3种情况:
1、 不了解,或者不确定其效果;
2、 尽管工作站优化软件已经支持大多数常用CAD、DCC等图形设计、应用软件,但还有一部分未被覆盖的用户;
3、 对于手动优化工作站性能的用户,应该属于技术水平较高的。但这部分人群不见得反对使用DPO类软件,也有可能是因为应用程序未被支持,或者认为其优化效果不够明确?
注:下文中还会补充一条“4”,算是工作站优化软件另一点有待补强之处。
本次测试使用了一台Dell Precision 5820 Tower工作站
如今,Dell Precision Optimizer优化软件的大版本已经从V3升级到V5,其中最主要的一条改进就是加入了“AI人工智能优化”,运用机器学习的原理,动态分析各种未知/已知工作站应用软件的硬件资源开销特点,针对性地生成调优参数来优化其性能。
如上表,左边的DPO标准版不带AI动态优化,以及在用户之间分享调优配置文件的功能,仍保持免费;DPO Premium高级版本,提供全功能并且可以申请试用30天;最右边的DPO Linux也是今年刚推出的新版本,开始对非Windows操作系统的工作站(RHEL,注意不是UNIX)提供支持。
上图就是激活了DPO Premium License的状态,点击“切换到高级”,就可以使用新的AI优化模式。
另外在传统的预置固定配置文件的模式下,个人认为还有一点局限,那就是同一款软件的功能模块现在越来越丰富,不同人使用特点导致其性能瓶颈可能存在于不同的组件(显卡/CPU等)上,那么以一套固定的调优参数在有的情况下可能达不到最好的效果?
比如上图中的Autodesk 3dsmax,Dell DPO就提供了(图形)交互和计算(渲染)两种不同的配置文件。而有了AI优化之后,理论上能够做到针对用户更加量身定制的优化效果。本文希望能通过对新功能的测试,帮助大家全面了解DPO Premium。
老软件、“偏门”图形工作站应用优化测试
以前向大家介绍过Siemens NX和PTC Creo性能测试;而这次的测试目标明显不同,主要是探索未知的情况,甚至去尝试Dell研发团队在实验室中测试不到的应用软件。
在高级模式下,优化的第一步就是添加使用的应用程序。为了选择测试软件和测试方法费了一番功夫,翻出10年前左右收藏的图形工作站BenchMark工具——它们都是运行在用户真实环境下、对有代表性的三维模型进行一系列典型操作,统计时间消耗来计算出性能得分。
测试原则1: 首先要找出不在DPO标准模式支持列表中的应用,这样即便手动激活了某个/某些优化配置文件,DPO没有探测到对应的软件运行也不会实际应用这些参数。AI优化在许多时候就是要解决这样的问题。
测试原则2: 测试方法/ BenchMark工具在业内足够权威,并且测试结果可以复现。
被选中的第一个是LightWave 3D 9.6,它曾经是和3dsmax、Maya、Softimage齐名的3D动画类(DCC)软件,记得十多年前曾为LightWave在国内的新版本发布会准备过工作站样机。
这些年对LightWave关注不多,当年的9.6版本使用专业的OpenGL显示接口,著名的SPEC组织还曾为它推出过一个测试软件包。令人惊喜的是LightWave 9.6 x64在Windows 10系统下能够良好运行。
在DPO AI优化选择应用程序的菜单中,可以看到最近打开的软件基本都出现在列表中,先尝试勾选2个可能相关的,然后进入学习用户使用习惯的环节。
接下来开始运行SPECapc for LightWave 9.6基准测试,以模拟应用跑起来的状态。如下图:在DPO 5.0的用户手册中,提到“学习一个应用程序通常需要1-5个小时”,可能是运行了综合维度的测试,每次几乎要跑到4小时以上才使进度条走到100%。
这里也说明了:“AI优化模式,同样适用于已被DPO传统模式支持——即内置优化配置文件的应用程序”。在前2款软件的测试讲完之后,会对此作一个相关的验证。
当LightWave达到“已优化”的状态后,提示需要重启应用程序才能使显卡优化策略生效。
以上测试数据按照SPEC的建议运行3次,取平均值以避免误差。可以清楚地看到AI性能优化的效果,其中以多任务测试比较明显——综合得分提高了24.7%。
某一款软件的测试结果并不足以全面反映DPO Premium的价值,好戏还在后面
可能有读者朋友好奇:你这个SPECapc for LightWave 9.6都测试的什么内容?下面简单举个例子——
LightWave“蝗虫”测试场景
查看一个动画模型的预览速度
SPECapc for LightWave 9.6测试软件一共包括12个模型,上图列出的是其中4个。所谓Multitask多任务测试,就是对一个模型渲染的同时,对另外几个模型进行预览等其它操作。
Q
每台工作站AI优化都要“学习“这一过程吗?
答案: 可以不用,因为DPO Premium支持对机器学习得到的配置文件导出、导入操作。如下图:
这个优化配置文件分享的功能,在大型用户——多人运行同一软件,并且操作特点/使用习惯接近时比较有用,不需要每台机器都“学习”一遍,不只是为了节约时间,也能够减少管理工作量。
PTC Pro/E野火版2.0 AI优化测试
一个10年流行过的软件Pro/ENGINEER,现更名为Creo,当前的DPO优化软件已经无法识别Pro/E并加载预置的针对Creo的优化参数。那么如果有人使用Pro/E的话,AI优化能给我们带来帮助吗?
顺便交代一句,Pro/ENGINEER Wildfire 2.0对Windows 10的支持就没有那么好了,不过这也在情理当中。而DPO则保持着对Windows 7的良好兼容,因为Dell Precision 5820、7820、7920 Tower等型号工作站还都官方支持Win7系统。
扩展阅读
《双Xeon SP只用一个风扇?Percision 7920工作站散热设计解析》
《双Xeon SP工作站,我却没找到第二个CPU插槽?》
在NVIDIA Quadro P4000专业显卡的驱动界面中,可以看到LightWave 3D、Pro/ENGINEER仍在自动识别的优化列表中,不过在此更多是为了保证兼容性,而在性能方面的设定可能偏保守。这些也在DPO要解决的问题之中。
从上图中并未看到2-3倍这样的提升,DPO在大多数实际应用中能达到这样的效果,已让人感到满意了。阅读过去年评测文章的读者应该理解,内容里并不主张把这类性能调优软件“神话”,DPO是为了更好地将工作站硬件的潜力发挥出来,比方说它不是要把低价位的机器当高价位的使用,而是避免低价位的设备在不经意间只跑到更低价位的区间的性能。
试想一下:对于DPO标准版(也包括不带AI优化的4.x及之前版本)来说,一个免费随机工具假设能帮助用户提升5-10%或以上的生产效率,是否已超出预期的效果?
当然DPO Premium提供更多的价值,目前它可以申请30天试用,应该也是为了收集更多用户的反馈信息。
下面是SPECapc Pro/ENGINEER Wildfire 2.0的测试片段:
PTC“赛车”测试模型
对于还不了解BenchMark测试结果计算方法的朋友,上文中的分数对比或许不容易直观理解,那么以下列出的每个测试(系列)步骤的时间——越短代表运行速度越快。
翻译的内容或许有点出入,但可以看出DPO Premium对一款十多年前的三维CAD(制造业)软件,仍能达到全面的优化效果。
DPO Premium AI优化使用技巧分享
前面部分测试了2款过去的图形工作站应用都能胜任,后部再尝试下AI优化对“已知的”、当前应用的优化情况。
这里先给大家分享一点小技巧:在DPO AI优化的选择应用程序界面中,有时需要手动浏览打开具体的主程序文件,才能顺利分析其工作负载。根据以前对Pro/E的了解和判断,PTC Creo仍然使用的是xtop.exe这个主要进程。
类似于前面介绍过的AI学习过程,运行几次SPECapc for PTC Creo 3.0测试后,DPO Premium就完成了对应用的优化。下面看一下性能对比结果:
如上图,可见DPO AI优化对SPECapc for PTC Creo 3.0基准测试的结果影响仍然很大,与之前测试过的DPO v3.5版本传统优化效果相仿(Quadro P4000显卡比上一代M4000要更快些)。
用于SPECapc for PTC Creo 3.0的赛车模型,还是基于以前Pro/E测试中那个WorldCar 2001,不同的是复杂度(多边形、顶点数量等)有较大提升。
再看下分类性能统计:DPO对线框图形的优化效果更好一些,这也恰好是图形工作站/专业显卡的强项所在。有兴趣进一步了解测试对比细节的朋友,可以参考去年那篇文章中的对比视频。
总结:AI优化给我们带来了什么?
有人说,对每一款工作站应用软件的优化配置文件,就是Dell Precision Optimizer性能优化模块的IP(知识产权)核心价值。而DPO还有系统监控分析、维护——更新和集中管理(需要配合微软SCCM)等功能。
在AI/机器学习技术应用之前,可以想象性能调优模块背后反复的参数调节和测试工作量,因为除了提高效率,DPO还要保证对多种新老软硬件环境充分兼容。
今天的DPO Premium,相较于之前,这套分析算法“训练”成熟了,可以让它去“推理”、帮助更多运行“未知应用”的工作站用户。期待将来有人做更多的尝试、揭秘出多样的性能优化对比。
点
阅读原文,查看更多
以上是关于AI性能调优:过去已解,未来可知?的主要内容,如果未能解决你的问题,请参考以下文章
为数据库性能调优插上 AI 的翅膀 | 调优测试框架 Matrix 团队访谈