AI告你侵权?别慌,都是人训练出来的

Posted 资讯快报

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AI告你侵权?别慌,都是人训练出来的相关的知识,希望对你有一定的参考价值。

前段时间
  
  一位软件工程师
  
  Ben Dickson
  
  “破获”一家
  
  由AI“开办”的
  
  诈骗律师事务所
  
  着实让小编看到人工智能的强大
  
  或者说“人工”的强大
  
  上期,我们谈到人工智能变成人工智障的趣事,这一期我们来聊聊这些人工智障背后的那些小秘密——人工神经网络。话不多说,我们先从Ben的视角看看这起离奇的案子。
  
  某天,坐在家中的Ben Dickson收到一封名为“DMCA版权侵权通知”的邮件,声称他所使用的一张图片涉嫌侵权,这就让Ben有点摸不到头脑了,作为一名论坛老江湖,他深知版权的重要性,明明自己使用的图片来自于一个免费的在线图库Pexels,为什么这张图突然就有了法律上的“主人”了呢?
  
  老辣的Ben Dickson一顿追根溯源,调查到了一家名为Arthur Davidson的法律事务所,打开其官网,整个官网做的有模有样,甚至连域名都是正规的,这家律所自2009年到现在,总共参与过420起案件,其中有380场胜诉,胜诉率高达90%。
  
  但奇怪的是,这家如此厉害的律所却从未上过新闻,甚至连谷歌都没有相关的信息和报道。除此以外,尽管这家律所已经成立了13年,但官网所用域名却是在2022年2月才刚刚建立的。当然,仅凭这些疑点去断定这家律师是假的显然不够严谨。而在打开这些律师的详情页面后,他已经可以确定这家Arthur Davidson绝对是一家假的律所。
  
  Ben在经过对比律师的照片后发现,包括与他联系的律师在内,这些名校出身的律师全部都是AI的“杰作”:他们的照片全部都是由生成对抗网络GAN创建的图片,也就是说这些人根本不存在。
  
  

既然这些人全都不存在,那么这起侵权邮件的骗局也不攻自破,而这其中所运用的人工智能技术让身边满是“人工智障”的小编感到惊讶,这些新奇AI换脸技术是依靠什么实现的呢?这就不得不提到是时下大热的深度学习了。
  
  深度学习是机器学习领域的一个分支,20多年来,通过一系列的商业应用主导了人工智能的研究,而深度学习的概念则来自于人工神经网络的研究。与人脑的认知结构相似,深度学习也是根据层次化的概念体系来理解世界,通过不同层次中概念的关系来定义这些概念。
  
  说 人话就是:像婴儿认识这个世界一样,由浅入深的学习。比如人们区别棕榈树和椰子树,同样是由树干、树枝、树叶组成的植物,人们会先通过一些显著的特征进行 区别,再次细化后会通过树皮、叶片裂纹等信息判断,如果想要再深入一点,还会有花期、种植适宜温度等,深度学习也是如此。
  
  而随着训练数据量以及计算机软硬件水平的飞速发展,深度学习的规模也逐渐扩大,精度也在不断提高,在著名的ImageNet竞赛上,AI在识别约1000类物体的准确率上已达到95%。当然,也有大量的深度学习模型被不断地被开发出来,例如:
  
  卷积神经网络
  
  (Convolutional Neural Network, CNN)
  
  第一个解决重要商业应用的神经网络,适用于诸多领域且表现优异。
  
  循环神经网络
  
  (Recurrent Neural Network, RNN)
  
  用于处理序列数据的神经网络,能以很高的效率对序列的非线性特征进行学习 。
  
  递归神经网络
  
  (Recursive Neural Network)
  
  主要用于自然语言处理和计算机视觉,与循环神经网络不同,它的结构并非链状而是树状结构。
  
  生成式对抗网络
  
  (Generative Adversarial Nerwork,GAN)
  
  一种基于可微生成器网络的一种生成式建模方法,主要解决的问题是从训练样本中学习新的样本。
  
  好的模型是深度学习能否成功的关键之一,通过这些优秀的模型,人们已在商业领域成功实现了深度学习的部分价值,例如语音助手、刷脸支付、自动翻译、图片识别等等。但就在深度学习实现价值的同时,我们可以发现,深度学习的训练数据量以及参数量也在以惊人的势头增长:支撑深度学习,或者说人工智能的重要因素就是算力规模以及基础设施。
  
  

这堵无形的墙在制约着人工智能发展的同时,也是促使其逐渐成熟的动力之一。在这方面,作为未来科技领航者的戴尔,拥有十分丰富的人工智能解决方案以及诸多适用于AI的基础设施,助力企业在AI时代破浪前行。
  
  例如新一代戴尔PowerEdge服务器,充分利用最新第三代英特尔 至强 Platinum处理器的优势,在提供极高可靠性的同时,兼顾高算力、高稳定性和敏捷性,帮助PowerEdge为至关重要的工作负载提供支持,PCle Gen 4.0也极大的提高了吞吐性能;每台服务器最多可配置最多六个GPU加速器,能够满足严苛的数据密集型工作负载。
  
  

值得一提的是,戴尔PowerEdge服务器也拥有强大的自主智能,其内部嵌入的OpenManage Enterprise系统管理控制台能够减少落地步骤,节约开发人员宝贵的时间,帮助用户实现自主部署、配置以及管理的基础架构。
  
  当 然,训练人工智能需要应对各种不同的工作负载,除了算力以外,海量的数据以及数据的实时处理也是人工智能训练的重中之重。对此,戴尔PowerScale 作为横向扩展的NAS存储,可在单个文件系统中扩展PB级容量,它搭载的新一代OneFS系统,能够确保开发人员加快分析速度,更快的获取训练结果。
  
  面对极为严苛的人工智能工作负载,戴尔PowerScale可以凭借强大的自动分层技术以及横向扩展结构,消除传统存储解决方案的性能瓶颈,为海量训练数据及参数提供一致、可靠的性能。
  
  人类大脑的进化是为了适应不断变化的外部环境以及由其引起的一系列新的挑战,人工智能就像人类大脑在新时代的一次全新的进化方向。目前,人工智能正在以迅猛的势头不断发展,而戴尔科技也将以自身的科技优势支持企业在这片未知的领域中不断前行。

以上是关于AI告你侵权?别慌,都是人训练出来的的主要内容,如果未能解决你的问题,请参考以下文章

Copilot被索赔90亿美元!因侵权问题,20年老程序员激活律师证对其发起集体起诉...

GitHub遭炮轰:Copilot“抄袭”已经失控,为训练AI侵权整个社区

码农人,码农魂。码农都是人上人,C语言编程训练题

电阻存储器为edge-AI提供了仿生架构

AI律师出道,「倒贴」100万美元帮人类打官司

问答 | 百度 PaddlePaddle 1.0 正式发布啦,感觉百度最近宣传势头挺猛的呀,有小伙伴用吗~