干货|未来人机区分——基于语言认知的智能验证码

Posted 全球人工智能

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了干货|未来人机区分——基于语言认知的智能验证码相关的知识,希望对你有一定的参考价值。

全球人工智能


来源:知识工厂  编辑:张怡菲


引言


是人,还是机器?这是个问题。当机器智能突飞猛进,智能的光环已不再唯“我”所有。当智能机器无处不在,我们无奈发出“喂,是你吗?” 此类确认同类之询问。人工智能盛行的时代,谁来保卫人性的最后一隅?智能机器横行之未来,谁来捍卫人类独享之尊严?是我们最为熟悉却又最为陌生的验证码。小小验证,广阔未来。当下,基于图片识别的验证方法在强大的机器感知能力面前已经力不从心。机器智能的进步呼唤全新的人机区分方式。语言认知这块尚未被攻破的壁垒是我们维系人类尊严的最后希望。



——知识工场 肖仰华

干货|未来人机区分——基于语言认知的智能验证码

    

下面这张图大家一定很熟悉,是每次购买火车票时必玩的看图识字“小游戏”,然而有时图片模糊,文字表述不清晰,少选多选都不正确,过不了这关出差急着买票很捉急!为什么现在验证码变得这么复杂了?对于各类提供数据服务的网站和平台而言,最为苦恼之处在于给人类用户提供数据服务的同时,却又要防止各类爬虫肆虐地抓取。大数据时代下,数据安全性对网站和网民都至关重要。验证码是网站识别真人或机器人的主要手段,其对于防治垃圾注册、恶意登录、虚假交易、数据破坏等互联网中的安全雾霾具有重要意义。优秀的验证码既能被人快速识别填写,又无法被机器破解。


干货|未来人机区分——基于语言认知的智能验证码

传统验证码的不安全性


市场上现有的主流验证码包括数字验证码、汉字验证码、拼图拖拽验证码等。这些基本都是视觉型验证码,即通过人对图像的识别来完成验证过程,这些验证码的设计初衷是机器无法识别图像。


然而,随着机器学习,特别是近年来深度学习在计算机视觉领域上的发展,图像验证码变得很容易被破解,这对传统验证码提出了巨大的挑战。以下是两个常见的验证码被机器破解的例子:


1、图像验证码:


干货|未来人机区分——基于语言认知的智能验证码

 机器破解:

干货|未来人机区分——基于语言认知的智能验证码


2、拖拽验证码:


干货|未来人机区分——基于语言认知的智能验证码


机器破解:


干货|未来人机区分——基于语言认知的智能验证码


干货|未来人机区分——基于语言认知的智能验证码


基于机器语言认知的超级验证码


知识工场强势推出“超级验证码”:一款基于机器语言认知和知识图谱的新一代验证码。以自然语言理解和问答为呈现形式,超级验证码给出常识性文本描述和对应问题,让用户在限定时间内在文本中找出答案,答对即验证通过。


举一个简单的例子:当你点击进入“超级验证码”链接

(http://218.193.131.250:8866/)后,你将看到如下界面:


干货|未来人机区分——基于语言认知的智能验证码

        

超级验证码随机生成的问题为“岑钊雄的职业是什么?”,给出文本描述:“岑钊雄(Cen Zhaoxiong),中国著名企业家、慈善家、社会活动家。1970年11月出生,广东南海人”。你需要在文本描述里找到答案,即找到岑钊雄的“职业”是什么,才能验证通过。


本题的正确答案为“企业家”、“慈善家”、“社会活动家”,点击这三个词条的任意一个即可验证通过,是不是简单又有趣?


干货|未来人机区分——基于语言认知的智能验证码


与传统验证码相比,我们的验证码超级在哪里?


1
以攻破


机器破解的角度,超级验证码的回答涉及精确的文本语义理解和常识推理,这两部分是当前人工智能技术的短板,特别是常识推理,几乎是空白,所以现阶段即使最强大的人工智能系统也无法破解超级验证码,而人则可以轻松做出回答。


2
用户


人机交互的角度,超级验证码只需简单阅读,轻轻一点即可通过验证,用户体验友好。


自动生成降低验证码的生成成本


超级验证码底层技术基于知识工场现有知识图谱CN-DBpedia长期积累的上亿条知识,从上亿的文本中产生问题。海量的知识和文本数据,保证了验证码的不重复性和无法破解性。



API接口:http://kw.fudan.edu.cn/apis/supervcode/



目前,我们推出的基于复旦大学相关词条的超级验证码已上线,更多版本的验证码敬请期待。未来,知识工场将结合人工智能和知识图谱的先进技术,推出更多领域的产品和服务,在实际业务场景中帮助企业和用户走得更远更好,感谢您的关注。


热门文章推荐







以上是关于干货|未来人机区分——基于语言认知的智能验证码的主要内容,如果未能解决你的问题,请参考以下文章

验证码绕过

基于python语言的tensorflow的‘端到端’的字符型验证码识别

基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)

人机识别技术再升级,AIGC为验证码带来万亿种新变化

如何识别图片验证码?

极验滑块坐标识别