干货|未来人机区分——基于语言认知的智能验证码
Posted 全球人工智能
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了干货|未来人机区分——基于语言认知的智能验证码相关的知识,希望对你有一定的参考价值。
来源:知识工厂 编辑:张怡菲
引言
是人,还是机器?这是个问题。当机器智能突飞猛进,智能的光环已不再唯“我”所有。当智能机器无处不在,我们无奈发出“喂,是你吗?” 此类确认同类之询问。人工智能盛行的时代,谁来保卫人性的最后一隅?智能机器横行之未来,谁来捍卫人类独享之尊严?是我们最为熟悉却又最为陌生的验证码。小小验证,广阔未来。当下,基于图片识别的验证方法在强大的机器感知能力面前已经力不从心。机器智能的进步呼唤全新的人机区分方式。语言认知这块尚未被攻破的壁垒是我们维系人类尊严的最后希望。
——知识工场 肖仰华
下面这张图大家一定很熟悉,是每次购买火车票时必玩的看图识字“小游戏”,然而有时图片模糊,文字表述不清晰,少选多选都不正确,过不了这关出差急着买票很捉急!为什么现在验证码变得这么复杂了?对于各类提供数据服务的网站和平台而言,最为苦恼之处在于给人类用户提供数据服务的同时,却又要防止各类爬虫肆虐地抓取。大数据时代下,数据安全性对网站和网民都至关重要。验证码是网站识别真人或机器人的主要手段,其对于防治垃圾注册、恶意登录、虚假交易、数据破坏等互联网中的安全雾霾具有重要意义。优秀的验证码既能被人快速识别填写,又无法被机器破解。
市场上现有的主流验证码包括数字验证码、汉字验证码、拼图拖拽验证码等。这些基本都是视觉型验证码,即通过人对图像的识别来完成验证过程,这些验证码的设计初衷是机器无法识别图像。
然而,随着机器学习,特别是近年来深度学习在计算机视觉领域上的发展,图像验证码变得很容易被破解,这对传统验证码提出了巨大的挑战。以下是两个常见的验证码被机器破解的例子:
1、图像验证码:
机器破解:
2、拖拽验证码:
机器破解:
基于机器语言认知的超级验证码
知识工场强势推出“超级验证码”:一款基于机器语言认知和知识图谱的新一代验证码。以自然语言理解和问答为呈现形式,超级验证码给出常识性文本描述和对应问题,让用户在限定时间内在文本中找出答案,答对即验证通过。
举一个简单的例子:当你点击进入“超级验证码”链接
(http://218.193.131.250:8866/)后,你将看到如下界面:
超级验证码随机生成的问题为“岑钊雄的职业是什么?”,给出文本描述:“岑钊雄(Cen Zhaoxiong),中国著名企业家、慈善家、社会活动家。1970年11月出生,广东南海人”。你需要在文本描述里找到答案,即找到岑钊雄的“职业”是什么,才能验证通过。
本题的正确答案为“企业家”、“慈善家”、“社会活动家”,点击这三个词条的任意一个即可验证通过,是不是简单又有趣?
与传统验证码相比,我们的验证码超级在哪里?
从机器破解的角度,超级验证码的回答涉及精确的文本语义理解和常识推理,这两部分是当前人工智能技术的短板,特别是常识推理,几乎是空白,所以现阶段即使最强大的人工智能系统也无法破解超级验证码,而人则可以轻松做出回答。
从人机交互的角度,超级验证码只需简单阅读,轻轻一点即可通过验证,用户体验友好。
超级验证码底层技术基于知识工场现有知识图谱CN-DBpedia长期积累的上亿条知识,从上亿的文本中产生问题。海量的知识和文本数据,保证了验证码的不重复性和无法破解性。
API接口:http://kw.fudan.edu.cn/apis/supervcode/
目前,我们推出的基于复旦大学相关词条的超级验证码已上线,更多版本的验证码敬请期待。未来,知识工场将结合人工智能和知识图谱的先进技术,推出更多领域的产品和服务,在实际业务场景中帮助企业和用户走得更远更好,感谢您的关注。
以上是关于干货|未来人机区分——基于语言认知的智能验证码的主要内容,如果未能解决你的问题,请参考以下文章
基于python语言的tensorflow的‘端到端’的字符型验证码识别