干货|未来人机区分——基于语言认知的智能验证码

Posted 2021-05-01 全球人工智能

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了干货|未来人机区分——基于语言认知的智能验证码相关的知识，希望对你有一定的参考价值。

全球人工智能

来源：知识工厂编辑：张怡菲

引言

是人，还是机器？这是个问题。当机器智能突飞猛进，智能的光环已不再唯“我”所有。当智能机器无处不在，我们无奈发出“喂，是你吗?” 此类确认同类之询问。人工智能盛行的时代，谁来保卫人性的最后一隅？智能机器横行之未来，谁来捍卫人类独享之尊严？是我们最为熟悉却又最为陌生的验证码。小小验证，广阔未来。当下，基于图片识别的验证方法在强大的机器感知能力面前已经力不从心。机器智能的进步呼唤全新的人机区分方式。语言认知这块尚未被攻破的壁垒是我们维系人类尊严的最后希望。

——知识工场肖仰华

干货|未来人机区分——基于语言认知的智能验证码

下面这张图大家一定很熟悉，是每次购买火车票时必玩的看图识字“小游戏”，然而有时图片模糊，文字表述不清晰，少选多选都不正确，过不了这关出差急着买票很捉急！为什么现在验证码变得这么复杂了？对于各类提供数据服务的网站和平台而言，最为苦恼之处在于给人类用户提供数据服务的同时，却又要防止各类爬虫肆虐地抓取。大数据时代下，数据安全性对网站和网民都至关重要。验证码是网站识别真人或机器人的主要手段，其对于防治垃圾注册、恶意登录、虚假交易、数据破坏等互联网中的安全雾霾具有重要意义。优秀的验证码既能被人快速识别填写，又无法被机器破解。

干货|未来人机区分——基于语言认知的智能验证码

传统验证码的不安全性

市场上现有的主流验证码包括数字验证码、汉字验证码、拼图拖拽验证码等。这些基本都是视觉型验证码，即通过人对图像的识别来完成验证过程，这些验证码的设计初衷是机器无法识别图像。

然而，随着机器学习，特别是近年来深度学习在计算机视觉领域上的发展，图像验证码变得很容易被破解，这对传统验证码提出了巨大的挑战。以下是两个常见的验证码被机器破解的例子：

1、图像验证码：

干货|未来人机区分——基于语言认知的智能验证码

机器破解：

干货|未来人机区分——基于语言认知的智能验证码

2、拖拽验证码：

干货|未来人机区分——基于语言认知的智能验证码

机器破解：

干货|未来人机区分——基于语言认知的智能验证码

干货|未来人机区分——基于语言认知的智能验证码

基于机器语言认知的超级验证码

知识工场强势推出“超级验证码”：一款基于机器语言认知和知识图谱的新一代验证码。以自然语言理解和问答为呈现形式，超级验证码给出常识性文本描述和对应问题，让用户在限定时间内在文本中找出答案，答对即验证通过。

举一个简单的例子：当你点击进入“超级验证码”链接

（http://218.193.131.250:8866/）后，你将看到如下界面：

干货|未来人机区分——基于语言认知的智能验证码

超级验证码随机生成的问题为“岑钊雄的职业是什么？”，给出文本描述：“岑钊雄（Cen Zhaoxiong），中国著名企业家、慈善家、社会活动家。1970年11月出生，广东南海人”。你需要在文本描述里找到答案，即找到岑钊雄的“职业”是什么，才能验证通过。

本题的正确答案为“企业家”、“慈善家”、“社会活动家”，点击这三个词条的任意一个即可验证通过，是不是简单又有趣？

干货|未来人机区分——基于语言认知的智能验证码

与传统验证码相比，我们的验证码超级在哪里？

1

难以攻破

从机器破解的角度，超级验证码的回答涉及精确的文本语义理解和常识推理，这两部分是当前人工智能技术的短板，特别是常识推理，几乎是空白，所以现阶段即使最强大的人工智能系统也无法破解超级验证码，而人则可以轻松做出回答。

2

用户友好

从人机交互的角度，超级验证码只需简单阅读，轻轻一点即可通过验证，用户体验友好。

自动生成降低验证码的生成成本

超级验证码底层技术基于知识工场现有知识图谱CN-DBpedia长期积累的上亿条知识，从上亿的文本中产生问题。海量的知识和文本数据，保证了验证码的不重复性和无法破解性。

API接口：http://kw.fudan.edu.cn/apis/supervcode/

目前，我们推出的基于复旦大学相关词条的超级验证码已上线，更多版本的验证码敬请期待。未来，知识工场将结合人工智能和知识图谱的先进技术，推出更多领域的产品和服务，在实际业务场景中帮助企业和用户走得更远更好，感谢您的关注。

热门文章推荐

以上是关于干货|未来人机区分——基于语言认知的智能验证码的主要内容，如果未能解决你的问题，请参考以下文章

验证码绕过

基于python语言的tensorflow的‘端到端’的字符型验证码识别

基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)

人机识别技术再升级，AIGC为验证码带来万亿种新变化

如何识别图片验证码？

极验滑块坐标识别