再说说人工智能
Posted david_lv
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了再说说人工智能相关的知识,希望对你有一定的参考价值。
(1)我们在探索应用
一、自然语言处理
自然语言处理是我们应用最广泛的。所以我们除了机器翻译没有探索外,其他我们都有涉猎:
1、多轮问答、会话
2、意图识别、情感分析
3、搜索、推荐
4、摘要、生成、Table2Text
二、语音
语音和自然语言处理比较近。
虽然我们也需要语音识别、语音转文本、文本转语音合成。
但国内有科大讯飞这个专业厂商在,我们就不研究了。
三、视觉
视觉四小龙主要聚焦在:人脸识别了。
而我们仍然聚焦在和自然语言处理相近的视觉,那就是OCR。
OCR也分很多应用任务:
1、证照识别
2、单据票据识别:包含票据里的印章弯曲文字识别
3、文档OCR:如文档中的复杂表格识别,甚至还有手写签名识别
4、自然场景下OCR:如道路标识、门头、菜单/商品说明
四、应用场景
我们也确定了:社会计算,这一应用主题。
围绕社会计算:社会化营销-社会化供应链-社会化金融,是我们确定的三大应用场景。
这三大应用场景,我们在2019(社会化营销)、2020(社会化供应链)、2021(社会化金融)也做了许多工作。
(2)我们也在夯实基础
一、经典机器学习
我们在不断探索:经典的概率统计、分类聚类
我们也在不断探索:时间序列预测、运筹学
二、知识嵌入
我们在不断探索:知识图谱/事件图谱、图神经网络
我们也在不断探索:因果推断、知识推理
三、少数据少样本少训练
我们在不断探索:Transformer、骨干网络结构
我们也在不断探索:迁移学习、对比学习、强化学习,期盼做到自监督、无监督
四、多模态
我们主要在一梭子Transformer横穿自然语言处理、视觉OCR两大数据和应用领域
当然,我们也在期盼有一梭子的方法,能横穿中文、英文。我们发现很多方法对于英文效果很好,但就不适用于中文。
(3)期盼业界突破
微软亚洲研究院堪称是中国人工智能的黄埔军校。
有擅长人才吸引的:李开复
有擅长理论研究的:沈向洋
有擅长工程实现的:张宏江
有擅长应用场景的:张亚勤
一、数据
突破方向有二:
1、突破一:中文。现在全世界人工智能领域,都是适合英文处理的理论方法、框架工具、数据集。中文的太少。
2、突破二:多模态
主要以北大人才为骨干的、张宏江博士做主力支持的智源研究院,在中文多模态数据集、中文巨模型的建设方面很好。
二、工具
现在满世界都是适合英文处理的理论方法、框架工具、数据集。中文的太少。中国幸好有了百度PaddlePaddle,这是一个适合处理中文的框架工具。
但是对不起,PaddlePaddle还主要在通用平台级,在应用任务级还有很多的空白、效果短板。
2020年,从微软亚洲研究院、百度出来的张亚勤,组建清华大学智能产业研究院(AIR),它的使命是:利用人工智能技术赋能产业升级。它主要面向三大应用场景:智能工业互联网、智能交通、智能医疗。
三、理论
在中文世界,人工智能理论突破性不多。我挺期盼沈向洋的。期盼他在清华大学高等研究院好好沉一沉。而且他作为小冰的董事长,小冰的海量多模态数据,也会给他的理论研究工作带来很好的辅助。
以上是关于再说说人工智能的主要内容,如果未能解决你的问题,请参考以下文章
手把手教你用python几行代码打造人工智能对话机器人,还说说话!