再说说人工智能

Posted david_lv

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了再说说人工智能相关的知识,希望对你有一定的参考价值。

(1)我们在探索应用

一、自然语言处理

自然语言处理是我们应用最广泛的。所以我们除了机器翻译没有探索外,其他我们都有涉猎:

1、多轮问答、会话

2、意图识别、情感分析

3、搜索、推荐

4、摘要、生成、Table2Text

二、语音

语音和自然语言处理比较近。

虽然我们也需要语音识别、语音转文本、文本转语音合成。

但国内有科大讯飞这个专业厂商在,我们就不研究了。

三、视觉

视觉四小龙主要聚焦在:人脸识别了。

而我们仍然聚焦在和自然语言处理相近的视觉,那就是OCR。

OCR也分很多应用任务:

1、证照识别

2、单据票据识别:包含票据里的印章弯曲文字识别

3、文档OCR:如文档中的复杂表格识别,甚至还有手写签名识别

4、自然场景下OCR:如道路标识、门头、菜单/商品说明

四、应用场景

我们也确定了:社会计算,这一应用主题。

围绕社会计算:社会化营销-社会化供应链-社会化金融,是我们确定的三大应用场景。

这三大应用场景,我们在2019(社会化营销)、2020(社会化供应链)、2021(社会化金融)也做了许多工作。

(2)我们也在夯实基础

一、经典机器学习

我们在不断探索:经典的概率统计、分类聚类

我们也在不断探索:时间序列预测、运筹学

二、知识嵌入

我们在不断探索:知识图谱/事件图谱、图神经网络

我们也在不断探索:因果推断、知识推理

三、少数据少样本少训练

我们在不断探索:Transformer、骨干网络结构

我们也在不断探索:迁移学习、对比学习、强化学习,期盼做到自监督、无监督

四、多模态

我们主要在一梭子Transformer横穿自然语言处理、视觉OCR两大数据和应用领域

当然,我们也在期盼有一梭子的方法,能横穿中文、英文。我们发现很多方法对于英文效果很好,但就不适用于中文。

(3)期盼业界突破

微软亚洲研究院堪称是中国人工智能的黄埔军校。

有擅长人才吸引的:李开复

有擅长理论研究的:沈向洋

有擅长工程实现的:张宏江

有擅长应用场景的:张亚勤

一、数据

突破方向有二:

1、突破一:中文。现在全世界人工智能领域,都是适合英文处理的理论方法、框架工具、数据集。中文的太少。

2、突破二:多模态

主要以北大人才为骨干的、张宏江博士做主力支持的智源研究院,在中文多模态数据集、中文巨模型的建设方面很好。

二、工具

现在满世界都是适合英文处理的理论方法、框架工具、数据集。中文的太少。中国幸好有了百度PaddlePaddle,这是一个适合处理中文的框架工具。

但是对不起,PaddlePaddle还主要在通用平台级,在应用任务级还有很多的空白、效果短板。

2020年,从微软亚洲研究院、百度出来的张亚勤,组建清华大学智能产业研究院(AIR),它的使命是:利用人工智能技术赋能产业升级。它主要面向三大应用场景:智能工业互联网、智能交通、智能医疗。

三、理论

在中文世界,人工智能理论突破性不多。我挺期盼沈向洋的。期盼他在清华大学高等研究院好好沉一沉。而且他作为小冰的董事长,小冰的海量多模态数据,也会给他的理论研究工作带来很好的辅助。

以上是关于再说说人工智能的主要内容,如果未能解决你的问题,请参考以下文章

手把手教你用python几行代码打造人工智能对话机器人,还说说话!

(干货)纸上谈兵-说说我对symfony新无级人工晶体的看法

纸上谈兵-说说我对symfony新无级人工晶体的看法

采集运维工具完善脚本,智能延时

说说BI商业智能与报表软件的区别

物联卡推荐中:说说物联卡为什么是智能设备的标配