解读 | 文本挖掘对企业未来潜力无限,行业独角兽浮出水面

Posted 达观数据

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了解读 | 文本挖掘对企业未来潜力无限,行业独角兽浮出水面相关的知识,希望对你有一定的参考价值。

在信息爆炸的时代,基于AI技术、机器学习和深度学习的文本挖掘技术,正在迎来一个巨大风口,除了在金融、法律、政府文书等传统信息审核需求庞大的领域,在媒体、内容创业和大文娱产业,文本挖掘的价值也在迅速凸显,而这意味着行业的巨大体量和未来诞生独角兽企业的可能性。


解读 | 文本挖掘对企业未来潜力无限,行业独角兽浮出水面


在文本挖掘领域资深人士、达观数据CEO陈运文博士看来,文本挖掘常用功能分成三块:


1
关键信息抽取
“一篇文章、一份简历、一份基金财报,需要提取要点,计算机可以实现这个过程的自动化”;
2
审阅
第二件事情是做审阅,工作报告审核、法务合规和媒体编辑,都属于此类,审阅是一个高频应用场景;
3
搜索
第三个用点是搜索,看一个文档资料和哪些文档有关联关系,即搜索和推荐,将是下一个需求。


解读 | 文本挖掘对企业未来潜力无限,行业独角兽浮出水面


达观数据是一家为企业提供文本信息智能处理的人工智能企业,为数百家媒体、金融、电商、视频、文学等企业提供智能文本处理、垂直搜索和个性化推荐技术,其中包括36氪、顺丰海淘、么么直播、梨视频、酷六、界面新闻、趣头条、暴走漫画等;在新媒体的文本挖掘和用户画像方面,达观服务了一条、Papi酱等知名客户。


  新媒体和内容平台成重要需求方  


从媒体和资讯平台来看,文本识别在内容管控方面有广泛应用:据蓝鲸观察,在广告过滤、智能鉴黄、涉政检测、暴恐识别等方面均需要文本识别。


解读 | 文本挖掘对企业未来潜力无限,行业独角兽浮出水面


对于国内媒体生存发展而言,内容监管的意义不言而喻,今日头条打造了上千人的内容审核队伍,2018年宣布将继续扩大该领域投入。但对于更多的垂直平台而言,搭建自己的技术平台成本较高,类似达观这样的第三方技术将有巨大市场需求,“媒体自己的技术能力还是相对比较薄弱的。”达观数据CEO陈运文认为。


目前来看,新媒体和内容平台正在成为达观的重要客户群,比如科技创投媒体36氪,达观为其提供文本挖掘的技术服务,包括内容分析、打标签、分类,与平台方自己的技术相结合。而在财经资讯领域,文本分析的应用也很多,以和讯为例,就在是达观文本挖掘技术的成熟客户。


在达观看来,媒体本质上是一个大量复杂文本输出的地方,把这一生产流程自动化有巨大需求。目前,平台正在开发的一个功能是智能写作机器人,辅助记者和编辑进行文章撰写。


此外,舆情监测、新闻内容热点预测,和选题辅助,都是媒体领域文本挖掘的重要应用场景。


从最简单的文本自动纠错开始、改稿、润色,比如描述更加生动,比如说现场响起了掌声,加入各种形容词、指代词,能够帮你把这个文章写得更加生动,帮你把标题从一个陈述句改成一个疑问句,改成一个更加吸引读者的方式等。”陈运文介绍称。


“目前来看,新媒体通常更愿意尝鲜,传统的纸媒还是稍微落后一点,但陈运文认为,未来各行各业,不光是媒体,证券行业,银行业,保险业,甚至其他行业,各个部门在做内容的撰写、抽取、审阅等等各个环节的工作,都是可以由计算机辅助来完成。”陈运文介绍称。


 内容电商和文娱产业  

 文本挖掘带来用户精准匹配  


虽然达观这样的服务,本质上提供的都是文本的自动阅读理解、搜索推荐,但在不同领域却有不同的运用价值,在内容电商和文娱产业,文本挖掘意味着对用户需求更精准的捕捉,人工智能技术可以大大提高售卖率、转化率、点击率等关键指标。


据了解,知名内容电商平台一条,已经采用达观数据的服务长达一年,在类似的内容电商平台,传统的搜索推荐,都是你把最热门的编辑推荐的内容置顶,而现在才会用的是个性化推荐,据了解,一条基于该项技术带来了点击率提升200%到300%。


此外,在文娱产业,文本挖掘和分析的应用也很丰富,比如影视视频平台的搜索库。“文娱产业本质上是一个内容分发,如何让内容更好地匹配消费者是重要课题,对内容进行语意上的深度解读和理解,通过我们的搜索推荐,让它更好传递给观众。”陈运文介绍称,目前梨视频、爆米花、六间房等视频网站都是达观的客户。

  

 文字领域的AI市场达万亿级  

 可诞生独角兽企业  


人工智能是最近两年非常热门的投资领域,人工智能里面分成三块,图像、语音、文字,在文字这个领域,达观走在了行业前面,在软银赛富和真格基金两家投资方来看,文字自动化处理这个领域里,未来是能够产生独角兽的。


“我们希望能够在这个领域能够跑在行业前列,未来所有的企业,当它需要用自动化的手段来处理文字、理解文字的时候,能够想到达观是这个领域做得最好的企业。“在这个领域技术达观是做得最扎实的,服务也是做得非常贴心到位,对客户来说,他们希望你的系统能够帮它提供效率,日常过程当中他们所有的需求,你能够快速响应,这个是非常重要的事情。”陈运文表示。

解读 | 文本挖掘对企业未来潜力无限,行业独角兽浮出水面


事实上,未来所有出现文字、用得到文字的场景,都可能存在这一服务需求。文本挖掘是一个万亿级别的市场,从媒体到这些大型企业的各个业务条线的部门,甚至到政府机关,都有大量的文本在处理,从撰写到审阅,到归档整理,到搜索,各个环节都是靠人来做的,未来80%的工作都是靠计算机来完成的。


据了解,2017年达观数据成立第二年已实现盈亏平衡,这在人工智能创业企业里面比较少见,目前,达观服务的企业已经有数百家了,从大型的中国的500强企业,到金融行业、证券行业的很多头部的企业,还有很多的互联网企业。


目前来看,文本挖掘的技术成熟度将直接决定市场空间和公司估值,陈运文表示“语言是一个非常灵活、非常混乱,甚至有的时候并不是有严格的语法逻辑的领域,所以对文字语义深度的理解,本身还是有很大的技术挑战,所以达观投入了很多的技术力量,更好的来做文字语义的理解分析挖掘。”


本文来源 蓝鲸财经资深记者:张子龙 

原文链接:http://app.lanjinger.com/news/detail?id=82986


以上是关于解读 | 文本挖掘对企业未来潜力无限,行业独角兽浮出水面的主要内容,如果未能解决你的问题,请参考以下文章

回首图扑软件 2021,展望未来

未来增长潜力无限

未来增长潜力无限

未来增长潜力无限

NLP(自然语言处理)公司的坠落与重生

实力雄厚!极智嘉(Geek+)接连斩获行业权威奖项