TMT全镜界解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)

Posted 普华永道中国

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TMT全镜界解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)相关的知识,希望对你有一定的参考价值。


【TMT全镜界】解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)


 

水边韶景无穷柳,寒被江淹一半黄。

——皮日休(唐)


寒意渐浓的11月,某旅游网站评论事件的舆论热度已逐渐褪去,但在投资人心中却余温尚存。该事件中,爬虫及自然语言分析技术的运用无疑让大众感叹如今科技的进步及其影响。大数据、包括自然语言处理在内的人工智能新技术的成熟及应用,已经颠覆了传统尽职调查方式,并将深刻影响投资决策。


然而,在实际的收并购中的尽职调查中,仅仅基于用户评论内容的重复性进而判断相关业务真实性往往是不充分的。为了帮助投资人了解如何科学运用自然语言处理技术进行有效的尽职调查,下文总结了相关应用场景及实际项目中的注意点。


自然语言处理技术在收并购尽职调查中的应用


自然语言,就是指人类使用的语言。自然语言处理,即实现人机间自然语言通信,让计算机实现自然语言的理解和自然语言的生成。目前,自然语言处理技术已广泛应用于机器翻译、舆情分析、客户满意度调研等场景。在典型的互联网行业收并购交易尽职调查中,自然语言处理技术也可用于识别相关内容的原创性、虚假用户识别等场景。


根据普华永道数据尽职调查团队,基于过去3年超过200个互联网项目经验,总结了典型的互联网平台尽职调查中的基于自然语言处理技术的文本分析方法及交易决策场景,包括:


自动化的网络文本获取及相似度比较,进而识别潜在的抄袭、虚假、可疑交易等,并量化潜在对估值的影响


以典型的电商平台购买用户评论为例,高相似度的评论往往与刷单行为存在相关性。通过基于算法的文本相似度的比较,计算机可以给出一个相似度指数。


但是,在实际项目实践中,存在电商平台规定用户进行一定字数以上的评论,方可取得特定优惠返还。这可能导致真实购买用户产生了“虚假评论”的现象。因此,对于虚假用户、刷单等行为的判断,还需具体结合购买用户其他行为数据综合分析。


【TMT全镜界】解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)


通过基于UGC(User generated content)内容的用户画像,及商业计划假设验证


通过无监督的机器学习方法 - 聚类算法,并使用TF-IDF等方法进行特征词选取,我们可以自动提炼文本内容关键词、内容标签等。


在典型项目中,上述分析结果可以结合用户画像,及其它机器学习预测模型,有效支持用户转化率、用户留存等预测性分析,并验证商业计划的相关假设。


【TMT全镜界】解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)


文本情感分析(Sentiment analysis)及情感趋势分析,对用户满意度、流量变现能力进行评估


文本情感分析,常见的应用包括对微博的内容抓取,分析用户对品牌认知及用户满意度等。在收并购交易尽职调查中,该方法也可以对目标公司用户群体及流量变现能力(例如:广告转化)进行分析。


【TMT全镜界】解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)


避免技术的不当运用造成对交易决策的误导


综上所述,自然语言处理技术可以替代原本通过人工方式耗时耗力、甚至无法完成的非结构化文本内容的审阅工作。但是,在收并购尽职调查场景中,投资人尤其需要注意记下2个方面:

  • 相关自然语言处理及数据分析建模过程,需要遵循科学的方法论,同时,数据清理、特征工程、建模、参数调优等都对尽职调查人员提出更高的要求。团队需要配备专业的数据科学家,能够依照不同的场景订定对应的筛选规则与调试适合的模型参数;

  • 对目标公司的尽职调查不能仅仅依赖技术与数据本身,而忽略了投资标的商业实质、运营模式、财务状况、及相关的行业特性等信息。结合各个维度的信息进行综合分析和判断,才能真正有效地对投资标的业务真实性和价值前景作出正确的判断。


总之,在如今的人工智能时代,机器与行业经验的完美结合方能带给投资人最可靠的数据尽职调查服务。


普华永道收并购交易服务部门提供整合的尽职调查服务,我们的数据尽职调查工作与商业、财务、IT、运营、人力资源等尽职调查共同展开,各领域的专家结合数据科学技术,提供更全面的评估结论,为投资人交易决策提供科学依据。


衍生阅读链接:


本文为原创,如需转载请注明出处并附上本文链接。


联系我们


进一步相关咨询,请联系:


【TMT全镜界】解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)

【TMT全镜界】解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)
【TMT全镜界】解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)

以上是关于TMT全镜界解密基于自然语言分析技术的可疑交易识别——人工智能时代的数据尽职调查(续)的主要内容,如果未能解决你的问题,请参考以下文章

实战 SQL:银行等金融机构可疑支付交易的监测

浅析日志模式识别技术(Spark)原理

自动化谣言识别过程

从数据挖掘和分析的角度浅析个贷资金流向监测

大数据技术中自然语言识别与检索

基于java的校园二手交易系统的设计与实现.rar(论文+项目源码)