数据挖掘在上市公司财务造假识别中的应用

Posted 2021-04-27 申万宏源研究

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据挖掘在上市公司财务造假识别中的应用相关的知识，希望对你有一定的参考价值。

联系人：曹春晓/文雨

上市公司财务造假犹如地雷，1999年至2002年间，美国市场爆发出大量的财务造假案件，对投资者造成了不可估量的损失。2011年，中概股造假案件高发，数家中概股因财务舞弊在美国两大证券交易所停牌或被勒令退市。国内市场近年来也频繁爆发惊天骗局，层出不穷的上市公司造假案件给投资者带来了巨大损失，也给资本市场的健康发展带来负面影响。

我们选取2002年之后，A股市场被中国证监会、沪深两市交易所公开处罚的数据，依据财务造假常见的动机和手段，结合国内外学者的研究，构建了多个财务指标和非财务指标，并分别采用数据挖掘中的神经网络、SVM支持向量机、决策树（C&RT、QUEST、CHAID、C5.0），对上市公司年报造假判别问题进行研究。由于上市公司造假案例相对于全体上市公司而言，数量占比较小，从而存在数据分类不平衡问题。而在实际投资中，把造假公司判断为非造假公司所带来的成本远大于把非造假公司判断为造假公司。因此，在决策树中可以通过加入误分类损失函数的方式来让模型更加重视对造假样本的判别。

实证研究结果表明，决策树比神经网络、SVM支持向量机更适用于上市公司年报造假判别的研究，而决策树中的CHAID算法是四个算法中综合表现较优的算法。在全样本中，其对上市公司年报是否造假判别的准确率为93.16%，召回率为59.41%，判断的精确度为17.78%，F值为27.37%。

此外，在判断上市公司年报是否造假的时候，需要重点关注的几项指标分别为：审计师意见、前一年是否亏损、其他应收款占流动资产比例、销售毛利率、预付款项占流动资产比例。审计师给出负面意见、前一年财务亏损、相对于同行业而言，比较高的其他应收款占流动资产比例、销售毛利率、预付款项占流动资产比例等，都是造假可能性高的上市公司年报所具有的特征。

以上是关于数据挖掘在上市公司财务造假识别中的应用的主要内容，如果未能解决你的问题，请参考以下文章

发票识别，增值税发票识别，OCR票据识别

增值税发票识别在现代企业中的应用

财务工作的中的各类表单怎么录入才不容易出错？有啥软件可以帮忙？

求助公司想要做一套财务数据分析系统，用啥工具比较好？

OCR文字识别

《大数据》杂志——面向大数据的并行聚类算法在股票板块划分中的应用