IMF基于文本挖掘对各国税收措施进行研究

Posted 中外财经法律通讯

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了IMF基于文本挖掘对各国税收措施进行研究相关的知识,希望对你有一定的参考价值。

吴越    北京外国语大学


   编者按:随着科技的迅速发展,大数据技术已经成为现在分析各种问题的一种行之有效的新思路。而作为大数据分析类别之一,文本挖掘技术由于其天生对人类认知的友好性和现实环境的广泛适用性更是被广泛引用于各行各业。近日,IMF一个研究团队便创造性的将文本挖掘技术应用于对各国税收政策的研究,并以此建立了一个新型数据库。


    税收政策应该如何实施才能产生更多地收入、提高国家竞争力以及发展生产力始终是各国政策讨论的中心议题之一。税收政策也在不停发生变化,但是除了获得类似税率变动这样基础的参数变动之外,其他信息的获得是很困难的。日前,IMF一研究团队通过对过去四十年中23个发达与发展中经济体国家的税收政策进行分析,建立了基于文本挖掘技术的新型数据库,并通过该数据库对各国税收措施进行了研究。
    在这个名为“税收政策改革数据库”(Tax Policy Reform Database, TPRD)中,收录了过去四十年中超过900个OECD国家组织所进行的税收调查以及国际财政文献社(International Bureau of Fiscal Documentation, IBFD)档案馆中超过37000条税务有关的新闻。
    TPRD对六个税种,包括个人与企业所得税(PIT, CIT)、增值税与销售税(VAT, sale taxes)、社保缴纳金(SSC)、消费税(EXE)和财产税(PRO)的税率和税基进行了系统性的记录。该数据库同时记录了确切的新闻发布时间以及税收措施的执行时间、该措施是重大税收改革抑或是临时措施。相比于更零散地分布在各处的数据,TPRD为决策者提供了更加系统化的数据。

    而在近日IMF发布的名为《在发达与新兴经济体中的税收政策措施:一个新的数据库》(Tax Policy Measures in Advanced and Emerging Economies: A Novel Database)中,研究者们不仅详细介绍了这个数据库的构建过程,同时也提出了通过该数据库得到的一些结论。
    从整体而言,TPRD的构建过程分为五步:
    1.文本挖掘:这一过程主要是对原有的文本进行分割与提取,即将原文中包含相关文本的句子提取出来,而这些文本也会被按照国别整理好;
    2.人工编码:将前一部分中提取出来的文本中所包含的税种、税基、税率等众多信息进行人工编码,进行第二次分门别类地整理;
    3.确定税收措施日期:通过IBFD档案库与OECD历史文献进行税收措施公布与实施日期的确定;
    4.与其他数据库的交叉验证;
    5.添加“整顿期间”(consolidation periods)的预期收益率:所谓“整顿期间”的预期收益率是由Alesina等经济学家在2017年提出的一个概念。通过这个指标的变化,研究者可以估算出在一段“财政整顿”时期(fiscal consolidation)内某一项税收政策会为政府带来多少收入。
    同时,研究者们也通过TPRD中的数据得到了以下结论:
    1.税基的变化通常伴随着税率的变化,而在目前的研究中较少有人提出这点;
    2.税收政策措施往往是更大规模改革的配套措施,而这个角度也鲜有人提及;
    3.在绝大多数的经济体中,个人所得税的变动是最频繁的,其次是企业所得税与增值税。上述三种税种从公布到实施的延迟时间在2-5个月,以便各个微观经济个体调整预期。









参考资料:
    i.IMF
    http://www.imf.org/en/Publications/WP/Issues/2018/05/11/Tax-Policy-  Measures-in-Advanced-and-Emerging-Economies-A-Novel-Database-45870

以上是关于IMF基于文本挖掘对各国税收措施进行研究的主要内容,如果未能解决你的问题,请参考以下文章

基于文本挖掘的我国人工智能产业政策量化研究

基于文本挖掘的量化投资应用

量化基于文本挖掘的量化投资应用

大数据环境下基于文本挖掘的审计数据分析框架

基于数据挖掘技术的在线学习行为研究综述3

独家研究 | 基于网贷行业新闻的文本数据挖掘