大数据时代税收管理的机遇与挑战探析

内容提要:随着互联网技术在税收领域的广泛应用,海量涉税数据对当前税收管理思维、技术手段、法律体系等构成重要影响。转变税收管理思维方式、升级涉税数据管理技术、完善税收相关法律制度、打造涉税数据安保体系、培养专业信息技术人才是大数据时代税务机关提高涉税数据管理能力的有效举措,更是我国税收管理实现从“以票控税”向“信息管税”转变的必然选择。

关键词:大数据税收管理信息管税智慧税务

自2015年国家税务总局提出《“互联网+税务”行动计划》以来,互联网技术在税务领域得到了更加广泛深入的应用。特别是随着营改增的全面推开以及商事登记制度的深化改革,纳税人数量呈井喷式增长,产生了越来越多的涉税数据,税收大数据时代已经到来。海量的涉税数据对当前税收管理思维、技术手段、法律体系等均产生了较大的影响,既带来机遇也面临挑战。建立国家税收大数据库,统筹规划税收数据资源,推动数据共享开放,强化大数据分析应用,将是我国税收管理的发展方向和核心内容,也是“互联网+税务”的必然选择。抓住机遇,采取适应大数据时代要求的税收管理办法,必将实现涉税数据的价值红利,同时,也有利于防范税收风险,提升税收管理效率,促进税收管理从“以票控税”向“信息管税”转变,有效推进国家税收治理的现代化。

一、大数据时代税收管理的机遇分析

(一)大数据将加快推进“智能税务”和“智慧税务”的发展

目前,“互联网+税务”主要体现在“电子税务局”的建设层面,税收业务基本通过网上办理。例如,国家税务总局苏州市税务局实施“掌上税务”,纳税人办理各种涉税事宜,可以通过手机实时在线办理;国家税务总局深圳市税务局推出了“电子税务局”,涵盖域名共享、身份互认、业务互通、一网通办等多种亮点特色服务;国家税务总局湖南省税务局大力推行“互联网+政务”,推广普及自助办税终端、完善网上纳税人学堂、推出智能税务APP等,最大程度为纳税人提供便利服务。然而,这只是“互联网+”背景下税收管理的初级阶段。下一步,随着大数据时代的到来,可依托互联网技术,对海量涉税数据进行分析处理,挖掘数据的有用价值,找出数据之间的关联性,形成关系驱动下的动态可视化管理策略,加快我国税务向“智能税务”和“智慧税务”方向发展。

(二)大数据利于搭建数据仓库平台,唤醒“沉睡”涉税数据

数据仓库是为支持决策而设立的数据集合,属于数据库应用的高级阶段。一些税收征管手段先进和信息化较强的发达国家的税务部门很早就将纳税人的税务登记、纳税申报表、缴款记录等信息存放于数据仓库中,以备分析之需。例如,意大利就建有数据处理中心,拥有较为完善的税收信息管理系统(ItalyTaxInformationSystem,ITIS),将各种海量涉税资料集中存放,为地区、部门和系统之间的信息决策提供了强大支持;美国1960年就开始了税收信息化建设,国内收入局成立了研究分析和统计司(ResearchAnalysisandStatisticsDivision,RAS),负责联邦税务系统涉税数据的收集、研究、分析和统计,为决策提供参考建议。我国的税收信息化起步较晚,长期以来,税收管理工作更多依赖“人盯户,票管税”,涉税数据始终未能成为税收管理的主要资源而被有效利用。虽然我国的“金税工程”建设为税务部门积累了大量的涉税数据,但受税收征管体制不完善、数据采集标准不规范、数据采集和应用技术较为落后等因素的制约,迄今为止,大量涉税信息仍游离于税务机关掌控之外,数据之间口径不统一、数据独立存储、大量涉税数据仍处于碎片式分布和“沉睡”状态等问题仍较为突出。因此,随着大数据时代的到来,税务机关可搭建数据仓库平台,运用先进的技术手段,唤醒“沉睡”涉税数据,将“静态数据”变为“动态信息”,为涉税数据的进一步分析处理提供支撑。

(三)大数据将加速构建分析平台,科学制定风险管理策略

税收风险管理的核心工作是通过提供纳税服务和加强税收执法来进行,两者都迫切需要数据支撑,都离不开对涉税信息的完整把控。然而,2018年国税地税机构合并以前,我国自分税制以来形成的各自为政的征管系统严重阻碍了涉税信息的共享,税收征管系统内部以及各相关部门之间的数据分析平台尚未有效建成。目前,除了增值税专用发票形成数据共享以外,其他涉税数据均不能有效共享,产生诸多涉税数据孤岛,大部分涉税数据未能及时得到整合以及深度开发利用,使用效率偏低,不利于税收风险的防范和管控。随着互联网的日益发展和大数据时代的到来,各组织和部门之间的边界将逐步被弱化,外部数据的来源会愈加丰富,有利于大数据分析平台和涉税数据共享交换机制的建立,真正实现税务、海关、工商、银行、公安等部门之间,乃至淘宝、京东等第三方涉税信息部门之间高效的数据交换和共享,以便税务部门更高质量地搜集和整理涉税数据,更有效地对涉税信息进行分析和处理,更直观地了解纳税人的生产经营情况和税负变化,从而有利于税务部门深度挖掘涉税信息的价值,获取税收风险点,评估其风险等级,科学制定税收风险管理策略,更好地监控重点税源,有效杜绝偷逃税行为,减少税收流失。

二、大数据时代税收管理的挑战预估

(一)管理思维有待转变

“互联网+”、大数据是近几年才出现的新词,许多税务人员由于受长期业务模式的影响,仍停留在较为传统的线下服务管理思维中。一是在具体组织征税活动时,只简单地将计算机网络视为操作工具,用其进行一些单据的互传与申报。二是涉税数据来源渠道较为单一,一般只从纳税人的自行申报、税务机关的日常管理和重点稽查当中获得,很少主动向第三方索取涉税数据,所搜集的涉税数据呈碎片化状态。三是涉税数据采集方式比较落后,在相当长一段时间内主要采用存储介质到相关部门提取,无法满足大数据时代税收管理效率的要求,大大降低了数据的质量。四是长期以来对纳税人“重管理、轻服务”“重义务、轻权利”的思维导向也与“互联网+”、大数据时代不相吻合,有待转变。

(二)技术手段有待加强

1.传统数据存储方式难以满足海量涉税数据的需要。金税三期工程上线后,税收征管数据在税务总局和省局两级数据处理中心集中处理,为大数据在税收领域的应用提供了可能,也预示着税收大数据时代的到来。传统关系型数据库系统逻辑非常复杂,一旦存储文件布置不合理,在面对海量、多样、访问量大、时效性强的涉税数据时,其诸多不足之处便会暴露,如对爆炸式增长的存储文件难以有效管理,对海量数据文件读写处理存在磁盘性能瓶颈,集中式存储的架构扩展成本代价高等。不但如此,传统关系型数据库一般适用于储存结构性数据,而绝大多数涉税数据是非结构化数据,存在一定的时效性,在存储方式上对数据库有更高的要求。

2.传统的数据库技术对海量涉税数据处理能力不足。传统的数据库技术,例如分区表技术和物化视图技术等,虽然存在数据查询效率较高、处理速度较快等优点,但这些技术在海量数据处理能力方面仍存在不足。具体表现在进行筛选处理时,传统数据库的单一磁盘读取制约了海量数据大量输入输出操作的效率,存在计算机资源整合瓶颈,无法提升查询性能,于是不可避免地要做大量的数据关联,这对数据库服务器的I/O系统、磁盘以及CPU单元均是较大的考验。

3.大数据应用分析平台有待完善。在“互联网+”

背景下,数据已然成为核心资源,如何深挖数据的价值,其核心手段是分析。传统的数据分析手段一般是利用人工筛选各类数据,将数据转换为各类分析、统计报表,分析形式流于表面,关联性不足,很大程度依赖于分析人员的个人经验与业务水平,决策结果主观性较大,缺乏科学性。尽管现阶段各地税务机关已经搭建了许多涉税数据综合分析平台,但仍局限于部分数据的纵向对比,并未深挖成因、追根溯源,分析模式单一,分析自动化程度不高,结果依然不够准确。

(三)相关法律法规有待完善

现行税收管理办法是基于传统的产业、产品及交易模式制定的,而“互联网+”给市场经济带来了各种新兴业态、新型交易手段及产品供给方式,这显然会带来税收相关管理办法的缺位,产生税收管理盲区。例如,电子发票和电子缴税法律制度的缺失,使电子商务尤其是跨境电商等业务长期游离于税收监管之外。在“互联网+”背景下,必然要求扩大信息和数据的共享范围,虽然我国现行《税收征管法》也明确要求政府部门应信息共享,但由于缺乏具体的实施办法,各部门对数据共享的积极性并不高,这不仅影响了税务部门数据采集的质量,也增加了税务人员的执法风险。

(四)安全环境有待打造

互网络和大数据是双刃剑。利用互联网技术,挖掘大数据价值,对提高税收管理效率、防范税收风险具有重要意义,但也存在网络安全隐患。税务机关通过互联网技术搜集到的涉税数据,一般会涉及纳税人的商业秘密、个人隐私、会计账务、资金流水等,虽然目前对税务机关内外网进行了人工隔离,但计算机病毒和黑客无处不在,不能够保证涉税数据存储环境的绝对安全。一旦这些涉税数据遭受病毒、黑客的冲击就会被泄露或删除,给纳税人造成不可估量的经济损失。而且,我国尚未构建完善的数据保护制度体系,网络密码管理和政府信息系统管理制度不健全,难以保障网络信息安全。在电子数据保密制度中,没有明确征纳双方的权利、义务和责任,作为数据提供方,纳税人就不可避免地承担着被黑客袭击和隐私被泄露等风险。不仅如此,信息化基础建设的不完善,如信息中心设施建设不规范,消防、防雷、防震等设施不齐全,供电设备不稳定等,都会成为数据的安全隐患。

(五)技术人员有待培养

“互联网+”背景下,由于纳税人的经营业务不断拓展,经营方式不断创新,导致税源在部门、行业和地区之间相互渗透,涉税业务日益复杂,涉税数据逐渐增加。这都对税务人员的业务素质提出了更高的要求,税务人员不仅要熟悉税收、财务等业务知识,而且要掌握计算机网络技术。然而,由于年龄、专业和思维的限制,目前税务系统中掌握税务专业知识的人不熟悉互联网技术或对计算机业务操作不熟练、精通网络技术的人员不了解涉税专业知识的情况很普遍,两者兼而有之的人才少之又少。在这样的人员结构下,面对“互联网+”和大数据时代的到来,税务系统高精尖复合型人才的培养尤为迫切。

三、适应大数据时代要求的税收管理举措

(一)转变税收管理思维方式

1.要有互联网的管理思维。税务机关各级领导干部,应提高认识,从传统的小数据思维中解放出来,高度重视税收大数据在转变税收管理方式、提高税收现代化水平上的重要作用,学会用互联网思维来开展税收工作,提高管理决策的科学性。于税务人员而言,并非仅限于税务工作线上化,也要运用互联网思维改造传统业务流程,依靠云计算、人工智能等先进技术,转变传统操作理念和操作模式,努力提高政策执行的精准性。

2.要有开放共享、团结协作的管理思维。在“互联网+”和大数据背景下,开放意味着打破原有的思维定式,意味着分享和资源的有效整合。税务机关获取涉税数据的渠道将不断拓宽,不再局限于纳税人的自行申报以及税务机关的日常管理和重点稽查,所有征纳双方之外的企业事业单位和其他法人团体都可以成为涉税数据的来源渠道。这需要税务部门与社会多部门进行协同合作,数据互换共享,实现真正意义的“以票管税”向“信息管税”转变。

3.要有对纳税人参与度高度重视的管理思维。在“互联网+”背景下,税务机关与纳税人应建立密切联系,并通过纳税人的反馈,不断推动税收工作的创新与进步。税务机关要在进一步深化“放管服”改革、优化营商环境的基础上,为纳税人提供更加优质、便捷的服务,增强纳税人在纳税过程中的获得感,提高其纳税遵从度。

(二)升级涉税数据管理技术

1.实行分布式文件系统存储管理,提高涉税数据存储能力。分布式文件系统(Hadoop),简称HDFS,是通过网络与并行技术,构建一个完整的虚拟存储设备,将数据文件以数据块大小进行分割整理,再通过哈希算法与数据流相结合的方式散列在存储区域的每个存储节点之中,对外提供统一数据访问接口的数据存储系统。HDFS避免了大吞吐量的读、写操作,更能满足大数据的存储需求。因此,大数据时代,实行集中式向HDFS分布式存储方式的转变,可以更高效地对涉税数据进行存储和读取,对磁盘阵列的操作也不再局限于某一个热点区域,可有效减少税收数据文件移动时造成的输入、输出性能瓶颈。同时,HDFS易于扩展,当HDFS进行水平伸缩扩展时,只需增加可以部署在廉价硬件上的DataNode节点,便可大大降低扩展成本。以纳税人申报表的存储为例,可有两种不同的数据存储方式(如图1所示)。在分布式存储模式下,当要读取纳税人申报表信息时,HDFS通过NameNode调动一组DataNode节点协同工作,查询配置文件找到申报表对应的存储节点,针对所有存储节点的数据文件,DataNode并发获取数据块,并把获得的所有数据块进行数据合并,从而获得整张纳税人申报信息表,然后返回给客户端。这种并发获取数据的方式相对传统技术显得更加简单高效。

2.运用分布式计算技术(MapReduce),提高涉税数据处理能力。MapReduce,也称为“映射/归约并行编程模型”,是一种应用于大规模数据集(大于1TB)的并行运算技术模型,它借助映射(Map)和归约(Reduce)两个函数编程实现基本的并行计算任务,主要解决在大数据中如何提高数据处理性能和效率的问题。MapReduce模型最基本的处理思想是“分而治之,然后归约”,即把所有具有相同性质的数据归为一类,将分类后的数据进行切割并切割得足够小,然后并发进行处理,最后再汇总所有处理结果。其中,Map函数的工作是对数据进行分类切割,Reduce函数则负责对分组后的数据进行汇总处理。以近十年全国各省市行业纳税人企业所得税年报情况统计结果为例(具体处理流程如图2所示),分成输入、Map、Reduce和输出四个阶段进行数据统计处理。首先,将需要统计的省、市,统计年份,纳税人行业等参数输入系统。其次,把统计任务根据行业、区域等分解成多个子任务,即把全国纳税人信息分割成各省纳税人信息,再把各省纳税人信息分割成各市纳税人信息,在各市纳税人信息基础上又可以按年份或按行业进行分割。数据切割后经过Map并行处理,遍历所有纳税人信息数据,求出某省、某市、某行业、某年份的企业所得税申报信息。最后,通过Reduce将每个Map阶段产生的企业所得税申报信息进行汇总,得出全国各省、各市、各行业企业所得税的年报记录,并转化为简单明了的纳税申报表。

MapReduce是一种简单、高效、稳定的并行处理应用,同时,MapReduce的冗余并行处理机制具有高度的可扩展性和可靠性,这让其在大数据处理方面获得广泛应用。因此,利用MapReduce模型,将涉税数据从金税三期数据仓库转移到Hadoop架构中进行分布式计算处理,可极大地提高涉税数据处理的能力和效率。

3.运用人工智能技术,有效提高涉税数据分析应用能力。人工智能(Artificialntelligence,AI)是一种研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术,实质是通过训练海量数据和模拟人脑构建学习模型来挖掘数据更有用的特征,进而实现数据的准确分类或预测。人工智能技术模型主要应用于互联网背景下各种预测领域,有较高的预测精度和较强的实用性。以税收大数据为基础,以Hadoop分布式架构为体系,结合人工智能技术可以搭建一个涉税数据智能分析应用平台(见图3),实现数据的组织、加工、计算、输出等过程的全自动化,促进税收管理从信息化到智能化的转变。一是税收决策智能化。目前,税务人员一般要查阅各种统计分析报表和建立各种预测模型开展对大数据的分析,过程非常复杂。税收智能数据分析平台一旦建成,凭借电脑在大数据记忆、计算、分析等方面存在的巨大优势,替代人脑直接进行税收决策并非天方夜谭,税务人员只需描述自己的需求,系统就会自动分析得出决策依据和建议。二是涉税办理自动化。税收智能数据分析平台会根据纳税人的收入、支出、消费、资产、信用等信息自动计算出纳税人的应纳税账单,并自动推送给纳税人,在纳税人确认后,缴税系统可自动实现税款征收。

(三)完善税收相关法律制度

应从国家层面进行顶层设计,完善相关法律制度,强化法治保障。第一,完善电子政务方面的法律法规,对电子身份的认证方式、内容以及法律责任等进行明确,以满足互联网时代税收管理模式的需要。第二,完善政府信息公开及信息保护等法律法规,对纳税人的知情权、隐私权、知识产权等相关权益进一步明确,对税务机关的数据控制以及数据使用行为加强规范,增加网络密码管理、政府信息系统管理等内容,进一步明确涉税数据安全管理标准、具体实施办法以及相应的惩戒措施,有效落实信息共享制度,确立第三方信息报送义务,保障涉税数据的有效流动。第三,积极推动《税收征管法》的修订,以适应“互联网+”背景下产生的新型经营主体、范围和交易模式的需要。比如,完善电子发票的法律制度,明确其管理标准和具体的实施规则;完善电子缴税法律制度,加强第三方支付以及网络银行的系统管理。

(四)打造涉税数据安保体系

在实际税收管理工作中,应构建起一个税收大数据安全保障系统。一是采取数字签名、虚拟专用网络(VPN)等安全技术对纳税人的各类信息进行加密处理,提升信息安全程度。二是在不违背税务系统网络与信息安全管理制度的前提下,与专业机构合作,共同维护建设税务安全系统和监控系统,并及时更新木马病毒库。在日常办公过程中要求税务人员严格按照网络操作规范进行操作,隔离内外网,注重系统的定期维护与检查。在硬件采购上,应选用技术能力过硬、有良好声誉的厂商,从根源上减少安全隐患。同时,还要加大财政资金的投入,支持网络基础设施建设和网络安全软件的开发等。

(五)培养专业信息技术人才

做好税收数据管理工作,离不开专业信息技术人才。税务系统应重视对专业信息技术人才的培养,逐步组建涉税大数据分析应用技术团队。一是创新人才引进机制,通过公务员招录,吸引一批互联网技术人才,充实到税收数据管理工作中,为系统的开发、运营和维护提供技术支持。二是加强内部技术人员的培训。随着大数据、人工智能等技术在税收领域的广泛运用,税务人员作为信息管税的直接操盘手,必须加强现代信息技术学习,努力成为“懂财税知识、懂电脑使用、懂数据分析”的复合型税收人才。为此,应定期对相关税务人员开展培训,使之能够熟练操作数据软件,掌握涉税风险数据分析模型及其分析方法。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();