标签画像技术在驱动税务管理中应用(共6713字).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《标签画像技术在驱动税务管理中应用(共6713字).doc》由会员分享,可在线阅读,更多相关《标签画像技术在驱动税务管理中应用(共6713字).doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、标签画像技术在驱动税务管理中应用(共6713字)摘要:税务部门是国家组织财政收入的门户,与社会公众的联系最为密切,在提升纳税人对政府治理效能认可度方面的“杠杆效应”最为显著。国家税务总局在全国税务工作会议上提出,要锤炼税收治理六大能力,充分发挥现代科技对税收治理的推进作用,实现科学、技术、管理向税收治理效能的高效转化。本文以纳税人需求为导向,以标签画像技术为驱动力,以实现税务管理与服务创新为目标,通过构建适应于不同业务情境的纳税人画像,为税务部门创造性地开展税收管理与服务工作提供方案策略。关键词:纳税人画像;标签画像技术;税务管理与服务创新当我们在浏览网页或者上网购物时,网站会自动弹出各种推荐
2、信息,这些信息或多或少都与我们最近一段时间的兴趣或需求相关,网站就像我们肚子里的蛔虫,清楚地知道我们各自的需要,让我们忍不住想点进去看看这便是利用数据抓取技术,在对用户数据进行深度分析之后实施的精准营销投放。这一技术已在电商平台得到充分运用,根据消费者的搜索频率和在网页的停留时间计算其偏好,进而提供“猜你喜欢”服务,这种“投其所好”式的营销策略,为平台创造了更多的交易机会。这一盈利模式的实现便得益于标签画像技术。一、标签画像技术概论用户画像(userpersona)最早由交互设计之父AlanCooper在其1999年出版的专著TheInmatesareRunningtheAsylum中提出,并
3、指出Persona是真实用户的虚拟代表,是建立在一系列真实数据(Marketingdata,Usabilitydata)之上的目标用户模型。用户画像产生于用户信息,用户信息由静态信息和动态信息两部分组成。在纳税人画像构建过程中,像法人纳税人识别号、行业、地域、经济类型及自然人纳税人姓名、身份证号等涉及用户属性特征的数据,相对稳定;但像法人纳税人每期纳税申报数据、业务范围及采购、生产、物流等信息会随着生产经营行为不断累加,用户在系统中的每次行为都会使现有的用户画像丧失时效性。用户行为的多样性和易变性决定了用户画像的时效性很强,这就要求我们设计合理有效的动态更新机制,从而精准地刻画用户。同时,用户
4、画像的动态性使其不可避免地具有时空局限性。在时间上,某一时刻的用户画像对该时刻的知识发现最为有效,距离时间越远,画像精准度越低,参考价值也越差。在空间上,不同的应用领域有着不同的侧重点。如果说营销领域的用户画像侧重于刻画用户的消费习惯,税务管理与服务领域的用户画像则重在发掘纳税人涉税业务的需求。因此需要针对不同的应用场景来设计画像,没有哪个用户画像一经构建就可以适用于所有的分析领域。二、用户画像数据来源1.用户属性数据。法人纳税人用户属性数据主要来源于“金税三期”税务登记信息。税务登记是税务机关依据税法规定,对纳税人的生产、经营活动进行登记管理的一项法定制度,也是纳税人依法履行纳税义务的法定手
5、续。税务登记是整个税收征收管理的起点,包括开业登记,变更登记,停业、复业登记,注销登记,外出经营报验登记,纳税人税种登记,扣缴税款登记等,涉及法人纳税人生命周期的全过程。自然人纳税人用户属性数据首先来源于国家税务总局推出的个人所得税申报系统,该系统自2019年起正式运行,涵盖用户基础信息(包括姓名、性别、出生日期、纳税人识别号、学历、民族)、任职受雇信息、家庭成员信息、户籍所在地、经常居住地等信息,这是最全面和最权威的自然人纳税人信息,是自然人纳税人涉税数据分析的主要来源。另外,还有一部分未下载并注册个人所得税App的自然人,这部分自然人信息可以通过人口普查信息获得。借助第七次全国人口普查,可
6、以获得人口数量、结构、分布和居住环境信息,全面获得居住在境内的自然人的姓名、性别、年龄、民族、受教育程度、行业、职业等信息。2.用户行为数据。法人纳税人行为数据首先来源于纳税申报信息。申报信息是围绕不同税种所采集到的申报信息,如企业所得税申报表及附表、增值税申报表及附表等。其次,来源于发票信息。发票信息是企业发生交易的凭证,反映企业的上下游关系以及企业的交易行为,其所记载的税务活动颗粒度较细,是未经加工的原始数据,信息密度大,是税务大数据分析的金矿。最后,可以围绕企业生产经营的采购、生产、物流等环节获取最原始、最底层的信息。该部分数据的获取难度较大、价值密度较低,围绕数据的特征描述以及分析的对
7、象不好界定;但数据轨迹是客观的,信息不易被篡改、真实性高。以上涉税活动是企业形成税务关系的基础,是税收大数据分析的支撑。除此之外,还可以通过网络爬虫技术获取法人纳税人办税人员、法定代表人、会计主管等在第三方平台的信息检索,了解其信息需求和利益关注点,为后续设计标签画像提供数据支持。自然人纳税人涉税业务较少,最主要的便是个人所得税的申报与扣缴,其行为数据来源渠道也较为单一,主要来源于个人所得税App系统,再就是利用网络爬虫技术获取自然人纳税人在第三方信息平台上的搜索信息,如在百度等搜索引擎上的查询信息,以了解纳税人的税务信息需求,为后续提供“量身定制”的税收宣传与服务奠定基础。三、用户画像的构建
8、用户画像的构建离不开标签,用户属性及行为的标签化是画像建模的核心。对于“人”来说,可以通过对标签信息的加工,加上自身的知识积累,获得标签所要表达的完整语义,生成用户画像。如对于“男、吴京、战狼、爱国主义、动作片”这些标签,我们会很容易获得标签所要表达的语义信息。但对于计算机而言,这些标签只是一个个字符串,本身并不能折射出任何含义,计算机并不知道标签“战狼”是一部电影的名字,也不知道“吴京”是一个男演员的名字,更不知道“吴京”是电影“战狼”的男主角。如何让计算机“理解”这些标签,使计算机表现得具有“智慧”,帮助我们实现税务管理与服务的创新,这就需要借助数据处理的相关技术。本课题研究主要用到了基于
9、本体的用户画像构建方法,从知识工程的角度出发,通过本体对用户画像中的标签进行表示、验证、推理和解释,利用本体中定义的结构化信息和关系信息来刻画用户。用户标签是构成用户画像的核心因素,是将用户在平台内所产生的行为数据以及属性数据,分析提炼后生成的代表用户某一类特征的符号。简言之,就是对收集到的用户属性数据和行为数据,根据不同的业务场景和研究需要,抽取其某一方面的共同特征,并给这些特征起一个精简并富有代表性的名字,便是标签。类似于文献检索过程中的关键词,它能帮助我们快速地检索并抽取出用户的某些特征。在分析过程中,我们只知道用户标签是远远不够的,我们还要知道标签之间的关联关系。大数据分析关注的是标签
10、之间的关联关系,而非因果关系,需要从海量的数据中找到数据与数据之间的共同特征(标签),并积极建立标签之间的联系,这便构成了标签体系。四、标签画像技术在驱动法人纳税人业务创新中的应用1.让信用创造价值,沟通银企资金流。资金流是企业生存和发展的基础,如果把企业比作人,资金流则好比是血液。融资难是当前中小企业发展过程中的主要障碍,解决好融资问题是中小企业发展的关键。由于企业和银行之间的信息不对称,某些中小企业会在申请贷款时出具虚假信息,甚至造假财务报表,不向资金提供者披露企业的真实经营现状。金融机构为降低坏账损失率,在给中小企业提供资金支持时会附加更为苛刻的条件,直接导致一些优质的中小企业得不到资金
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 标签 画像 技术 驱动 税务 管理 应用 6713
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内