集奥聚合CDO丁磊
大家好!我叫丁磊,之前没开过网易也没有养过猪,我在美国负责PayPal大数据平台,之前大数据的应用在国内国外有经验积累,跟大家分享。
今天听众不是特别多,可以跟大家有比较深入的互动交流。
之前我也说到,我在PayPal负责大数据平台,美国信用比较完善体系下和国内互联网金融如火如荼形势下做金融是一个有趣的未必,这两种环境非常不一样,如何使用大数据如何使用大数据推动金融往前走,可以有一个交流,整个演讲沿着这个思路来的。
简单介绍一下公司,集奥建立于2011年,我们在多家城市都有分支机构,并且有几家子公司,包括爱图数创,大数据广告投入,汇百川是风控领域的公司,维塔信也是风控,上海亲信是2C领域的。
我们为客户提供产品和解决方案,为客户创造商业价值的模式。
我们在长期积累过程中逐渐演化出两大跟金融相关平台,这两大平台是我今天演讲的主题之一,我想顺着这两大平台结合金融行业实际应用场景跟大家分享我们对于大数据驱动性金融的认识。
一个是营销,一个是风控,这两个是金融行业比较核心业务。
营销平台,我们武装能力就是业界唯一的一家根据金融产品设置的平台,金融机构可以根据不同的金融产品,信用卡、理财等等找到他们的感兴趣的客户,我们给客户提供比较好的体验,在银行、金融机构增加客户价值机会的机会。我们平台根据营销场景进行个体化推荐,这也是大数据比较常见的应用场景,但是我们平台能够在金融行业切得非常细,非常精准为客户提供价值,跟他们用户产生最直接最有效的对话和沟通。
第三,我们能够根据用户属性和偏好用户选择的这么一项功能。
风控平台,目前市面上结合运营商数据一家比较大的验征平台,检验金融机构客户自称他们的客户,我叫丁磊,身份证是多少,我们平台提供有效验证服务。
小额信贷领域提供相关风控经验,有一些客户跟他进行深入合作。
成熟的风控算法和模型,主要这两大平台,我们给金融机构带来价值,让用户端的体验变得更加好,让他们更加好获得金融产品服务。
这两大平台有两大特点。
第一,聚合多方数据源,我们集团作为大数据服务商,集合很多数据源,运营商数据、互联网数据,第三方数据,我们平台本身聚合整合大量数据源。
第二,在聚合大量数据源基础上,我们进行了分析加工、数据挖掘、提炼过程,这两大特点是两大平台背后共有的属性。
下面再介绍集奥大数据建模平台,前面面向金融机构,这个平台是后端,我们从事一些建模包括我们给金融机构分析人员提供建模的平台,这个平台有这么几个特点。
第一,大规模的运营化、模块化的平台。
第二,很直接给金融机构分析人员使用这么一个平台。我想在座很多位对金融建模有体会和认识,我们这个平台很大的价值能够支持金融机构分析人员自主灵活建模,而不是每一个建模任务都经过很冗长冗余的技术处理,我们平台把大部分这样的过程自动化、简便化处理,金融机构分析人员只要把自己的业务逻辑写在里面就可以快速建立模型。
下面我说平台的流程。主要三大块。
第一,ETL数据整合,包括统一的标识。ETL就变成格式化数据,金融机构包括客户提供给我们原始数据,经过组建加工以后变成格式化的数据。
第二,特征提取,我们从大量的格式化已经处理好的数据提取出我们认为对金融机构或者金融机构自己分析人员认为对它业务能够有提升,相当于有很多信号的数据,这些过程包括数据过滤转化聚合等过程。经过这个模块处理进入模型训练过程,包括特征选择、数据建维、优化等组建,整个过程是一个持续迭代运营化的逻辑。
我们建立一个模型可以采用比较人工方法,那个在金融机构耗时比较好,营销模型、风控模型需要三到六个的时间,我们每个模块有定制文件,通过一种简化的模块化并且图形化交互方式,我们可以使金融机构人员很容易建立它的模型,并且经过非常详细检验,确保模型质量前提下降低模型建立的周期,这是我们比较偏后端,大数据建模核心思想和理念,在这里跟大家做分享。
下面说完了集奥公司产品和平台布局,我们想说说金融市场。
金融市场是非常大的空间,大金融的生态系统里包括一些相对比较传统的商业形态好比银行、保险机构等等,也包括相对新的行业形态,P2P公司、小贷金融公司等整个体量是非常大的,我想有几个数字非常有趣,2007年据可靠预测,消费信贷规模会27万亿,新增的信用卡量有一亿张,这是非常大的体量,通过大数据为金融机构提供服务有市场空间和前景,大家看看这些数据。
下面一句话总结一下我们演讲主旨,我想传达的一个观点,金融服务将由数据资源丰富而变得更加有效和普惠,下面结合这个点,结合这个主旨再展开进一步和大家的讨论。
下面思路会顺着这两个平台,金融营销平台和金融风控平台结合实际案例和大家讨论,为什么用大数据资源、数据挖掘让金融变得有效和普惠。
金融营销平台,一个企业、一个金融机构在客户生存期里跟客户建立有效共同和对话,使客户的价值提升并且为客户创造比较好的体验,这个就是营销解决的实质的问题
第一潜客转化,让潜客变成客户这是第一个阶段解决的问题。
第二阶段,潜客跟客户金融机构跟他有一个互动,生存期里的沟通和对话。
第三,体量和提升,客户成为你的客户,有使用一定产品的经验,如何提升这个客户对金融机构的价值,如何使客户体验更好。
最后,防止客户流失,流失预警和激活应用场景在这儿。每一个模块,平台上都有相应的产品和服务为金融机构提供相应的技术支持和服务。
第一个模块,潜客转化,我们给市场上的潜客根据金融机构包括自己的产品线给自己打分,我更某一个银行一个理财产品,在座一个听众对另外一个银行的理财产品倾向性更高,我们对每一个系统进行系统化的打分。
第二,新客户互动,潜客刚刚成为金融机构新客户,金融机构对他的数据掌握比较少,我们通过客户聚类,把你新客户跟你原来的聚类进行对比,发现如何挖掘现有聚类的价值来为新客户制定相应营销策略,这个在早期提升用户价值是非常有益的手段。
第三,存量客户,我们有相对比较多的用户属性和记录,我们给他制定产品推荐,有产品推荐引擎。
最后防止流失,有流失预警和激活的服务,一个客户一旦流失对服务机构损失相对比较大,我们在客户流失前做出一定的预警,一个消费者一个银行客户有这些先兆可能离开一个银行机构,之前有行为特征,我们通过自身整合数据源包括银行内部自己的数据源可以做数据挖掘的服务来向银行提醒,金融机构跟他沟通,防止客户成为真正的流失客户,这是营销环节最后一部分,防止流失。
顺着这个思路,我举一个案例,向大家阐述为什么营销平台会给我们金融行业客户带来价值。
我下面举的实际用户例子,这个用户有一百元的活期存折,没有信用卡,从传统角度看他是高价值客户还是低价值客户?从传统金融机构视角来看他肯定低价值客户,没有高价值的金融产品使用经验,他的账户也是非常不活跃,传统金融机构视角通过一系列的结论是低价值客户。
同样一个客户,在大数据支持下有如下的特征,关注互联网理财,每年两次的旅行、关注房地产市场,每周五天在外地,同样是高价值还是低价值。这是高价值的用户,通过两种不同的数据描述,虽然对同一个人有这么大的反应上的偏差,大数据给我们提供的一个价值。
传统金融机构用到的数据跟投资理财金融相关的数据,数据作用非常大,但是很可能忽略大数据维度,通过不同角度、棱镜我们看到视角完全不同。
我们营销平台所采用的方法结合金融机构的视角,这些变量通常是比较强的变量,在大数据支持下也得充分发挥这些数据的价值,结合了我们在大数据视角下整合的第三方包括金融机构自己自身数据,这些数据整合在一起,我们为客户提供贴身服务和精准沟通。通过建模平台支持下,我们可以给客户,一个用户在最佳的时间、位置和设备上推荐最佳金融产品,当然有一系列的营销场景和方式选择,包括什么时间跟用户沟通,他是早上还是晚上,他对一个广告或者说一个信息的响应率最大,这个时间可以优化,营销渠道,每个人关注营销渠道不一样,有些人用微博比较多,有些人在微信活跃时间比较长。
营销具体的方式,什么样的内容让用户接受,并体现他对一个金融机构的价值。
我们为客户推荐如下产品,海外旅游信用卡、知晓银行高收益理财,儿童大病医疗保险。
我想总结一下金融机构数据价值很大,结合第三方、结合大数据源我们对客户有更精准的理解,从而给金融机构的客户提供更准确的服务,这是金融营销平台主旨之一。
我们分成营销平台和风控平台,风控业务是金融行业最核心的业务之一,金融风控实质在信贷生存期各个节点上降低风险,风控做的实质内容,有几步。
第一,贷前。
第二,贷后,用户得到贷款,进一步贷后沟通。
第三,催收管理。
在每一个信贷生存期每一个节点我们都是相应数据产品和服务。好比在身份验证阶段,我们有客户验证产品,验证你是你,你去银行申请贷款,我们产品可以通过你的数据结合我们数据源验证是你生成的数据身份。
第二,反欺诈这个环节,我们有反欺诈系统,通过各种整合的数据源包括银行自己的数据源来鉴别,哪些申请人可以是有欺诈嫌疑,有欺诈嫌疑申请人对银行是非常高危的人群,通常银行直接拒绝贷款或者线下人工沟通,我们系统提供这样的服务,让银行审批人员结合我们系统做出最优的判断。
第三,信用评分。信用评分在反欺诈环节后,在银行金融机构里决定给申请人是否受信,受信额度的服务。有些人信用分比较,他就获得一笔贷款,贷款额度可以给他相对比较高的额度。
在大数据这端做的建模的过程,通过我刚才说大数据建模平台,我们为每一个银行客户打上一个分,分值比较高,银行倾向于给他放贷,如果分数比较低,就不给他放贷。
贷后管理有一个逾期预测过程。在已经批贷这些人群中帮助金融机构预测,哪些人更可能逾期,就更大逾期倾向性,银行或者金融机构跟他进行比较深入沟通,防止真正逾期行为发生。
最后催收,银行机构的客户发现逾期行为,如何帮助银行进行对话和沟通,让这笔欠款收回,这里有很多大数据建模和预测的业务在里面。
整个流程就是我要说的如何用集奥金融风控平台解决风控生存期各个业务实际需要。
同样我想举一个实际例子,这么一个人,他是刚刚踏入社会,每月收入不高,工作时间不长,现金结算,从未有过信贷记录。银行会不会给他发信用卡,肯定不会。
我想同样这么一个人,整合这些大数据的维度,把我们说的数据维度,好比说稳定水电媒通讯网络缴费记录、看电影、近郊旅游、热衷于软件开发的交流,参与网络教育,我还想让大家猜一猜,结合这些维度,大家能给他发信用卡还是不能给发信用卡?我想这个答案,结合这些信息维度,行为稳定有爱心、兴趣广泛,健康向上取决于银行自身风险偏向性,这个答案是yes。根据我们之前收集到历史数据,哪些人更可能违约,哪些人欠款,行为相对比较稳定,就像这位客户一样,有一些比较稳定缴费行为,并且他有广泛的兴趣,通俗来说比较正能量行为活动在那里,通过大数据分析和建模平台我们给他打上的分是yes,可以在银行获得宽,在大数据维度相比传统金融机构的视角获得贷款,这就是大数据金融眼光,如何通过胶片上所显示大数据的维度,把这些数据给信用化,从而为金融机构做出更好的贷款决策提供依据。
刚才说到金融营销平台和风控平台,结合实际具体例子向大家阐述,为什么通过大数据帮助金融机构,帮助银行帮助小贷公司包括P2P公司提供相应的营销和风控上的决策。下面我想举实际的,更加量化的案例让大家进一步描述和分享,我们平台的能力包括如何用平台为金融客户提供价值。
营销和风控两个案例描述。
左边我写的案例帮助某手机银行激活,他实际困扰,手机银行激活率非常低,我们给他制定营销方案,通过定制化的权益,给他提供一个互联网公司来的优惠券或者对消费者有用福利刺激来让银行消费者激活手机银行这端业务,因为这些客户大部分都是银行净值客户,银行无法很好做出营销活动的方案,我们结合自己的数据源包括银行有的一些数据进行建模分析的过程,就帮助银行给他手机银行还没有激活客户做了营销活动,营销活动上我们根据客户习惯向客户推荐了他最感兴趣的权益,通过客户最感兴趣的权益我们增加手机银行激活率,提升43%,比传统方法提高了近20个百分点,这是之前的案例进行比较得到的结论。
右边是一个风控相关模型。我们给小贷公司建模,一个人信用比较好有比较正能量的行为,通过大量数据分析,行为建模,我们为小贷公司建立了基于大数据,风险评估的模型,通过模型,KS值,通过实际测试超过40%,还是比较令人满意的数值。具体说一下,我能够帮助金融机构通过80%的申请,80%在某群体下的这些申请人我能给他做出放贷的决策,逾期率只有1.3%,如果我放60%的话,我放更少的人这些人信用就更加高,根据我的模型逾期率更加低,总体模型集奥包括我们服务的金融机构都是比较满意的数字。
通过这个案例阐述,通过金融平台一些数据的描述,我想跟大家再总结一下我们集奥关于大数据驱动金融观点。
大数据营销和风控能够使金融服务更加有效和普惠。我的演讲到此结束,谢谢大家!