导读:5月19日,由钱包金服大数据信息部和DataFun社区主办的主题为“FinTech助力新金融发展”沙龙在望京洪泰创新空间举行。本期活动由卡耐基梅隆机器学习博士毕业的钱包金服首席数据官李届悦、大数据应用平台项目研发负责人蒋乾坤和量化策略副总监孙溪从场景到大数据、机器学习、量化分析等技术的应用详细讲解了金融科技是如何助力新金融发展的。
什么是新金融?某百科上的解释是:新金融是指金融要素市场化、金融主体的多元化、金融产品的快速迭代过程正在发生。在互联网和信息技术革命推动下,金融业架构中的“底层物质”正在发生深刻变化。移动化、云计算、大数据、区块链等大趋势引发金融业“基因突变”。这种变化使得传统金融业版图日益模糊,促使传统金融业务与互联网技术融合,通过优化资源配置与技术创新,产生出新的金融生态、金融服务模式与金融产品。通俗来讲:就是大数据、算法等金融科技(FinTech)让金融走出华尔街(传统金融),回归服务实体经济;让金融不只关注赚钱,更关注解决人们生活中的实际问题。
5月19日,由钱包金服大数据信息部和DataFun社区主办的主题为“FinTech助力新金融发展”沙龙在望京洪泰创新空间举行。卡耐基梅隆机器学习博士毕业的钱包金服首席数据官李届悦、大数据应用平台项目研发负责人蒋乾坤和量化策略副总监孙溪,均出席新了本次活动并分别分享了以“场景+科技 助力新金融”、“钱包风控系统技术成长与蜕变”和“量化策略助力新金融”为主题的演讲,进而从宏观背景到应用场景再到大数据、机器学习、量化分析等技术的应用详细讲解金融科技是如何助力新金融发展的。
当下,随着经济的发展、物质的积累,为人们的生活消费提供了丰富的产品和服务;然后国家宏观经济发展模式调整,供给侧改革,更注重优化消费结构,实现消费品不断升级,不断提高人民生活品质;其次移动互联网的发展,使触达客户变得更容易;再有小微商户、企业对融资的需求;最后在海量数据的快速积累,场景+科技的融合下,催生了新金融业务。
李届悦 钱包金服 首席数据官
李届悦以小微商户金融信贷业务为例:其覆盖全国生活场景达30W+(到店服务、优惠支付、钱包支付等),而个人消费金融/小微商户金融信贷的特点是:小额、高频、分散、短期,注定需要数据+科技,需要批量获客+自动化+人工智能。
李届悦指出对于大数据科技平台架构设计包括大数据仓库和大数据应用平台俩部分。
其中,大数据仓库主要分为:
①数据源:分为结构化数据、半结构化和非结构数据,结构化数据主要来自收单、清算、客服等系统;半结构化、非结构化数据则主要来自合作机构和互联网;
②获取层:数据采集包括:云化ETL、外部数据处理、流数据处理以及爬虫等;对于结构化数据通常采用批量采集的处理方式,而半结构化、非结构化数据通常要采用准实时和实时采集的方式;
③数据层:包括主数据仓库、分布式数据库、Hadoop平台;
④能力层:包括基础分析、多维分析、数据挖掘、实时分析、自助分析、数据共享等;
⑤应用层:包括指标应用、报表应用、主题分析、专题分析等,用来支持精准营销、智能运营、高层看板、舆情监控、智能客服、风险看板等业务。
而对大数据应用平台的要求则是:自动化、数据化、标准化、实时化(秒级)。
李届悦特别为大家介绍了大数据和机器学习模型以及在大数据风控上的应用。在实际的业务场景中,往往存在多种风险,例如欺诈风险和信用风险等。对于欺诈风险往往采用:身份验证、实名验证、LBS验证、短信验证、人脸识别、活体识别等;而对于信用风险通常采用:历史贷款,多头记录,偿还能力等来辨别信用风险,现今通过大数据+机器学习的模式对欺诈和信用进行综合打分能够更快速有效的识别各种业务风险。
当下,从0到1搭建一个大数据风控系统并不能解决所有问题,还需要不断的成长与蜕变,以钱包风控系统为例:对于1.0版本,其通过微服务+规则引擎技术来实现,授信时长5-20分钟,采用部署规则的方式来授信;而对于2.0版本则通过引入深度学习模型来实现实时授信(秒级)。蒋乾坤表示,大数据架构改进后的优势:使日处理申请量达到20W件,件均审批时长达到秒级,无申请件积压,各节点接口响应速度无延迟。
蒋乾坤 钱包金服 大数据应用平台研发负责人
接下来,蒋乾坤为大家介绍了大数据与区块链之间的关系,并结合业务场景讲解了其是如何应用的。
大数据与区块链的关系有以下几点:
①数据安全:区块链让数据真正“放心”流动起来;
②数据开放共享:区块链保障数据私密性;
③数据存储:区块链是一种不可篡改的、全历史的、强背书的数据库存储技术;
④数据分析:区块链确保数据安全性;
⑤数据流通:区块链保障数据相关权益。
那么我们如何把大数据与区块链结合呢?答案是联盟链。联盟链技术方案多样,最受关注的联盟链技术方案为 HyperLedger其具有:成员许可制、模块化架构、有限公开、查询方式多样、支持插件、密钥安全等优势。
蒋乾坤特别指出未来在做好风控的同时,合理使用数据,待大数据+区块链技术开发的产品真正的开源起来,不仅服务金融业务,同时把用户的隐私数据真正的保护起来,需要行业人士一起贡献自已的力量。
当下,风险已经场景化,面对庞大的线上消费场景、真实交易,消费信贷和电商无缝耦合,这使得风险不在是孤立存在而是与场景、产品融为一体,从而使传统的流程控制驱动的风险控制转向数据驱动的在线自动决策。
孙溪 钱包金服 量化策略副总监
孙溪指出科学的决策体系是指从数据->模型->策略->系统形成闭环体系,通过量化策略闭环,与模型竞合冠军挑战,使决策具有可持续性、智能化、自动化;结合业务场景,钱包打造了自适应的闭合体系:客户行为轨迹->数据积累->模型开发->策略开发->效果追踪->新数据积累->模型、策略的优化或重新开发,循环往复过程。对于量化分析的目标则是:通过管理、监控、分析及挖掘相关数据指标,找出潜在及深入问题,随后采取有效相关举措,保通过平衡的前提。逐步控制新增逾期,消化逾期存量,达到降低逾期率及有效控制不良率的目的。
最后,孙溪为大家详细介绍了分析中的异常监控预警、从指标异常到交易欺诈异常监测、生命周期(LTV)分析及数据驱动定价等内容,并总结到整个量化分析通过(LTV客户生命周期模型、业务场景观测与分析、客户画像分析、风险控制解决方案)四步来完成风险控制助力新金融在风险管理方面的发展。