江苏银行“大数据”尝鲜

时间:2022-10-09 06:21:49

江苏银行“大数据”尝鲜

2015年9月5日,国务院印发《促进大数据发展行动纲要》(下简称《纲要》)。《纲要》落地,对接传统行业广泛应用实施,正从具备数据资产优势的金融领域发力。

对大数据创新应用服务这一命题,江苏银行并不陌生。自2014年底到2015年8月,从可研论证到技术选型,从平台搭建到应用孵化,不到一年,江苏银行大数据应用成果丰硕――“税e融”、“享e融”线上贷款产品推出,小微企业金融服务触网进程加快;操作风险事中监测平台上线,在线交易反欺诈应用有效实施,江苏银行大数据应用已贴地起飞。

挽救“死”数据

成立8年来,江苏银行积累了大量内部数据,但受限于高性能存储成本和数据并行化处理能力,80%以上的数据却“死”在系统中。

以对私客户活期账户为例,一张拉链表数据量达数百GB,运行于IBM P6系列小型机的Oracle数据库,统计表的行数就需3小时,如需全量回算历史数据,需导出至另一数据库,耗时数天。以“柜员操作记录”为例,这类半结构化数据每天累计产生量达数个GB,生产环境仅保留短期数据,如需回查需从存储磁带库中导出。

江苏银行数据资产状况一度面临两大挑战。一是利率市场化对银行提升数据洞察能力的紧迫性要求;二是互联网金融创新业务对银行利用数据把控风险、精准营销的能力要求。而内外部数据的急速增长,使得数据处理平台瓶颈成为江苏银行数据应用的焦点问题。

探索新的数据架构,采用新的数据处理技术,江苏银行“箭在弦上”。

押宝Hadoop

经深入研究,江苏银行对大数据处理平台的选型考虑聚焦两点:一是采用MPP还是Hadoop;二是选择开源版Hadoop还是版Hadoop。

因MPP应对1TB~100TB数据量更具优势,成为部分数据量在10TB级别城商行的首选。随Hadoop技术精进,尤其是Spark2.0的,Hadoop在MPP擅长的100GB以上的数据量处理性能上也大为改善,而10TB以上性能优势更为明显,形成了大数据平台新型应用模式(如图)。从经济成本和未来数据非线性增长趋势角度分析,结合现行数据架构,江苏银行选择了Hadoop平台。

在自建平台还是使用产品化版方面,江苏银行经过测试论证自建可行性,得出三个难点:一是基础软件研发专业能力不足,二是深入研究平台技术的时间不够,三是监管机构对系统维稳的要求与开源可能存在的风险存在矛盾。

最终,江苏银行将选择范围集中在符合银行应用需求且成熟度较高的Hadoop产品中。

让数据发声

经过技术调研和平台选型,后续的数据整合、建立模型、应用开发也水到渠成。

2015年8月,“融创智库”大数据工作站在风险管理部挂牌成立,意味着江苏银行大数据战略目标进一步明确――搭建一个平台、实现两大突破。

江苏银行风险管理部总经理周凯表示,新建的Hadoop开源式技术平台――“融创智库”大数据平台,可替代传统数据仓库,一方面通过整合各类行内系统(如核心系统、信贷管理系统、网银系统、个贷系统等)交易数据、账户数据和客户基础数据,开发风险数据集市、资产负债管理集市、监管报送集市等多个内部数据集市,另一方面通过接入人行、银监、工商、税务、法院、海关等20余个机构近千项外部数据字段,应用网络爬虫技术和命名实体识别技术,形成海量外部数据集市。

此外,江苏银行通过建立数据标准和数据治理体系,逐步推进行内行外数据整合、线上线下数据整合、结构化和非结构化数据整合,破解“信息孤岛”顽疾的同时,在精准服务和风险控制两方面实现了大数据应用项目落地,并形成了江苏银行网贷拳头产品――税e融。

尝鲜国税数据开放

通过对接江苏省国税局数据平台,江苏银行小微客户服务触网步伐进一步提速,真正实现了“以税促贷,以贷促税”。

2015年 6月,江苏银行正式推出的线上纯信用网贷产品――“税e融”,正是基于“融创智库”平台和企业纳税数据。“我们与江苏省国税局的合作可谓一拍即合。” 江苏银行总行小企业金融部总经理耿心伟表示,“对银行而言,税务部门数据价值含量很高,根据发票可以判断上下游、透视企业经营稳定性,可有效控制银行放贷业务风险。而国税局自己也在思考转型问题,如何更好地服务于纳税人。”

江苏银行“税e融”业务的特点是以“诚信纳税”客户的历史缴税数据为基础,自动核定不超过100万元的信用额度。“客户登录江苏银行网银和江苏国税电子大厅,就可在线申请贷款,只需提供身份证号、工商营业执照、纳税识别号即可,纯线上审批,最快只需8秒。” 耿心伟介绍说。

目前,“税e融”业务上线两个多月,外部引流获客已近万户,审批通过客户量逾2000户,落地贷款超过10亿元,为制造、商贸、服务等不同领域小微企业提供了“互联网+平台+银行”的新型融资方式。

彰显样本效应

就江苏银行既往发展轨迹而言,耿心伟认为“税e融”已实现了三方面突破。一是产品层面,纳税数据的高质量使得“税e融”产品有了纯线上化基础,有效提升了银行贷款审批效率;二是渠道层面,与国税数据平台对接可新增获客量,为未来与更多电商平台合作引流提供了基础;三是从未来发展看,通过这款产品江苏银行实现了由PC端向移动互联网过渡的突破了,顺应了市场趋势。

“目前先在开放的情况下压着做,慢慢试错,把模型彻底试验出来之后,再尝试省外复制。”下一步,耿心伟考虑将“税e融”纯线上贷款审批模式进一步复制。“但只有做好江苏省内业务,对将来省外模式的复制推广才能构成一个良性支持。目前,无论是从打分卡设置还是转化率的控制上,我们都相对审慎,发展和风控两头都不能少。”

耿心伟表示,目前最关心的是系统引流情况及转化率,对于“税e融”新增获客,江苏银行会提供深度沟通服务。同时,也会基于大数据更好地解决风控问题。据了解,依托“融创智库”平台,江苏银行也开发了基于内外部大数据的信用风险预警系统和操作风险监控系统。目前,信用风险预警系统已上线380多个预警指标,可实时推送给客户经理。

此外,在非结构化大数据应用方面,江苏银行也推出了人脸识别技术。近期,客服机器人上线、视频认证辅助身份识别技术研发等工作在江苏银行内部稳步实施,为科技金融创新之路进一步开疆拓土。

上一篇:中俄能源合作模式研究 下一篇:智能感知 实现人机“沟通”