位置:科技大田大数据产业专题>>资讯>>市场>>内容阅读
农业银行赵存超 秦行 王鑫毅:品味AI 商业银行AI平台及应用建设实践与思考
原标题:农业银行赵存超 秦行 王鑫毅:品味AI 商业银行AI平台及应用建设实践与思考

毛主席在《论持久战》中曾经讲到:事物的发展总是跌宕起伏、犬牙交错。大数据的流处理仍然未到框架成熟、技术稳定的时候(即使在阿里,依然是:Batch占比70%、OLAP占比10+%、Stream占比10-%、Other占比10%)。所以从同业的情况来看,一方面要实时化、做数据的流式处理,另一方面要解决很多人被“T+2?还是T+1?”的问题所困扰着的数据批处理问题。

我们再说接口(或服务)的超级简化。在阿里有这样一个说法,即人人都是数据分析师。早先的大数据主要面对技术人员,而现在面对更多、更广泛的技术及非技术人员(比如BI分析师),所以过去几年开源大数据技术开始用SQL描述多种计算,使得大数据的利用更加简单,因为SQL是标准的、简单的、通用的、易理解的、分析师习惯使用的。所以,在阿里的实践中做了三个统一:

(1)统一的计算引擎:涵盖Batch、Stream、OLAP、ML、Graph等;

(2)统一的抽象方式:Unified SQL & API;

(3)统一的BI+AI引擎:比如 数据清洗、训练、基础指标加工等等。

在GPU流行一段时间之后,暴露出一些问题,如硬件结构固定不具备可编程性、运行深度学习算法能效远低于FPGA、算法集成功能及成本等因素不如ASIC等等,人工智能的硬件发展方向又逐渐向FPGA和ASIC转移。基于实时化大数据处理的需求,在芯片技术的快速发展推动下,异构计算的发展更加精彩纷呈(CPU+GPU、CPU+FPGA、……)。

华为公司在2018年全球大会上关于量子计算的展示

在芯片发展技术的基础上,基于计算碎片化的现状,还有一种算力的发展模式——边缘计算,最典型的就是在终端物理设备上的预处理(比如探头、手机、穿戴设备等),然后在传到服务器端(云端进行处理)。这一点对于银行业AI前瞻应用来说是应该关注的,比如以后的智能穿戴设备银行,就需要在终端上具备AI的算力。

横向来说,云计算是算力发展的另一个大方向。云计算通过资源的整合、按需供给、快速共赢和释放等方式,极大了提高了资源的效率,降低了使用成本,扩展了算力的边界。我们简单地从阿里云的实时数据仓库AnalyticDB产品来看,云计算如何支持数据处理的实时化和数据服务的简化的。AnalyticDB通过架构解耦(读取、写入、元数据、索引构建 等节点分离),支持独立弹性伸缩;支持混合负载,支持1000+节点扩展。分为三层:

底层——盘古分布式云存储:支持分级存储,云存储,本地高性能缓存(flash卡); 以及各种索引:粗糙集过滤、倒排索引、位图索引;

计算层——在线、服务的可扩展性能力(在线升级):节点多活架构,支持滚动升级、在线扩缩容,不需要停机。

接入层——数据湖分析服务Data Lake Analytics:通过Serverless架构,实现按照使用服务的方式进行资源分配、进行“成本计价”(跑个SQL才会收费,按需收费)。

Serverless(无服务器架构),常常与Faas(Functions as a Service)一同提及,以亚马逊的AWS Lambda为案例,Lambda能让使用者不用思考,也就是说,不用你处理服务器上的部署、服务器容量、服务器的扩展和失败容错、服务器上选择操作系统、语言的更新和日志等问题。你的应用程序只需要和多个第三方的API或服务打交道,也可以自我创建一个无服务器的API。云计算+大数据,让数据服务接口的极度简化成为可能。

两者一个是现占有率高,一个是后起之秀,两个项目在竞争中发展,而从两个框架的演化路径上我们也可以看出Spark借鉴了flink自有内存控制的设计,蓝图上也将借鉴flink设计面向事件的流执行引擎。flink借鉴了Spark在集合抽象、Sql等方面的工作。当然两者本质上的区别仍然存在,spark当前使用minibatch来模拟流处理,这限制它更多的被用在有序数据或事件时间无关的场景下、flink则支持严格的事件级流处理,但是从场景看对延迟要求如此严格的应用比例并不高,所以很可能不足以构成企业淘汰Spark大面积换用的理由。

其次是人工智能,互联网大力研究人工智能的初衷很明确,AI可以比传统算法更好地处理图片数据,这可以极大地提高搜索、推荐内容的质量。在有监督学习方面,深度卷积神经网络、递归神经网络在图像识别、自然语言处理领域有了很大的突破。但是当业界热情高涨的期望人工智能能爆发出更多能量的时候却遇到了更多的困难,有监督学习更多的时候假设AI所处的环境时近似静态的,这导致模型的鲁棒性不足,当应用于现实世界的多种场景时,环境的不可测量性、随机性、博弈等因素导致很多问题无法解决,这促使结合了深度学习的深度强化学习成为新的热点,因为强化学习的目标是构建一个在与变化的环境连续交互的过程中能获得高分的模型。

互联网的下半场也衍生出了一系列其他的商业模式例如面向实体服务业虚拟化的LBS,面向生产力的公有云服务,面向企业市场的软件产品输出。但是,这些业务相对于互联网来说是重资产项目,投入高回报率低,也就是说目前这些都还是“副业”。那么从技术的角度来讲未来有哪些可能呢?

1、处理大量的数据需要庞大的计算资源,互联网需要云计算继续稳定的前行。结合微服务化的趋势,资源虚拟化、容器编排等自动化运维技术会向高自动化、低成本方向继续深入发展。

2、大数据与流计算技术作为大规模算法的基础,不会再成为风口,但会继续受到互联网公司的重视,因为它们是各种算法的执行层。大数据技术将发展的更加精细。尤其是流计算在乱序数据处理、强一致性、状态保存这几方面将有更成熟的方案。

3、人脸识别、语音识别等将逐渐功能化,加入到各种终端上,这些技术的价值在于可以帮助弱势群体更方便的使用终端上的服务。所以一定要在设计上保障无障碍。当然最需要解决的瓶颈问题是如何让算法更强通用,如何迁移知识,如何进行自动化的神经架构搜索。

4、人工智能算法的多变性导致AI计算器框架将经历比大数据更多轮次的迭代。未来业界的重点投入方向将会是更通用的AI框架的研发。

从金融科技的角度来看,金融业务并不是争夺大众注意力业务,相反它是一种通过专业服务来节省用户投注在金融活动中注意力的业务(一个好的工具应该让用它的人注意不到它的存在)。这决定了我们需要的是一个让足够方便的业务功能入口而不是参与争夺注意力的战争,方便到用户可以随时随地通过简单的操作就可以完成操作。所以,触及大众的渠道和内容分离的模式更适合金融业,语音、图像识别等现在较成熟的AI能力可以把业务做的更简洁、多样化,通过多种形式的渠道对接用户,通过优质的服务来吸引用户高频使用是核心目标。

【三品AI:洗尽铅华方为真,AI+银行=?】

“凡所有相皆是虚妄,若见诸相非相,即见如来”——《金刚经》

AI火热浪潮退去之后,到底谁在裸泳?AI能够给银行业带来什么,我们又该如何把握它?尤其是在金融科技及数字化经济的大背景下,这个思考变得尤为关键。

先从赋能谈起,AI能够为银行带来“三根毫毛”(之说以说是毫毛,无用时若隐若现、可有可无,亟需时雪中送炭——救命毫毛)

一是善其事利其器;二是增益其所不能;三是吸引注意力、融入未来生活圈。

善其事利其器——AI能够为银行降成本、提效率(开源节流),其实质是“自动化、信息化、智能化”的一脉相承。我们需要关注,是否可以通过AI将一些金融业务中复杂度稍高的非标准化环节替换为自动化过程。这可以极大的缩短业务流程耗时提升整体运营效率。

一个快速而活跃的金融市场客观上要求参与其中的单元都能够快速响应。举几个栗子:通过适合特定场景的OCR识别服务(准确率要过关),可以有效提升票据录入的效率;通过对特定流失客户的精准预测,可以识别并挽留用常规方法所无法发现的重要客户群体;基于AI技术的智能投顾,可以对十几年的资产及客户历史数据进行建模,节省近万名客户经理在基金营销、基金咨询方面的投入(因为这些客户经理的咨询服务难以达到长尾客户、而hold住长尾客户是银行数字化转型的关键),当然同时提升了客户体验。

返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
免责声明:本网站部 分文章和信息来源于互联网,本网转载出于传递更多信息和学习之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请立即联系管理 员,我们会予以更改或删除相关文章,保证您的权利。对使用本网站信息和服务所引起的后果,本网站不作任何承诺。
Copyright 版权所有 Copyright 2013-2014 福建省云创集成科技服务有限公司
All Rights Reserved. 运营维护:三明市明网网络信息技术有限公司 业务咨询:0598-8233595 0598-5831286 技术咨询:0598-8915168