编者按:本文来自东沙湖基金小镇,创业邦经授权转载。
近日,蚂蚁金服人工智能部专家袁峻峰受邀进行线上直播,就“数字化时代金融的机会”进行了详细分析,分享如下:
大家好,我是袁峻峰,现任职蚂蚁金服人工智能部,从事基于机器学习的内部项目,本次我分享的主题是《数字化时代金融变革与机会》,仅代表个人观点。
01 物理世界数字化
物理世界数字化是数字化金融的基本前提。当前疫情加速了生产、生活线上化的进程,这是大家的共识。可以预见的是,在不远的未来,在5G、物联网、云计算更加成熟的时候,道路、汽车、机器的实时数据都会被收集到互联网上,将会形成一个与物理世界平行的数字世界。
中国在这次数字化进程中是具有优势的,现在大规模开展新基建也恰逢其时。个人预期,数字化从中国来说,会比国外更早到来。
02 数据的价值
洞穴之喻是关于事实与数据之间关系最好的解读。洞穴之喻是《理想国》里著名的比喻:设想在一个地穴中有一批囚徒,他们自小呆在那里,被锁链束缚,不能转头,只能看面前洞壁上的影子;在他们后上方有一堆火,有一条横贯洞穴的小道,沿小道筑有一堵矮墙;人们扛着各种器具走过墙后的小道,而火光则把透出墙的器具投影到囚徒面前的洞壁上,囚徒自然地认为影子是唯一真实的事物。
其实数据也是这样,就像映在墙壁上的影像,这是人们用低维的数据描述高维的事实。但在数字化时代,我们有更多传感器或者手段量化事实,所以我们就会感受更加真实的世界。这些更多维度的事实,更实时的数据,也可以帮助我们更加理解周围的事物和自己,降低整个社会的不确定性。
我最近有一本新书《人工智能为金融投资带来了什么?》,这本书里面就有一个观点——数据天然具有外部性。数字化时代,数据外部性,才是降低经济、社会中不确定性,提升效率的根本原因之一。同一组数据,可以在不同的维度、场景,产生不同的价值,如果我们不断挖掘、扩展使用的维度,那数据的价值就会不断增加。
03 数字化时代的机器学习
《暗数据》这本书表明,数据里面,我们知道的信息是明知识,但还有很多不知道的暗知识,明知识就像冰山一角,更多的知识藏在下面。这些暗知识,因为大数据具有高维度、稀疏以及海量的特征,用传统的统计方法很难进行分析,所以数据化时代离不开机器学习。
个人认为,随着数字化往前走,人工智能的浪潮会有一些低谷,但不可能再离开机器学习。因为大量数据必须要有分布式存储、云计算以及分布式机器学习平台,以此支持它的数据分析,这样数据的价值才有更好的体现。
对于工业界来说,在科学界会有各种研究方法,现在也有一个很重要的方向,就是在小数据集上的学习。我个人认为,在工业界还是“大力出奇迹”,这是不二法门,只有充分利用大规模数据、大规模计算,挖掘数据本身的信息,解决领域中的问题。
那么,怎么判断是不是领域智能方案?主要是看,能不能有效利用机器挖掘我们无法认识的知识和信息,从而解决领域的问题。现在新制造、新零售,数字化协同相对比较成熟,这也就是说,一旦机器能比人类更有效的挖掘数据信息,那这个领域现有流程和方案就会被重新定义。在各个领域,我们都是以这种标准,看是不是数字化时代的智能方案。
04 金融投资中的大数据
金融投资相关的大数据一般分为四类:一是新闻、社交媒体大数据;二是市场大数据;三是行业大数据;四是传感器大数据。
我想讨论一下大数据的分析方法——还原论。还原论认为,复杂的系统、事物、现象可以将其化解为各部分之组合加以理解和描述,高层的对象可以分解为底层、简单的对象进行处理。
还原论是基于人的分析逻辑,但从大体来说,目前我们在金融投资里面的大数据都是还原论的方式。
05 金融投资中的机器学习
机器学习从方法论来说,它分为监督学习和非监督学习。监督学习可以分为分类问题、回归问题,像预测资产的价格就属于回归问题,预测涨跌或者其它的属于分类问题,而配对交易,资产相关性,这些属于非监督学习。
金融投资一直是数据应用非常成熟的行业。像彭博、路透,它们都有很成熟的金融数据体系,在数据集上已经基于人们长久的经验或者经济学原理,做了很系统化的管理,这属于大数据集上的应用。还有图像识别,比如卫星图像监控矿山、石油、库存等,这些都属于机器学习在特定环境的应用。
我们刚刚说,改变整个领域的方案肯定是要改变整个领域流程,那是不是它其实是端到端?大家可能都听过,机器学习方案非常强调端到端的优化。比如金融投资,从原始的数据加工、在线机器学习模型得到投资信号,再用模型强化学习,进行策略优化以及风控,直接进行交易等。
但我不太认同端到端的投资方式,把机器学习只当成一种工具或者模型。究其根本,是要在投资领域有效界定问题,并且找到相关数据,然后用合适的算法或者机器学习、数据模型解问题,这不是端到端的问题。另外,机器学习还在做同层问题的优化,并不存在用低维度的数据直接学习高维度。在投资里,假如数据是微观的,投资标的是宏观的,那这种端到端的预测必然不会有特别好的效果。
06 金融投资机构的智能化之路
投资流程智能化,在领域智能化是一个大方向。把大数据、机器学习嵌到投资流程当中,使用大数据处理,做特别问题的优化以及预测,可以预见这在环节里的比重会越来越大,而且机器学习算法不停进步,处理成本会更低。一个环节成本更低的时候,各个环节的价格就会被重估,会重新划分职责,也会重新设计环节及职责岗位。
通常对金融机构来说,选择外部的云计算供应商是比较合适的,因为自建大数据和机器学习平台成本非常高。但为什么一些To C顶级机构还是会自己做呢?因为决策要嵌入到各个环节,如果是用开源或者云计算,它很难进行定制,所以一些大机构还是会选择自己做这个事。
但自己做就涉及到大数据团队和机器学习团队的招聘和建设。金融机构希望有自己的团队,但又希望马上创造价值,这就会有各种矛盾。目前,机器学习还是一个辅助投资,各个公司有各个公司的方案,需要各个团队,包括投资的前台、中台、后台以及IT团队、大数据处理,相互融合将机器学习应用到风控、投资策略。
个人认为,如果未来市场都是取决于谁拥有最强的机器、最多的数据、最厉害的算法,那这也违背了市场机制,因为市场是一个资产配置或者意图选择。
07 智能助理
智能助理,也是领域智能化的重要方向。人的决策系统是不可能随着数字化增长就马上进化的,这就必然存在鸿沟,智能助理是有效弥补鸿沟的方式,可以帮你处理海量数据。
大部分机构投资者如果使用一个智能助理,可以帮助他有效的进行信息筛选,减少判断。智能助理之所以厉害,就在于能处理信息,并且进行决策。对交易员、分析师、风控来说,有智能助理进行辅助处理,都是需要的。
专家自动化以及增强性服务是领域智能助理的重要方向,有助于提升效率。在未来,更加精细化的决策,只能依靠于机器辅助完成。因为任何一个人都是有限的认知能力及有限的理想,在数字化时代,这个鸿沟是必然存在的。
08 数字化时代金融变革
数字化能改善金融资产的定价,在投资里使用大数据投资和机器学习是重要的方向。
我觉得,在数字化时代,金融市场上的旋律,价格不再是唯一的信号,它不是由价格小提琴独奏,可能会演变为交响乐的演奏,价格可能是小提琴首席等,但别的信息也会发挥作用,比如,基于统计的市场流程部分将被算法代替。
基于数据和科技金融的资产证券化业务模式,主要体现在基础数据科技运营、风险定价,这部分用了大数据和机器学习的方法,但流程还是资产证券化,只是某些重要环节引入了大数据和机器学习。
关于数字货币,一个观点是交易即清算,实时划拨,对金融原有流程都会产生巨大的变化。另外,区块链里面有智能合约,在双方条件满足的时候,自动触发交易达成,钱自动划拨,交易可以构建新的市场。
09 小结
我觉得,变革既然不可避免,那对个人来说,肯定只能以更加积极的态度拥抱变化。中国处在一个金融开放、叠加数字化金融的过程中,谁都不知道会有什么样的变革,但变革是必然的,大家还是要了解一些技术,比如非对称加密、点对点等,否则很难理解数字货币和物理世界数字化带来的巨大潜在变化。