AI未来的变数,是数据

关注
数据是数字经济时代的原油,加92号还是95号油,决定了人工智能的质量。

9月25日,“2024-ADD数据应用场景大会暨Talk@Taihu台湖见面会启动仪式”在北京市通州区台湖镇隆重举办,50余位数据要素创业者、投资人,一起率先走进通州台湖,共话北京副中心产业发展新机遇。

image.png

会上,神州云合高级副总裁高林东、百望云数字经济与金融科技研究院院长李国平、飞利信人工智能研究院院长林会杰、东方至远创始人兼董事长李吉平、见知数据联合创始人沈航、Datablau数语科技联合创始人&CTO朱金宝,在《释放数据价值,推动产业发展》主题对话中的精彩观点如下:

1.未来几年,财务部将成为企业重要数据的集中地。在所有的财务数据中,现金流数据是非常高质量的数据。企业的采购、生产、再到销售与回款这一套生态,都反映在了银行的收支流水数据里。

2.数据并不是天生就能被应用的。数据是日常经营活动留下的记录,这些记录通过ID系统或其他手段积累的,并不是专门为分析而设计的。从术语的角度来讲,企业要真正应用数据,通常要从供给端和消费端两端来做。

3.我认为算力和算法可能很快就会达到瓶颈,未来的驱动力主要在于数据。如果数据质量高,即使模型很小很简单,也能提供很好的服务。未来AI的变数都在数据上,主体也会回到企业或政府手中。掌握数据的一方,才是我们最大可挖掘的财富方。

4.数据是数字经济时代的生产资料,是原油,AI是发动机引擎,到底加92号还是加95号,这一选择决定人工智能的质量。

以下为现场对话内容,经创业邦整理后发布:

林会杰(嘉宾主持):今天下午我们探讨的话题,是以数据要素为主题。在座的对话嘉宾,各自所在的企业业务也都与数据相关,包括做金融、遥感、税务相关的等等。有请各位嘉宾先做自我介绍。

高林东:我是神州云合高林东,我从事财税工作将近30年,神州云合主要做企业涉税和资金管理,包括发票、算税、报税,财务资金管理、税务风险、电子档案等产品,帮助企业做内部的数据深度挖掘,服务企业的财税模块。客户包括国内的首钢、长安汽车、华润集团等中大型企业。后期我们希望在同业或者说异业合作上做一些探讨,包括和银行等第三方的机构,从财税通过数据把业务外延,使企业数据真正产生价值。

李国平:我是来自百望股份(股票代码:06657.HK)的李国平,今年7月份公司在港交所上市,成为港股“电子发票第一股”。百望云自2015年创立,是中国领先的票财税融一体化解决方案服务商和数据要素生态平台构建者。我们以发票数字化为切入点,在获得企业授权后,帮助金融机构基于数字交易凭证洞察用户业务情况,进行企业的风控建模、信用评分,优化风险管理措施,做好金融“五篇大文章”,助力普惠金融落地。

去年数据要素、数据资产入表的风口来临后,我们公司也正式推出了“百望云金数数据要素解决方案”,致力于解决数据要素的采集、加工、生产难题,推动数据要素的安全互换、互联。今天很荣幸有机会在台湖小镇与大家做交流。

沈航:大家好,我是见知数据的沈航,我个人在财务自动化和银行的基础设施建设领域,深耕了近20年,很荣幸与大家交流。见知数据成立于2015年,是一家专注企业现金流数据公司,我们帮助大企业来实现银企直联,建立超级网银的资金系统。我们目前服务了许多中大型的企业,例如三一集团、联合利华、通用电气、B站、滴滴等企业,并且深耕了约24个重点行业的头牌客户,积累了大量经验。

比起其他资金系统,见知数据的一大亮点是抓住了最没有行业属性的现金流数据,通过这些数据,能帮助到企业优化经营。

朱金宝:大家好,我来自Datablau数语科技,公司创建于2016年,专注于数据治理。我们服务于国内客户,涵盖金融、汽车、芯片、能源制造等多个行业。我个人在数据行业有丰富的经验,见证了数据行业从数字舱时代到BI时代,再到现在的泛化应用,包括机器人和数据知识变现。今天,我们的主题是数据要素,这也是我服务的企业一直在探索的方向。我很高兴今天能与各位领导和专家一起探讨这个话题。

李吉平:大家好,我是东方至远的李吉平。东方至远是一家看变化的公司,我们使用卫星监测技术,为政府部门提供服务,监测包括山水林田湖草在内的万物变化。我们还可以通过细微的形变,感知基础设施、地质灾害等风险,并提供预警。

林会杰(嘉宾主持):感谢各位嘉宾的分享。我补充介绍一下飞利信的业务。飞利信的业务与各位嘉宾的业务是非常互补的。我们过去做“大小空间”,“大空间”是以地理位置信息系统做的GIS系统,“小空间”是智能会议系统。

飞利信是一家在2012年主板上市的公司。近两年,我们也开始转向算力板块,建立了多个算力中心,从普算转向智算。我们期待与包括通州在内的企业家们有更多的合作机会。

回到今天的主题,数据已经成为劳动力、经济、技术等要素之外的“第五大要素”。数据要素作为贯穿整个产业链上下游的关键点,对于产业的发展有很大的促进作用。各位嘉宾,你们如何利用数据要素,去推动整个产业的发展?

朱金宝:关于数据要素,我们服务的客户遍布全国,包括行业顶尖企业。他们对数据要素的探索代表了国内前沿的方向。

企业对数据要素的应用有两个循环:内循环和外循环。内循环主要偏管理,如查看财报和业绩增长。外循环则涉及到与其他企业的合作。

大家最早都是从内循环开始做,从2016年之后,进入了一个比较新的阶段。从算法上而言,过去大数据基本解决了基础设施的问题,还带来了机器学习算法、大模型算法等新算法。数据基本上沿着DIKW模型发展,数据要变成信息、知识再到智慧,过去主要依靠人力进行整理分析,是劳动密集的工作。大模型的出现,加速了这一过程,并且把成本降低了。

从整个内循环而言,大模型从管理到业务都进行了赋能。例如物流行业,已经有了无人速递,将信息流打通。在汽车制造业,我们用数字化追踪汽车制造的过程,包括到每一个零部件的走向,完全实现了数字化,数字化去追踪。目前,内循环已经实现了赋能生产力。

一些国企、央企也在思考,如何做外循环?数据要素过去和金融业结合比较多,现在大家想用资产化的形式放大数据要素的作用,能够更开放去合作,跟国家大形势以及其他的企业结合起来。总体来说,外循环还在探索中。

沈航:从我们行业的角度来看,企业最重要的数据集中在资金部和财务部。未来几年,财务部将成为企业重要数据的集中地。在所有的财务数据中,现金流数据是非常高质量的数据。企业的采购、生产、再到销售与回款这一套生态,都反映在了银行的收支流水数据里,对企业很重要。

我们曾经服务过一个大企业,其法人实体将近100家,海内外一共百家银行3000多个账户,光流水就有300多万的流水,在现金流领域体现了很多企业的经营行为,包括存量资金、流量资金。根据这些数据,可以优化企业的经营和投资。

李吉平:开展对地观测工作,卫星数据是基础,所以东方至远一直秉承着数据的积累工作,有着丰富的卫星数据资源。目前为止东方至远已经积累了全国范围内400余座城市长达13年的雷达卫星数据,我们能够捕捉到每个建筑物、房屋、道路的形变,推断其风险所在,形变监测精度达到了毫米量级。

随着国家对商业航天和防灾减灾的重视,东方至远也走到了一个关键的发展阶段。未来我们计划加强在上游的数据积累。因此,我们正在筹划公司自有卫星星座建设,充分挖掘大数据的价值,实现对全球的基础设施和自然灾害做到周级的反应速度,为国家大数据战略做出贡献。

李国平:百望云的业务主要分为两部分:一是面向2300万家企业提供财税数字化服务,即SaaS服务;二是数据服务(Daas),处理企业日常的订单、发票和财务上下游的对账结算,这些数据在中国云服务市场中以私有云为主,少部分互联网和偏小的公司在使用公有云,这些数据在传统的业态中,都是离散的。

在人工智能时代,算法、算力和大数据是核心要素。现在,大模型技术通过Transformer等技术,比以往的小模型有了显著进步。在中美人工智能竞争中,如何让我们的行业模型更贴近业务真实,关键在于数据价值的挖掘和利用。

2019年,一些数据商因合规问题面临风险。百望云开始探索合法合规的企业数据变现方式。因为我们为中长尾企业提供服务是不收费的,这也是扩税机、降税率的范畴。

中长尾企业需要资金支持、需要上下游结算协同,链主不能很好的发挥支持和赋能上下游资金的作用,小微散客面临融资难、融资贵的问题。在这个点上,我们找到了数据的变现点。

我们与工商银行、建设银行等国有六大行,招商银行、平安银行等十二家股份制商业银行,及全国上百家城商行和互联网金融公司开展合作。行业面临的主要问题是,如何做到普惠金融,将金融向中小微企业做倾斜和支持。

发票数据是我们的强项。在中国,B2B支付都需要开发票,企业各种经营活动也会需要发票。发票数据可以帮助金融机构识别企业信用,同时帮助金融机构进行数字化营销,为产品线上化奠定基础。

高林东:我们提供银企直联和网银直联服务。例如,壳牌、河北物料、全球捷运等公司都是我们的客户。除了发票业务,我们还提供完整的税务申报系统和税务风险管理系统。我曾参与金税三期和金税四期的建设,并且在金蝶工作过,拥有二十多年的财务和税务经验。在税务领域,金税四期改革最大的特点是利用大数据。过去,企业在涉税领域最核心的业务就是发票,税务局主要依靠发票来核查企业的经营行为。但在解决发票的真假问题上,一直是个难点。因为发票只能反映结果,不能提供经营过程的数据。而过程数据包括了资金、合同、供应链数据以及其他的经营数据,才能最真实反映企业的经营情况。

金税四期总局依托互联网和大数据技术,通过数电票的改革,能整体反映企业真实行为。其中,找到所有数据的逻辑关系是最重要的。因此,我们在企业跟上系统之前,都要进行数据梳理,统一数据之间的关联关系,寻找业务逻辑关系,真实地去反映一个企业真实情况。由于一些数据需要企业内部授权才能使用,如海关数据和出口退税数据,所以我们先解决了企业内部的数据治理问题。然后,我们通过数据资产挖掘,帮助企业进行税务风险管控和深度数据应用。随着这些应用的推广,我们正在寻找更多场景来扩展数据的外延,激活企业的数据资产,帮助他们拓展业务。这是我们的发展方向。

林会杰:刚才聊到,在数据产生的过程中,一方面是数据的确权,有些数据的权益到底是属于谁,另外一方面企业生产这个数据,能如何使用这些数据,如何让这些数据为企业、为公共平台创造更大的价值,这是当下数据要素企业面临的一个痛点。

在整个的数据的生产消费链条中,有大量的数据还没被应用起来。我想问一下,几个嘉宾,我们当下如何能够更大化的,更大化利用在生产消费各个环节中所产生的数据,为企业创造更大的价值?

朱金宝:我的一些客户想知道从数据中能获得什么价值,以及投入产出比如何。我们处于AI时代,应用非常广泛,但对企业来说,数据的应用和沉淀比例仍然很大。同时,企业的数据部门也面临困惑:他们准备好了数据,但没有人使用;而业务部门想要使用数据却找不到。这是供需之间的矛盾。

从前面提到的DIKW模型来看,数据并非生来就能直接应用。数据是日常经营活动留下的记录,这些记录通过ID系统或其他手段积累的,并不是专门为分析而设计的。从术语的角度来讲,企业要真正应用数据,通常要从供给端和消费端两端来做。

消费端是一个牵引,财务就是一个非常通用的场景。业财一体化已经提了很多年,在当前经济低迷时期更加重要。评估经营活动的整个风险模型,已经是财务部门的工作。这要求生产制造过程中的数据要如实反映生产过程,需要从组织制度到IT的改变才能实现。

治理过程从消费端开始,包括现在的AI应用。AI是对数据挖掘范式的一个重大变化,它使过程更快、成本更低。我认为算力和算法可能很快就会达到瓶颈,未来的驱动力主要在于数据。如果数据质量高,即使模型很小很简单,也能提供很好的服务。

未来AI的变数都在数据上,主体也会回到企业或政府手中。掌握数据的一方,才是我们最大可挖掘的财富方。

我们也要从供给端努力。数据应用的链条比较长,生产数据的一方未必是用数据的一方。这就需要我们用数据治理的过程,把组织和流程连接起来,让数据信息在企业中平等地流通。大模型能够使知识平等,我们治理也希望使信息,数据所代表的信息能够平等。

这是我们从两个角度来解决大量数据存在却用不起来的问题。这是一个迭代的过程,当大家使用数据时,就会再去挖掘数据,使数据变得更好。这也是随着我们投入产出,整个社会大进程逐步改善的过程。

沈航:朱总提到了业财一体化,我们在财务数据中确实有大量未被充分利用的数据。高总和李总之前也提到了这一点。由于财务数据种类繁多,我们需要一种方法来整理这些数据,这样才能解读数据的本质。我们认为,在财务数据中,现金流数据是最重要却往往被忽视的部分。传统的财务处理侧重于税务,包括应收账款和应付账款,而现金流数据往往被搁置一旁。我们一直在努力掌握企业的所有经营和投融资行为。

企业之所以未能充分利用这些数据,部分原因是数据不完整。在过去,没有银企直联,需要花费大量资金铺设专线,导致现金流数据不全面。即使我们想要整合所有数据,也会遇到数据缺失或重复等问题。

我们首先要做的是利用技术手段,通过查缺补漏,确保覆盖企业每一个账户的每一笔交易,使财务数据变得完整。

其次,现金流数据中隐藏着许多宝贵信息。比如,银行交易类型、企业间的支付信息,这些都能提供企业的工商信息。通过摘要和备注,也可以了解流水信息。例如,如果一家企业的支付对象是携程,那么很可能是差旅费用。我们首先要清理数据,然后对数据进行标记,在此基础上进行聚类分析。这样,我们就能真正利用起企业中最重要的现金流数据,在许多方面发现标准财务方法可能忽视的资金风险和经营风险,或者帮助企业提高运营收益。

李吉平:朱总刚才的发言非常精彩,他从理论角度深入探讨了数据如何转化为信息,再从信息升华为知识,这一点非常重要。各位都是金融专家,我认为我们的数据类型相较于大家来说比较特殊,我们的大数据属于对地观测的大数据。以我们上线的“海南雷达信息知识产品一张图”产品为例,该产品能够对省内电力设施、水利设施、能源设施、农业设施、房屋建筑、交通基础设施等进行形变风险监测,为相关精细化风险评估及隐患排查提供数据依据,具有调用方便、成本低、覆盖范围广、监测效率高等特点,各行各业的客户均可以较低的成本获得超值的对地观测服务,与传统业务模式的目标一致。

其次是关于AI的应用。AI在大数据的深入应用中扮演了至关重要的角色,我们在监测建筑物是否倾斜或变形时,根据实地踏勘及部分资料验证得出,有些房屋虽然外表看起来没问题,但实际上可能已达危房等级。因此,我们要引入更多的数据源,除了对地观测数据,还包括地形、水文、结构和年代等数据。

数据量的增加有助于推动我们研发更先进的AI模型。最初我们只能进行房屋的简单体检,现在我们可以通过AI模型对地物进行更深入的诊断,实现对数据进行价值分类和体制机制上的协调,提升了服务的价值。这既是数据深入挖掘的方向,尤其是对对地观测的空间数据的深入挖掘,同时也是未来的发展方向。

李国平:这几年在百望云的数据应用探索中,发现政府手中有大量沉睡的数据,这些数据未来可以作为公共数据或数据基础设施,甚至可以作为推动中国数字经济高速发展的基础设施,为广大企业和消费者服务。而像我们这样的数商属性企业,可以在此基础上进一步提升数据的价值。

高林东:外部第三方的宏观数据如何解析和支撑企业发展,这个未来是我们探索的方向。

林会杰:最近,Scale AI年化收入已经到10亿美金,凸显了人工智能在数据生产发挥的巨大价值。请各位嘉宾简短分享一下,人工智能在数据要素过程当中,起到什么作用。

朱金宝:我认为,AI实际上正在塑造一种新的生产力模式。我们从信息、数据到知识的挖掘过程,正在经历一场范式的转变。这场转变不仅影响了社会伦理,也深刻改变了企业内部的运作方式。我观察到,AI已经从知识的共享,逐步发展到多模态的赋能生产力。

目前,以大型模型为代表的AI技术仍在成熟过程中,社会各界对此也表现出了浓厚的兴趣。然而,我们不应该只关注大型模型。许多企业在基础数据能力方面还相当薄弱。在这方面,我们可以采取双向策略:一方面,我们可以追求更高层次的发展;另一方面,我们也应该加强基础建设,以弥补不足。

因为未来的模型最终会沉淀到私域,融入企业自身的知识环境中,为企业的管理、业务生产等各个方面提供支持。我们需要保护好自己的数据,进行良好的治理,以迎接大模型时代真正到来的时刻。

沈航:我认为,AI最后产出的质量的关键,在于数据的质量,所以我们一直在帮助企业把数据清理好。第二点,我们也有一些比较简单的免费方式,给企业们快速做一个体检,通过现金流保障,帮大家捕捉到企业中的一些经营行为,优化经营。

李国平:数据是数字经济时代的生产资料,是原油,AI是发动机,到底加92号还是加95号,这一选择决定人工智能的质量,还有数据的治理和规范以及价值利用。

高林东:我们已经和税务领域几家公司在合作做税务大数据,在算税时,使用AI算税的偏差很大。我们目前尝试在税务法规咨询领域,通过训练AI来代替人工,做一些税务法规的规则解释。

林会杰:在数据要素领域结合人工智能,有很多的结合点与数据应用潜力,感谢各位专家的真知灼见。

反馈
联系我们
推荐订阅