©️深响原创 · 作者|何文
在争辩中,在实践中,大模型于国内的发展趋势渐渐清晰。
相比几个月前的“狂热”,大模型入局者开始变得冷静,落地产业已成共识。而在市场端,来自零售、金融、制造、政务等领域的客户也表现出了蓬勃且明确的需求,大模型被各界视为智能化升级的关键抓手。
此情此景下,基于供给侧大模型持续迭代,大模型应用侧正在迎来快速发展。客户也逐渐找到务实的应用之道,出于成本和具体场景的考虑,企业对大模型的应用往往是“多线并行”,有主力模型也有协助模型。这意味着行业需要千亿参数的通用大模型,也需要百亿、十亿参数的模型。
这些趋势共同说明的问题是:大模型要渗透到千行百业,需要有更多的模型提供方和需求方,需要一个繁荣的生态。
这样的生态必然是多方努力的结果。而就在趋势逐渐明晰的时候,火山引擎迈出了新的一步。
火山方舟,搭台做服务
6月28日,在2023火山引擎V-Tech体验创新科技峰会上,火山引擎发布了大模型服务平台“火山方舟”。这是一个连接着大模型供给方和需求方的服务平台。
你可以把它理解为集合多家旗舰店的商城,客户可以在上面接触优质的大模型,并基于火山方舟的功能,低门槛地应用大模型。目前,MiniMax、智谱AI、复旦MOSS、百川智能、IDEA、澜舟科技、出门问问等企业旗下的大模型已经“登陆”火山方舟。根据火山引擎方面的披露,火山方舟的首批邀测企业包括了金融、汽车、消费等众多行业的客户。
火山引擎总裁谭待介绍“火山方舟”首批大模型合作伙伴
具体而言,火山方舟的重点功能分为模型广场、模型精调、模型评测、模型推理、应用插件和运营干预工具。每项功能都有它的针对性。
例如,供应方可以在模型广场上进行模型的创建、上传、部署,需求方则能看到模型效果并快捷体验。熟悉大模型的人都会知道,要在实际场景里应用大模型,基于自家数据的训练和精调必不可少。火山方舟的模型精调简化了这个步骤,客户只需选择模型并上传标注数据集即可完成精调。此外,客户也将在这个过程中建设和积累自己的精调数据集,形成自己宝贵的数据资产。
其他功能指向的同样是大模型使用方的痛点。以模型评测为例,市面上有那么多模型,客户会希望在购买服务前先做测评。简而言之,火山方舟希望为大模型供需双方“搭好台”,让双方能更专注地“做好自己的事”,更高效地触及彼此。
火山引擎智能算法负责人吴迪介绍“安全互信计算”
为此,火山方舟上投入了自身的所有优势和资源,比如充沛的算力、高速训练模型、安全互信机制。为了推动企业搭上大模型快车,火山方舟还在“搭台”的同时,为企业提供更多服务支持。峰会上,北京银行CIO龚伟华表示,北京银行将与火山方舟合作,在算力优化、模型精调等方面展开研究,共同推动金融风控、营销等模型应用落地。
无论是对于模型供给方,还是需求方,火山方舟都是一个标准的“服务平台”。这一定位相当特别,你很难用一个简单的“支持方”或是“撮合者”来描述火山方舟。
该如何理解火山方舟的定位?一切都要回到一个最基本的问题:当前的大模型市场,到底需要什么?
在有需要的地方,做擅长的事
在如何布局大模型的问题上,目前许多公司都给出了答案。他们发布了自研大模型,发布了基于自身模型打造的模型平台,强调的是“来接入我们的模型”。相比之下,火山引擎似乎没有想当“主角”的意思。
一方面,这次发布的火山方舟是完全开放的,来自外部的优质大模型都能登陆平台,企业客户可以根据实际需要自由选择模型。另一方面,火山方舟也不仅仅是卖算力或提供技术底座,它还深入到了和模型提供方、企业客户的合作中,帮着模型提供方降低训练和推理的成本,帮着企业去做应用落地。
这些相对“低姿态”的动作,是火山引擎基于对行业的判断做出的。在今年4月的“FORCE原动力”大会上,火山引擎总裁谭待表示,企业使用多家云服务已成常态,同时各行业也都拥有自己的私有训练语料,大模型会在千行百业中生长,并形成多模型共生甚至协作的生态。“未来将是‘多云多模型’的时代。”
有了对行业的判断,火山引擎接下来做的是深入市场,了解趋势中的企业需要什么。在峰会后的交流中,谭待表示,模型厂商的需求主要是“尽快把自己的大参数模型训练出来”,企业关心的则是如何把大模型应用在具体的营销、客服场景中,以及如何处理好成本和安全的问题。
火山引擎在其中找到了发挥自身价值的空间——模型厂商担心算力和工程稳定性,火山引擎就提供技术支持;大模型要真正应用,安全信任和推理成本问题必须解决,火山方舟就实现了安全互信计算,并通过模型精调支持、训推一体和公有云的弹性,帮助厂商降低成本,助力市场上大模型的“百花齐放”。
“百花齐放”是市场的明确需求。模型应用侧的企业是极度务实的,他们看重的是效果好不好,成本高不高。一个强大的通用大模型固然很好,但在某些具体场景会显得“大材小用”,且在财务上也不划算。因此,千亿、百亿、十亿参数的模型都有市场价值。
谭待打了个比方:通用大模型好比工资高的博士,但不少应用场景只是“小学数学题”水平,用付给博士的价格去解小学题显然是不合理的。因此不少企业会选择精调后的中小模型,在获得媲美大模型效果的同时,降低推理成本。
但这会带来另一个问题,要同时应用多个模型,还要在这些模型上做精调,一是得有足够多模型可以选,二是要有足够丰富便捷的工具可以用。所以你会发现,火山方舟的每个功能都是从实际的供需痛点延伸出来的。它更多地聚焦在市场需求上,做自己擅长的事,推动大模型在千行百业的渗透。
一个好的技术创新一定是普适的、普惠的。它不是只为解决“大问题”的重器,也不是只有少数人买得起的昂贵方案。“多云多模型”生态是大模型普适、普惠的一种可能性,而火山引擎正在做的,是让这种可能性来得更快,更有持续性。
持续性指的是,大模型技术会不断迭代,企业需求也在变化,行业需要一个让供需两端稳定对接,并随着时代发展不断变化的“统一的工作流”。这也是火山方舟试图实现的,基于火山方舟,模型将应用于场景,场景数据又将反哺模型。这样的“模型-场景”数据闭环对供需两端都有价值,也是大模型新可能性的来源。
基于“火山方舟”,抖音集团内部已有十多个业务团队在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面进行探索。与此同时,来自不同行业的客户也在积极探索大模型落地的方式。
随着各方实践持续进行,关于大模型的着眼点和着手点都将变得更丰富。一个丰富的大模型生态正在被构建,而这需要不同层别、不同环节的从业者的共同努力。没有谁能靠一己之力做完所有的事。从火山方舟的一系列功能和发力点来看,火山引擎在知行合一的路又进了一步。