编者按:本文来自微信公众号 阿尔法公社(ID:alphastartups),作者:阿尔法公社,创业邦经授权转载
游戏是离钱非常近的行业,它是腾讯、网易等互联网巨头的现金牛,连做ToB的微软和搞科技的索尼也分别有Xbox和PlayStation的游戏业务。
在生成式AI如火如荼的今天,人们会问一个问题:生成式AI和游戏行业结合,会带来什么新的变化?在视觉方面发力当然是一个好方向,以至于很多人喊出游戏设计师和游戏原画师要大量失业。
也有不少人认为,在游戏中,有趣的剧情和互动体验比图形保真度的重要性更大,任天堂的不少游戏已经证明了这个观点。
Inworld是将AI能力注入游戏行业的创业公司,它专注在沉浸式游戏角色,它的角色引擎使用先进的AI构建智能NPC(Non-player characters),赋予NPC个性、思想、记忆和行动力,让它在游戏中能够更深度的与人类互动。
它已经与Unity、Unreal Engine、NetEase(网易)、GTA V、Roblox和Minecraft等头部的游戏引擎,游戏公司合作。
近日,Inworld获得了Lightspeed Venture Partners领投的5000万美元融资,它的投资人名单上还有斯坦福大学,Samsung Next、Microsoft的M12基金和Eric Schmidt的First Spark Ventures以及Meta、Disney Accelerator、Founders Fund、Kleiner Perkins等机构。它的累计融资额超过1亿美元,估值5亿美元,就像它的创始人所说,Inworld是AI x 游戏领域资金最充足的初创公司。
智能语音助手的先驱者切入游戏行业
Inworld由Ilya Gelfenbeyn(CEO)、Kylan Gibbs(CPO )和Michael Ermolenko(CTO )在2021年联合创立。
Ilya和Michael也是Speaktoit的联合创始人,他们在2010年开始创业,当时AI还处于早期,但是他们看到了移动互联网的爆炸增长和语音识别技术的成熟。
在这个趋势下,他们创立了Android平台的个人语音助手Speaktoit。Speaktoit成为Android Market上“助手”类排名第一的应用。当时,Speaktoit每天增加30000名用户,而苹果的Siri在他们推出产品后6个月才发布。不过,Siri背靠苹果,竞争力强大,所以他们转型为API.AI,为开发者服务,之后被Google收购。在被Google收购后,API.AI变成了Dialogflow AI,Dialogflow AI是一个AI工具,可以用来搭建ChatBot。
在离开Google后,Ilya Gelfenbeyn与合伙人们创立了Inworld。在Speaktoit(API.AI)的创业旅程中,Ilya Gelfenbeyn证明他们可以用功能性的助手来回答问题,而创建Inworld,他们想要解决的问题是:如何构建一个能吸引玩家进入游戏世界观的AI角色?如何让人们在虚拟世界具有和现实世界相似的互动和社交体验?随机的叙事如何改变玩家玩游戏的方式?
根据游戏行业的一份千人规模调查,99%的玩家认为高级AI NPC会对游戏玩法产生积极影响,78%的玩家会花更多时间玩游戏,而81%的玩家愿意为拥有高级AI NPC的游戏花更多钱。
借助Inworld,人们可以创建游戏NPC、虚拟网红、品牌代表和数字人类,这些虚拟人类可以与玩家/用户建立关系并解锁更深层次的互动。这是娱乐和营销的未来—虚拟角色被赋予更丰富的“内心活动”,这让玩家和用户的沉浸感提升到一个新的水平。
要实现AI NPC,Inworld的技术超越了单纯的大语言模型(LLM),他们通过协调多个机器学习模型来支持多模态的角色表达,这些模型能够模仿人类沟通的全部范围(包括不限于语言和动作)。
Lightspeed合伙人Moritz Baier-Lentz表示:“在像AI这样的平台转变中,生成式AI公司,不仅是通过更快、更好或更便宜的工具逐步改进现有的工作流程,而是会创造完全新颖的用户体验——就像Inworld做的一样。
在游戏和AI的交叉点上,Lightspeed基于上升空间、团队素质、产品速度和吸引力对200多个可投资机会进行排序——Inworld是非常突出的:当每个人都在围绕并寻求利用‘新世界秩序’时,Ilya、Kylan、Michael和团队独特地定位,抓住了一个超大的机会。”
用AI NPC颠覆游戏和营销
在游戏领域,玩家们达成共识:下一代游戏将根据体验的沉浸感进行评判。
而要提升沉浸感,需要提高人物角色之间的互动真实感。
Inworld认为游戏角色的智能化不仅应该包括对话AI,还应该是多模态的,他们通过协调多个机器学习模型来实现多模态表达,这些模型旨在模仿人类沟通的全部范围——包括非语言线索,如声音的抑扬顿挫、面部表情和身体语言。
Inworld NPC可以学习和适应,具有情感智慧地导航关系,具有记忆和回忆,并能够自主地设定目标、执行动作和遵循自己的动机。
为了构建这种强大的智能NPC,Inworld搭建了一个角色生成平台,包括两大部分,角色大脑和上下文网格。角色大脑使智能NPC拥有个性的多模态表达,上下文网格使智能NPC符合他们所在的“游戏世界”的内部逻辑,保持沉浸感。
角色大脑
角色大脑分为以下几个模块:
目标与行动
使用定义的触发器、意图识别和动机来触发角色对玩家行为的反应,并在游戏中驱动互动。
长期记忆
使AI NPC具有类似人类的长期记忆,让AI NPC可以通过记忆和回忆与人类玩家聊天,而传统NPC只有固定的对话内容。
个性
游戏设计者可以使用自然语言创建独特的个性,为AI NPC添加背景故事、动机和缺陷的丰富细节,使NPC栩栩如生。
Inworld通过协调30多个设计用来模仿人类通信全范围的机器学习模型,实现多模态角色表达,包括非语言线索,如声音抑扬和语调、面部表情和身体语言。
情感
Inworld的角色具有与用户互动时表达情感的能力。情感可以映射到动画、目标和触发器。
实时语音
游戏设计者使用Inworld内置的语音设置以实现最小的延迟,并配置角色的性别、年龄、音调和说话速度。或者,使用Eleven Labs的第三方服务来创建自定义和克隆的语音。
上下文网格
上下文网格的作用主要是增加AI虚拟角色的可控性和安全性。
可配置的安全性
根据游戏的类型和安全等级,配置AI NPC的说话方式,可以去除诸如暴力、成人话题、酒精、政治和宗教等话题。此功能目前只支持企业用户。
知识
输入“个人知识”来控制单个角色的知识范围。使用“共同知识”来定义多个角色所拥有的知识,如共享的传说、世界背景。
玩家资料
可以将玩家的个性化信息与AI NPC结合,让NPC可以直接使用这些信息与玩家进行具有真实感和个性化的互动。
关系
通过配置每个AI NPC的关系设置,让AI NPC可以与玩家建立关系,无论是朋友关系还是敌对关系。
第四面墙
如果对话不合理或涉及角色不应该拥有的知识,AI NPC的失常可能会损害沉浸感。第四面墙功能确保角色只从他们的世界中存在的知识中提取信息,从而创造更加沉浸式的叙事和游戏体验。此功能目前只支持企业用户。
开源与付费方式
Inworld与开发者社区具有良好的互动关系,他们已经将部分源代码在社区开放。他们希望借助生成式AI的力量提升整个游戏行业。
在付费模式上,Inworld分为免费版,专业版和企业版三种。
其中免费版已经具有200分钟的API集成时间,而专业版每月20美元,可以有2000分钟的API集成时间,无限制的角色创建,还有Discord的社区客服支持。
企业版的费用高到了每月5000美元,不再有API集成的限制时间,拥有开发支持和咨询,高级的安全功能和“第四面墙”控制,还能定制功能,知识库和模型性能。
在营销领域的应用
使用Inworld平台,除了可以将AI NPC用在游戏里以外,还可以用在营销领域。
例如企业的品牌吉祥物,数字代言人、数字销售助手等,都可以被赋予个性和“思想”,更高质量的与用户互动。
对于营销客户,他们可以定制安全功能,可以将品牌知识库添加到角色中,Inworld的“第四堵墙”功能也能确保角色按照剧本进行。
AI应用创业,技术能力与场景需求的有机结合
情感、社交、故事都属于人的本质需求,以往的科技产品用社交软件,兴趣社区,游戏,在线小说网站满足。
AI怎么去满足这些需求?对于大语言模型,它的文本生成能力可以让虚拟角色听得懂人话,也说得了“人话”,还能理解故事和“虚拟世界”的背景,它的交流可以是实时的,同时满足情感、社交、故事的需求。
对于视觉大模型,它可以让虚拟角色以及虚拟角色所在的世界变得更加“真实”,增添了沉浸感。
AI NPC其实就是一个将AI模型能力和具体需求场景很好结合的例子。而且它虽然创造了新的体验,但来源并不是“全新”和“凭空”的,而是将已经存在的场景和应用进行了改良。对于企业来说,这使它们更愿意付费,对于用户来说,这样更好理解和感知。
根据Inworld联合创始人Kylan Gibbs的思考,具有“智慧”的虚拟角色可以用在三个场景。
第一是元宇宙平台,例如Meta Horizon、Roblox。第二是3A游戏,例如GTA。第三是企业场景,可以包括品牌和培训等方向。
在中国,做游戏,做社交,做品牌的公司也很多,需求是持续的,怎么把AI的能力与这些场景需求很好的结合起来,无论对于科技巨头还是创业公司,都是需要解决的课题。
本文由阿尔法公社原创。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。