DeepMind让AI【当上帝】 导演一场只有AI演:员的西部!!世界

2025-07-22 00:24:49      来源:厦门网

剧本杀大家都玩过吗?这是一种经典的桌上角色扮演游戏(TTRPG),游戏中的核心人物是游戏主持人(GM),相当于整个世界的「导演+编剧+旁白」,负责掌控游戏环境,讲述故事背景,并扮演所有非玩家角色(NPC)。

现在,想象一下,如果我们用一个强大的生成式AI来担任这个GM的角色,同时,桌子旁的「玩家」也换成一群各具头脑的AI,这会创造出一个怎样的世界?

这能实现以下应用:

科学模拟:构建虚拟社会,用于社会科学研究,观察群体行为的涌现。

互动叙事:创建互动故事或游戏,AI智能体扮演角色,共同演绎剧情。

AI评估:设计特定场景作为「考场」,来测试和评估AI智能体的各项能力(如推理、协作、沟通)。

美剧《西部世界》,未来的西部主题虚拟世界里,所有角色均是AI。

然而,这三种需求(科学性、戏剧性、公平性)差异巨大,甚至相互冲突。如何用一个统一的框架来满足所有需求?

来自GoogleDeepMind和多伦多大学的研究人员从TTRPG和现代游戏引擎中获取灵感,提出了他们的解决方案:一个名为Concordia的软件库。

论文标题:Multi-ActorGenerativeArtificialIntelligenceasaGameEngine

论文地址:https://arxiv.org/abs/2507.08892

项目地址:https://github.com/google-deepmind/concordia

传统上,游戏环境的逻辑是写死的程序。这里的主张是,不应该用一个硬编码的程序来充当GM,而应该把GM本身也设计成一个可配置的、由AI驱动的智能体。

Concordia的设计精髓,源自现代游戏引擎的「实体-组件」(Entity-Component)架构。在这个架构里,无论是AI玩家还是AI游戏主持人(GM),都只是一个基础的「实体」容器。它们具体拥有什么能力(比如记忆、目标或社交规则)则由一个个可插拔的「组件」来决定。

这种方式巧妙地将「工程师」和「设计师」的角色分开:工程师负责创造功能强大的组件,而设计师则可以像搭乐高一样,自由组合这些组件来快速构建和测试各种复杂场景,整个过程几乎无需编写底层代码。

实体、组件、引擎和游戏设计

实体-组件架构模式作为现代游戏开发的基石,为构建多角色生成式AI系统提供了强大而灵活的基础。

该框架采用组合而非继承机制,实体不再受限于僵化的类结构,而是携带唯一标识符的轻量级独立对象。实体的行为与属性完全由挂载的组件决定(即:实体本质是带有名称的组件容器)。引擎通过调用observe、act等函数处理实体,这些函数由实体所挂载的组件具体实现。

组件通过结合Python代码与LLM调用来实现,这种方式能提供最大的灵活性与表现力。当设计师掌握特定功能的编码方法时,可以自主实现;与此同时,同一环境中的其他功能可以通过让GM叙事型LLM来完成。这两种实现方式通常共存于同一环境中——开发者既可以让GM根据LLM的自由发挥来创造内容,也可以严格限制其行为,使其完全遵循预设的硬编码规则,或采用介于二者之间的任何约束程度。

实体主要支持两种调用方式:observe和act。

调用observe时,会触发所有组件的preobserve和postobserve函数,对每个实体的观察数据进行处理。调用act时,每个组件会扮演上下文和行动两种角色之一。

在实际开发Concordia组件时,开发者通常需要实现preobserve、postobserve、preact和postact四类方法中的部分或全部。常见做法是仅实现观察类方法或行动类方法,同一组件中同时实现两类方法的情况较为罕见。这种组件化模块设计允许通过自由组合不同组件,快速创建功能各异的实体——这与传统面向对象编程形成鲜明对比:后者在创建行为略有差异的新角色类型时,往往会导致复杂脆弱的继承链结构。

对于生成式AI智能体而言,这种架构优势尤为显著。一个智能体的思维可由多个组件构成:存储过往经历的Memory组件、调用大语言模型生成目标的Planning组件,以及表征世界认知的Beliefs组件。同理,一个组织实体可由代表其部门、政策及内部沟通结构的组件组合而成。只需配置不同的组件组合,就能为不同智能体赋予差异化的认知架构。

这一架构模式的灵活性同样体现在Concordia框架中的GM系统上。GM本身也是一个实体,与玩家实体(角色)一样可通过组件进行定制。这种设计使得GM的职能和逻辑能够根据多智能体系统的具体需求灵活调整——无论是执行严格的评估协议、引导叙事发展,还是维护因果一致性。

此外,Concordia框架还通过多种游戏引擎模式支持不同的交互动态。

游戏/模拟设计目标的全景图分析

根据Edwards(他是桌游角色扮演游戏理论的重要人物)的定义,TTRPG可以分为:(1)游戏型(Gamist),GM需设计难度适中的挑战以维持乐趣。(2)叙事型(Narrativist),GM需灵活调整剧情以回应玩家的创作输入。(3)模拟型(Simulationist),玩家希望沉浸在一个逻辑自洽的虚拟世界中。

本文认为将使用多角色生成式AI的动机分为以下几种类型是有帮助的:(1)评估型(Evaluationist),对应Edwards理论中的游戏型;(2)戏剧型(Dramatist),对于Edwards理论中的叙事型;(3)模拟型(Simulationist),Edwards同名分类。

生成式AI还有一个第四种动机,那就是创建合成训练数据的目标。

评估型的观点

游戏型玩家通常会寻求公平的竞争机会,并希望通过战略胜利来取得优势,而评估型用户则将多角色系统视为评估和比较的框架。

对于评估型用户来说,主要目标非常明确:确定哪些AI系统在指定维度和上下文中表现更好。这需要提供一个公平的竞争环境,并具有明确的成功指标。

评估型系统通常具有以下特点:

标准化场景——精心校准的环境,在多个评估运行中呈现一致的挑战;

明确的成功指标——可量化的性能衡量标准,允许对不同方法进行明确的排名;

受控变异性——战略性地引入新元素,以评估泛化能力;

跨角色互动机制——评估智能体在与不同合作伙伴群体互动时的表现的方法。

戏剧型视角

与评估型用户不同,戏剧型(Dramatist)用户主要将多角色生成式AI系统视为叙事引擎。

对于具有戏剧型的目标用户来说,核心关注点不是基准测试性能,而是通过多个AI角色的互动生成引人入胜的叙事。

从设计师的角度来看,针对戏剧型目标构建的系统将优先考虑叙事一致性、情感共鸣和动态人物发展,而不是标准化的评估。

主要关注以下特点:

丰富的角色模型——具有详细个性、明确目标、价值观和关系的角色,通常通过组合多个组件来构建;

叙事驱动的环境——旨在引发戏剧性有趣互动的场景设置;

灵活的解决机制——优先考虑叙事满足感而非程序一致性的系统;

涌现的故事情节——允许在没有预定结果的情况下发展引人入胜的叙事轨迹的框架。

在接下来的章节中,论文还讨论了模拟型视角、合成数据等方面的研究,感兴趣的读者,可以参考原论文,了解更多内容。

  第三,新的台行政机构刚上路,即遇上立法机构改革风暴,尚无亮丽表现。再加上若干“部会”状况不少,屡成媒体议论焦点,如台内务主管部门、经济主管部门、“海委会”等。

责编:源忻欢编辑

伊朗导弹射程内有座美军基地

  针对目前的旱情,河南省水利厅于6月14日17时将水旱灾害防御(抗旱)Ⅳ级应急响应提升至Ⅲ级,并密切监视雨情、水情、旱情,科学精准调度水利工程,加强灌溉用水管理,细化落实各项供水保障措施,确保城乡居民饮水安全,最大程度减轻干旱灾害损失。

父母去世岁大哥一人供出个大学生

  美团数据也显示,7月以来,“网球”搜索量同比去年增长超60%。网球体验课、网球培训季度课包在平台热销,美团上网球运动相关团购订单量同比激增172%。

两地明确医生可告知艾滋病患者配偶

  体量不及西安的兰州,也拿出大手笔。T3航站楼面积40万平方米,综合交通中心27万平方米,是甘肃民航发展史上规模最大的工程。

伊朗导弹射程内有座美军基地

  李鹏新严重违反党的政治纪律、组织纪律、廉洁纪律和生活纪律,构成严重职务违法并涉嫌受贿犯罪,且在党的十八大后不收敛、不收手,性质严重,影响恶劣,应予严肃处理。依据《中国共产党纪律处分条例》《中华人民共和国监察法》《中华人民共和国公职人员政务处分法》等有关规定,经中央纪委常委会会议研究并报中共中央批准,决定给予李鹏新开除党籍处分;由国家监委给予其开除公职处分;收缴其违纪违法所得;将其涉嫌犯罪问题移送检察机关依法审查起诉,所涉财物一并移送。

唯一没有黑粉的明星

  美团数据也显示,7月以来,“网球”搜索量同比去年增长超60%。网球体验课、网球培训季度课包在平台热销,美团上网球运动相关团购订单量同比激增172%。

男子长期蹲坑玩手机肠子掉出

  笔者跟多位省级、市级税务人士交流得知,目前并没有全国性查税部署。一些地方根据当地税收大数据风险提示等对个别企业查税,是日常工作,也是税务部门正常履职。毕竟税务部门主要负责税收、社会保险费和有关非税收入的征收管理,发现偷逃税、少缴税行为,理应依法制止,否则就是渎职。/p>

张继科说没价值的原因找到了

  “要完善科技创新体系,积极对接国家战略科技力量和资源,优化完善创新资源布局,努力攻克一批关键核心技术,着力打造西部地区创新高地。”/p>

黄子韬这一刻不反驳已经赢了

  坚持因地制宜、科学抗旱,河库灌区及时开闸放水,增加流量,采取疏通渠道、维修涵闸等措施,做到远送多浇、有水可浇;引黄灌区根据抗旱需水情况,及时开闸放水,争取多引黄河水;平原灌区发挥机电井作用,采取有效措施保障机井通电,并组织投入各类排灌机械179.4万台,努力增加抗旱播种面积。丘陵岗区利用坑、塘、堰、坝等小型水利工程组织抗旱播种。夏播以来,全省累计抗旱浇水7977.3万亩次,播种进度与常年相当。