【解析微软】所:提出的人与智能体沟通中!!的挑战

2025-07-27 03:03:04      来源:求是网

微软在最新研究中提出了一系列关于人机交互的核心挑战:我们该如何理解AI的意图?如何建立信任?又如何在不对称的信息结构中实现高效协作?本文将深入解析这些挑战背后的技术与认知逻辑,带你重新审视“对话式AI”时代的人机关系边界。

当前的智能体已不再是简单的聊天机器人,而是能够观察环境、调用工具,并与其他智能体沟通以解决问题的复杂系统,这种进化使其在广泛任务中展现出巨大潜力。

然而,这种能力的跃升并非没有代价。正如微软研究院在发布的论文《人与智能体沟通中的挑战》中指出的那样,它们的复杂性和广泛的失败模式给人类与AI的交互带来了新的挑战。

本文将清晰易懂地剖析人与智能体沟通中的12个关键挑战。

沟通的“雷区地图”

在《人与智能体沟通中的挑战》中,微软的研究者们形象地绘制了一幅人与智能体沟通时可能遭遇的“雷区地图”。

该框架借鉴了沟通理论中的“共同基础”概念,将12个挑战归纳为三大类:

1.普适性的人与智能体沟通难题(X1-X4):贯穿人与智能体交互始终的沟通障碍,具有普遍性。

2.用户向智能体传递信息(U1-U3):核心在于如何确保AI准确无误地理解用户的意图和需求。

3.智能体向用户传递信息(A1-A5):核心在于AI如何清晰、有效地将自身状态、行为和结果传达给用户。同时,这些挑战还分布在沟通交互过程的“之前”、“之中”和“之后”三个不同阶段。

我们在下表中详细列出了12个关键挑战:

那接下来,对这些挑战进行深入的分类探讨。

12大挑战解析

普适性难题(X1-X4):AI交互中挥之不去的“幽灵”

这些挑战普遍存在于各类人与智能体的沟通场景中,是设计任何AI交互系统时都需要面对的基础性问题。它们共同构成了建立用户信任、确保交互透明以及实现有效控制的基础。

X1:智能体应如何帮助用户验证其行为?

核心问题:智能体在处理复杂任务时,出现失误在所难免。因此,用户需要有效的方法来确认智能体是否准确理解了指令,以及智能体正在执行或计划执行的动作是否真正符合其预期。

X2:智能体应如何传达一致的行为?

核心问题:AI行为的不一致性(或用户感知到的不一致性)会逐步侵蚀用户的信任度。这种不一致可能源于AI与环境或其他智能体交互所产生的复杂动态,或是AI的行为模式与用户的心智模型不相符等。

X3:智能体应如何选择合适的细节详略程度?

核心问题:如何在确保用户能够验证智能体行为、避免混淆与防止因信息过多导致用户认知负担之间寻求微妙的平衡。

X4:智能体在沟通时应考虑哪些过去的交互?

核心问题:智能体如何有效利用丰富的历史交互数据,来优化当前的沟通。确保智能体能够精准聚焦于与当前指令最相关的部分,同时有效地管理可能包含敏感内容的数据并保护隐私,是日益严峻的挑战。

这些普适性挑战共同指向了人机交互中“信任-透明-控制”这一核心三角关系。

我们需要告诉AI什么(U1-U3):让AI听懂我们的“心声”

这类挑战主要关注用户如何才能有效地向智能体传递其意图、偏好和反馈等关键信息。

U1:智能体应该实现什么目标?

核心问题:用户需要清晰、无歧义地向AI表达他们的目标和意图。自然语言的模糊性和不精确性容易导致AI产生误解,从而对目标的理解出现偏差。这凸显了在人将意图传递给AI的过程中存在的“语义鸿沟”——人的意图往往是微妙、隐含且依赖上下文的,而AI的理解则可能更为字面和受限。

U2:智能体应该尊重哪些偏好?

核心问题:对于同一个高级目标,通常存在多种可行的实现路径或解决方案。然而,基于用户的个性化偏好、特定约束或“红线”,某些方案会明显更符合用户预期。因此,挑战的核心在于,用户如何才能清晰、便捷地表达这些偏好,特别是那些与常规的规范或默认设置有所不同的个性化需求。

U3:智能体下次应该如何改进?

核心问题:即便AI初步理解了用户的目标和偏好,它在执行过程中仍有可能犯错或表现不佳。因此,用户如何能够有效地提供反馈,以引导AI的行为,帮助其从错误中学习并持续改进未来的表现,就显得至关重要。人机交互不仅是一次性的指令下达,更是一个持续的、迭代的反馈与学习过程。

AI告诉我们什么(A1-A5):揭开AI的“内心”与行动面纱

A1:智能体能做什么?

核心问题:如果用户不能充分了解智能体的具体能力范围或其固有的局限性,他们就无法就何时以及如何最有效地利用其协助做出明智的决策,也无法在使用时建立合理的预期。

A2:智能体将要做什么?

核心问题:为了达成某个复杂目标,AI可能会自主规划并分步执行大量且耗时的动作。在执行这些动作之前,特别是那些具有不可逆性、可能违反用户偏好或涉及较高风险的动作,AI应如何以及何时向用户清晰地沟通其行动计划,以获取用户的许可或修正反馈。

A3:智能体当前正在做什么?

核心问题:当AI处于行动过程中时,用户如何能够实时理解它当前正在执行的具体操作,这些操作会产生什么即时影响,以及用户是否应该在必要时介入以调整或中止其活动。该挑战与A2的关键区别在于沟通的时间点:A2关注行动前的计划沟通,而A3关注行动执行过程中的状态同步。

A4:是否产生了任何副作用或环境变化?

核心问题:用户如何能够有效监控AI对其所操作环境(例如本地磁盘文件、操作系统设置等)所做的关键更改,特别是那些可能带来负面影响或违反社会规范的更改。随着智能体对外部环境影响能力的增强,AI不仅要完成任务,还需要对其行为后果负责,并主动向用户报告这些影响。

A5:目标是否已达成?

核心问题:当用户向AI指定一个高级别的、可能较为抽象的目标,AI通过执行一系列复杂的计划来尝试达成该目标后,系统需要向用户有效传达相关信息,使得用户能够依据自己的标准和判断依据来验证目标是否已圆满完成。

挑战的总结

审视这12个挑战,可以清晰地发现它们并非孤立存在,而是相互交织、彼此影响。这种内在的复杂联系意味着,试图解决这些挑战的方案往往需要具备整体性和系统性的考量。

更进一步看,虽然许多挑战在传统的人机交互(HCI)和AI研究领域早已被关注和提及,但生成式AI和工具型智能体的兴起,无疑放大了这些挑战的严峻性和复杂性。这些模型的“黑箱”特性、输出结果的内在随机性以及其所具备的广泛能力范围,使得实现运作过程的透明化和进行有效的双向沟通变得尤为困难。

当问题的规模和性质发生了根本性的转变,原有HCI体系下的一些设计原则和解决方案可能已无法完全应对当前的需求,迫切需要新的设计模式和交互原则,而这也正是我们HAI(Human-AgentInteraction)所探究的核心议题。

预告

面对上述挑战,微软研究院并未止步于理论分析,而是着手构建了一个实验平台,为在真实环境中深入研究上述的12个关键挑战提供了具体的载体和试验田。

那下一篇,我们来看看微软是如何尝试解题的。

参考文献

GaganBansal,JenniferWortmanVaughan,SaleemaAmershi,EricHorvitz,AdamFourney,HusseinMozannar1,VictorDibia,andDanielS.Weld.“ChallengesinHuman-AgentCommunication”(2024)

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

  新疆机场集团总经理吕辉斌表示,国泰航空开通乌鲁木齐至香港航线,标志着乌鲁木齐天山国际机场的航线网络又一次升级,满足了新疆及周边地区旅客日益增长的出行需求,不仅提升了乌鲁木齐机场的国际化水平,也将进一步增强新疆的区位优势和影响力,共同助力打造乌鲁木齐成为连接亚欧区域门户复合型国际航空枢纽目标。

责编:利尔烟编辑

婚检查出重大疾病医院仅告知本人

  进一步改进工作作风,严格要求自己,求真务实,真抓实干,坚持以人民为中心的创作导向,强化“国家队”意识,努力以优秀作品向着艺术“高峰”不断攀登。

张真源撕名牌拼到最后一刻

  今年36岁的李樟煜,已经在残疾人自行车项目征战多年。2012年伦敦残奥会,他第一次实现了残奥冠军梦。接下来,从里约到东京,再到巴黎,他带着梦想破风前行,每届残奥会都有金牌入账。据介绍,李樟煜获得的各类国际赛事奖牌已有50多枚。

习近平主席中亚之行高光时刻

  据携程数据,今年以来,澳大利亚位列中国入境游第5大客源国,入境旅游订单同比增长155%,澳大利亚到中国的航班数量同比增幅超过220%。澳大利亚游客来中国的热门目的地包括上海、广州、北京、成都、深圳、杭州、重庆、厦门、南京和西安。在即将到来的暑假,澳大利亚-中国的机票均价较去年同期降低近三成。

如愿

  2023年7月,中共中央总书记、国家主席、中央军委主席习近平在四川考察时指出,四川要发挥高校和科研机构众多、创新人才集聚的优势和产业体系较为完善、产业基础雄厚的优势,在科技创新和科技成果转化上同时发力。

歌手投票

  根据美国CNBC网站梳理的数据,通用汽车及其合资公司在华市场份额从2015年的15%左右降至去年的8.6%,中国市场盈利占通用汽车全部盈利的比例也有所下降。2022年,斯特兰蒂斯集团表示只在中国地区保留其旗下Jeep品牌的进口业务。

以色列开始哭哭啼啼

  据四川省政府官网介绍,四川是国家系统推进全面创新改革试验的八个区域之一,拥有中国(四川)自由贸易试验区、成都国家自主创新示范区、天府新区、绵阳科技城、攀西战略性资源创新开发试验区等多个重大区域创新平台。/p>

黄种人

  十二届四川省委科技委员会第一次会议,有多个重要议题,包括“学习中央科技委员会有关会议精神”“审议《省委科技委员会工作规则》等文件”。/p>

习近平会见新西兰总理拉克森

  以西安咸阳机场为例,扩建后拥有4座航站楼,航站楼面积高居国内前5。但西安咸阳机场去年旅客吞吐量排在全国第11位,西安去年GDP仅排在全国第21位。