谷歌的新“Vantage”平台利用人工智能头像测试批判性思维、协作和实际技能

简要介绍

谷歌推出 Vantage AI 系统,用于开发和评估未来人类技能,包括批判性思维、协作、创造力、冲突解决以及项目管理,随着 AI 的不断进步而发展。

Google’s New ‘Vantage’ Platform Uses AI Avatars To Test Critical Thinking, Collaboration, And Real-World Skills科技公司谷歌推出了一套旨在培养未来人类技能的 AI 系统。随着 AI 持续演进,所谓“耐用软技能”——那些难以自动化的能力——正变得愈发有价值。这些包括批判性思维、协作、创造性思维、冲突解决、项目管理以及其他人际交往能力

该项目以“Vantage”为名,是一个由 AI 驱动的实验性系统,旨在通过模拟互动环境来支持这些能力的培养与评估。该倡议在教育学方法专家与研究人员的协作下开发,其中包括来自纽约大学的贡献者。其目标是为学生提供一个结构化的沙盒,让他们通过类似应用于数学或科学等核心学科的方法,练习并评估面向未来的技能。该系统目前可通过 Google Labs 以英文形式使用。

该流程通过将用户置于模拟的多智能体环境来实现:用户在开放式场景中与由 AI 生成的虚拟形象互动,例如辩论、协作式问题解决任务,或项目规划练习。在该设置中,协调用的“Executive LLM(执行型 LLM)”会使用预先定义的评估框架来引导互动,并动态调整对话条件。这包括引入分歧、挑战假设,或引导对话方向,以生成与目标技能相关的可观察行为证据。

基于模拟的 AI 框架,用于评估面向未来的技能

与此同时,另一个 AI 评估模型会在任务完成后分析完整的互动过程。它使用相同的结构化评分量表,评估对话记录,并生成详尽的表现画像,将观察到的行为映射到特定的技能类别。输出内容既包括定量评分,也包括定性反馈,把复杂的人际互动转化为结构化、可衡量的技能表现指标。

为确保方法论的可靠性,该系统已与纽约大学合作进行测试,采用包含 188 名参与者(年龄为 18 至 25 岁)的受控研究。此次评估聚焦于与协作相关的能力,例如冲突解决和项目协调。结果显示,与非定向互动模型相比,由自适应 AI 驱动的对话引导能够产生更高密度的可评估技能证据,同时在多个任务中维持连贯且自然的对话流程。

进一步的测试将 AI 生成的评分与人类专家评估进行对比,且使用相同的教学评估量表。结果表明,AI 评估器与人类评分者之间的一致性水平与人与人之间的一致性相当。这意味着,在结构化的评估情境中,自动化系统能够近似专家级的稳定性。

与包括 OpenMic 在内的外部合作伙伴进一步验证后,测试扩展到创意与语言类任务,涵盖多媒体以及基于文学的练习。在这些情况下,AI 生成的评估与专家的人类评分表现出较强的相关性,进一步强化了该系统在超越结构化团队协作情境后,应用到更开放的创意领域的潜在可能性。

此类基于模拟的系统,未来不久有望作为传统评估方法之外的额外评估层,融入教育环境。这将使学生不仅在学科知识方面受到评估,也能在受控的模拟场景中评估其人际交往与认知技能。该研究更广泛的目标,是在规模化层面让面向未来的能力更易衡量,并使教育评估与不断演变的劳动力需求实现更紧密的匹配。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论