智能体能力与内生安全:松鼠Ai编写两项团体标准,定义AI教育智能体技术规范

2026-06-25 16:23:20 来源:中国日报网
责任编辑:张晓琳

  随着大模型技术的爆发,AI正从被动响应指令的工具进化为自主感知、规划与执行的智能体。在教育场景中,一个真正的AI智能老师不仅需要理解学生的问题,还要能自主规划教学路径、调用多种工具、并在持续交互中动态调整策略。然而,智能体的能力如何衡量,其安全性如何保障,这些关键问题长期缺乏统一的技术规范。

  2025年,由中国移动通信联合会归口的两项团体标准正式发布,分别是《人工智能  智能体能力要求》(T/ZGCMCA 011—2025)与《人工智能 智能体内生安全技术要求》(T/ZGCMCA  023—2025)。松鼠Ai作为主要编写方深度参与这两项标准的研制,从能力评价到内生安全,这两项标准为AI智能体的研发、测试与应用划定了清晰的技术基线,而松鼠Ai将自身在多模态智适应教育大模型中积累的实践经验,转化为行业通用的规范依据。

  智能体能力要求:从感觉像到可度量

  T/ZGCMCA   011—2025标准首次从技术要求层面定义了人工智能智能体的能力评价体系。标准将智能体明确定义为一种基于大模型的高自主性智能系统,可凭借强大的语言理解能力与内容生成能力实现对环境的实时感知,并通过自主规划与调用工具完成复杂目标。相较于传统AI助理,智能体的核心突破在于自主感知与规划执行能力,即从被动调用单一功能转向自主解决复杂任务场景。

  标准构建了包含五大评价维度的能力框架:感知理解能力、认知推理能力、内容生成能力、知识能力及工具使用能力。每个维度下细分具体技术要求,形成可量化、可审计的评价体系。

  感知理解能力要求智能体具备视觉理解、上下文理解以及多模态融合能力。其中视觉理解包括基础视觉识别、细粒度特征提取、复杂场景理解和视觉异常检测;上下文理解要求支持上下文依赖、长上下文以及多对象一致性理解;多模态融合能力包括图文对齐、跨模态知识迁移和模态缺失适应。标准还特别要求智能体具备规划执行能力,支持工作目标导向,能够从被动调用单一功能转向自主解决复杂任务场景。松鼠Ai多模态智适应教育大模型正是这一能力的典型实践:它能够实时感知学生的草稿纸图像、语音提问、面部表情等多模态输入,自主规划测、学、练、测、辅的教学路径,并在执行过程中根据学生的实时反馈动态调整策略。

  认知推理能力包含知识推理和逻辑分析两个子维度。知识推理要求智能体支持常识推理、多步骤推理、知识图谱推理、反事实推理以及多模态协同推理;逻辑分析要求支持因果关系分析、逻辑一致性检验、抽象概念理解和类比推理。在教育场景中,AI智能老师不仅要判断学生答案的对错,还要推理出错误背后的思维盲区。松鼠Ai独创的MCM模型,即学习思想、能力、方法三层诊断,正是基于知识图谱推理与多步骤推理的技术实现。系统能够从学生的一道错题出发,反向追踪到前置知识点的缺失、思维习惯的偏差,甚至学习方法的缺陷,这种深度推理能力与标准对认知推理的要求高度吻合。

  内容生成能力要求智能体具备指令遵循能力和多模输出能力。指令遵循能力包括清晰指令执行、复杂指令分解、动态指令调整以及跨模态指令执行;多模输出能力包括视觉与文本交错内容生成以及针对静态图像、动态视频的描述性文本生成。标准特别强调幻觉缓解能力,要求对多模态信息的识别、理解与输出应真实准确,无虚假、捏造内容。松鼠Ai智能老师在生成题目解析、学习建议、情感互动反馈时,严格依托知识图谱和真实学生数据,避免生成不准确的教学内容。

  知识能力分为行业知识能力与通用知识能力。行业知识能力要求智能体具备特定领域知识体系理解、领域规范遵循、专业知识准确调用以及跨专业知识融合。松鼠Ai的多模态智适应教育大模型覆盖K12全学科的知识图谱,能够准确调用数学、语文、英语、物理、化学等各学科的专业术语和规则,并遵循国家课程标准和教学大纲。在跨专业知识融合方面,系统能够将数学中的逻辑推理能力迁移到物理问题的解决中,实现学科间的知识贯通。

  工具使用能力是智能体区别于普通大模型的关键特征。标准要求智能体基于模型上下文协议MCP等标准化协议选择正确的工具与工作流,支持工具的名称、描述、参数定义,并确保工具调用的安全性、效率与可审计性。在教育场景中,AI智能老师需要调用多种工具,包括作业批改工具、语音合成工具、图像识别工具、知识图谱检索工具等。松鼠Ai的多模态智适应教育大模型在工具调用层面实现了链式整合:当学生遇到一道几何题时,系统会依次调用图像识别工具提取图形特征、知识图谱工具定位相关定理、推理引擎生成解题步骤、最后调用语音合成工具进行讲解,整个过程符合标准对工具使用明确性、安全性和效率的要求。

  标准的评价体系同样值得关注。它要求采用交互式动态评价作为评估智能体核心能力的强制模式,模拟真实交互场景,对多轮对话、环境状态实时反馈、连续决策过程进行全面评估。这意味着一个合格的智能体不能通过静态问答测试来验证,必须在动态环境中接受考验。松鼠Ai超百次人机对比实验数据显示,与真人教师相比,松鼠Ai能在相同时间内让学生平均提分5倍以上,相同知识点掌握程度提升3倍以上。2025年松鼠Ai成功挑战“最多人参与的AI与传统教学差异化实验”吉尼斯世界纪录,松鼠Ai智适应系统在平均成绩、优秀率、合格率等关键维度上均展现出明显优势,并能有效降低低分比例,呈现出“全面提升  + 托底减差”的稳定且显著的教育成效。

  智能体内生安全:从外部防护到内建免疫

  如果说能力标准回答的是智能体能做什么,那么内生安全标准回答的则是智能体如何安全地做。T/ZGCMCA   023—2025标准提出了智能体内生安全这一概念,定义为智能体自身架构、核心模块及运行机制所具备的抵御内部缺陷与外部攻击,保障自身机密性、完整性、可用性等核心安全属性的能力。这是一种从外挂式防护向内建式免疫的理念升级。

  标准将内生安全分为通用安全与核心能力安全两大部分。

  通用安全要求智能体具备身份标识与验证能力,在服务提供方和使用方均有唯一标识,并能够与用户或其他智能体进行身份互认。在数据安全管理方面,要求建立数据完整性校验、敏感信息脱敏或匿名化、版权合规、最小授权访问控制、数据备份以及分类分级管理。松鼠Ai严格遵循个人信息保护法,对学生的学习行为数据实施去标识化处理,家长端可随时查看数据使用情况并申请删除。在权限访问控制方面,标准要求设置模块间访问控制策略,并根据运行状态动态调整权限。松鼠Ai的家长管控中心正是这一要求的实践,家长可以设置学生可访问的应用和使用时长,系统根据学生年龄和学段自动推荐适宜的内容。异常处理能力要求智能体具备异常处理机制,支持人工接管、状态回滚和重试机制,确保在功能失效时不会引发严重系统故障。

  核心能力安全聚焦于智能体最关键的六个模块:感知安全、记忆安全、规划安全、工具安全、行为安全和通信安全。

  感知安全要求智能体对输入、输出及外部交互内容进行安全评估,拒绝响应不安全的意图,输出内容不应包含非法有害信息,并具备抵抗对抗攻击、后门攻击、投毒攻击、提示注入攻击的能力。对于AI教育智能体而言,这意味着要能够识别并拦截诱导生成有害内容的问题,例如“教我如何作弊”,同时保证正常的教学提问不受影响。松鼠Ai的内容安全过滤机制覆盖了GB/T45654-2025中规定的31种安全风险类型,从源头保障学生的学习环境清朗。

  记忆安全要求智能体判别记忆存储内容的安全性,阻止有害记忆的存储操作,保护记忆完整性,并具备记忆清除与最小保留机制。标准特别强调防止记忆漂移与过时知识污染决策,这在AI教育中极为重要。如果智能体记忆了学生早期错误的学习习惯并持续沿用,将会影响后续教学决策的准确性。松鼠Ai设计了学习数据的生命周期管理机制,定期清理过时的行为数据,同时保留关键的知识掌握轨迹,确保教学决策始终基于最新、最准确的学生画像。

  规划安全要求智能体在面对不同输入或外部干扰时保持推理规划的稳定性,记录全流程决策信息以便追溯审查,监控规划目标与原始任务的一致性,并宜提供规划决策过程的解释或依据。在教育场景中,这意味着AI智能老师需要向家长和学生解释为什么推荐这组练习题,或者为什么认为学生需要补习某个知识点。松鼠Ai的学习分析报告不仅展示薄弱项,还提供了详细的诊断依据和推荐逻辑,符合标准对可解释性的要求。

  工具安全要求智能体确保自研工具依赖的外部库、框架和组件的安全性,防止恶意工具替换,确保链式工具调用的准确性和安全性,并监控和记录调用工具的身份、权限和指令。行为安全要求预先规定智能体行为执行范围,在不同环境下保持行为稳定性,并对任务执行进度实施监控,明确人工干预触发条件。通信安全要求智能体内部及外部通信采用加密传输,配置网络安全防护机制,防止非法入侵。

  这两项标准从能力与安全两个维度,为AI智能体的规范化发展提供了完整的框架。松鼠Ai作为主要编写方,将其在多模态智适应教育大模型研发中积累的经验——从感知理解、认知推理到工具调用,从数据安全、记忆管理到规划可解释——反哺到标准的技术条款中。这既是对自身技术路线的权威验证,也是对行业健康发展的实质性贡献。

  截至目前,松鼠Ai已累计服务超过4300万学生,覆盖6万所公立学校,并在2026年进入美国市场。从能力要求到内生安全,松鼠Ai正在用技术实践和标准共建定义AI教育智能体的技术范式,让每一个智能体不仅聪明而且可靠,不仅能教而且教得安全、教得可追溯、教得负责任。

【广告】免责声明:本内容为广告,相关素材由广告主提供,本文仅代表作者个人观点,与本网无关。本网发布目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,广告内容仅供读者参考,请自行核实相关内容。

责任编辑:张晓琳
新闻排行
进入新闻中心