欢迎访问学兔兔标准下载网,学习、交流 分享 !
返回首页 |ICS 35.240 CCS L67
团 体 标 准
T/ISC 0102—2026
民航端侧大模型技术能力的技术要求
Technical Capability Requirements for On-Device Large Models in Civil Aviation
(发布稿)
2026 – 03 - 03 发布 2026 –04 - 03 实施
中 国 互 联 网 协 会 发 布
T/ISC 0102—2026
T/ISC 0102—2026
前 言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国互联网协会归口。
本文件起草单位:南航数智科技(广东)有限公司、中国信息通信研究院、浩鲸云计算科技股份有限公司、南京航空航天大学。
本文件主要起草人:黄伟键、吴东岳、王宁、宋佳明、张琳琳、吴佳兴、宋光通、吴宁、魏弘平、李满山、朱尔琴、钟观宝、 田志勇、李拴岗、杨龙、华天祥、姚宗宏、丁萌、许娟、蔡景。
引 言
随着《新时代新征程谱写交通强国建设民航新篇章行动纲要》《关于“人工智能+交通运输 ”的实施意见》等国家政策的深入推进,民航业数字化转型步伐加快。传统云端在线大模型在成本、实时性、服务连续性、隐私安全和个性化服务等方面存在明显瓶颈,难以满足民航高安全、高可靠、高实时、高隐私的业务需求。
当前,民航业在客舱服务、飞行运行、机务维修、机场地服、安全监管等关键环节,普遍存在知识获取效率低、跨语言服务不足、维修排故耗时长、紧急救治依赖人工记忆等问题。行业亟需通过端侧离线大模型实现实时其精准的业务辅助、多语言多场景的智能交互、高安全性高稳定性的本地化推理以及低成本高效率的AI能力部署。然而,目前行业内缺乏统一的技术能力标准,导致产品能力参差不齐、系统互操作性差、评估依据缺失,制约其规模化应用与产业化发展。
民航端侧大模型技术能力的技术要求,一方面,面向产业侧形成统一的端侧大模型技术能力要求,为产品研发与系统建设提供统一规范,推动“端侧+边缘侧+云端 ”协同等关键技术的标准化应用,提升民航智能系统的综合性能,支撑民航离线服务新模式的落地;另一方面,面向主管单位,提供可行的开发建设与业务场景服务框架,加快民航端侧大模型建设落地,帮助民航业提升综合运行水平及服务质量,降低运行成本,发展并形成健康的产业生态。
对本文件中的具体事项,法律法规另有规定的,需遵照其规定执行。
T/ISC 0102—2026
民航端侧大模型技术能力的技术要求
1 范围
本标准规定了民航端侧大模型技术能力的技术要求,包括五方面:一是民航端侧大模型生产,二是民航端侧大模型通用服务能力,三是民航端侧大模型场景服务能力,四是民航端侧大模型运营支撑,五是民航端侧大模型安全保障。
本规范适用于从事民航大模型相关解决方案的建设单位与服务提供商,涵盖的产品形态包括网页端、移动互联网应用程序(APP)、小程序等多元化应用载体。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 5271.28-2001 信息技术 词汇 第28部分:人工智能 基本概念与专家系统
3 术语和定义
下列术语和定义适用于本文件。
3.1 民航服务 Aviation services
交通部门及其授权或委托的其他组织行使行政权力、履行公共服务职责过程中提供的服务。
3.2 大语言模型 Large Language Model
大语言模型是一种语言模型,由具有许多参数(通常十亿个权重或更多)的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。
3.3 多轮对话 multip le rounds of conversation
多轮对话是一种在人机对话中,具备多轮次问答能力,以便明确用户意图,最终可根据客户意图或明确的客户指令给出相应答案的机器人问题处理方式。
4 符号和缩略语
下列符号和缩略语适用于本文件。
AI:人工智能(Artificial Intelligence)
API:应用程序接口 (Application Programming Interface)
QA:问题与答案(Question-Answering)
BI:商业智能(Business Intelligence)
SSL:安全套接层(Secure Sockets Layer)
T/ISC 0102—2026
TLS:传输层安全性协议(Transport Layer Security)
CV:计算机视觉(Computer Vision)
OSS:对象存储服务(Object Storage Service)
LoRA:低秩适配(Low-Rank Adaptation)
5 民航端侧大模型技术能力框架
图 1 民航端侧大模型技术能力框架图
民航端侧大模型技术能力框架以民航端侧大模型生产(涵盖知识管理、模型开发、评估及应用服务组装)为基础,通过模型能力服务(具备多种交互与处理能力)和场景适配服务(适配多角色及民航多场景)支撑业务,同时依靠运维管理和安全可靠保障体系确保其稳定、安全运行。
6 民航端侧大模型生产
6.1 民航知识管理
6.1.1 民航知识资源库建设
——应支持创建和管理民航知识资源库,包括但不限于飞行数据、维修数据、客舱服务数据、空管与运行数据、政策法规等;
——应支持对知识进行分类管理,帮助用户进行精细化的知识管理和分类,提升查找和使用知识的便利性。
——应支持对公共知识属性进行管理,支持用户自定义创建和对已有的属性进行修改、删除等操作,以便于搜索和过滤。
——应支持类目知识属性管理能力,支持对知识进行分类管理,用户可以自定义创建类目并将知识分配到相应的类目中,如机场机型、民航政策、法律法规、机构职能、局方公示等。通过类目知识管理,用户可以更好地对知识进行分类,方便搜索和使用。
——应支持用户录入和扩展使用民航行业专属知识,并支持多种数据结构的录入、配置和预览,以及灵活的文件上传方式。用户可以将自己的专业知识录入到系统中,并且这些知识能够在民航端侧大模型中被扩展应用到其他相关场景或功能中,以提高模型的效能和准确度。同时,应支持表格数据、文本
T/ISC 0102—2026
数据、树形结构数据的录入和编辑,以及本地文件上传、对象储存上传等方式将知识文件上传至不同类目知识目录下。
6.1.2 民航知识资源质量控制
——应支持民航领域知识自动打上标注。
——应支持知识库的智能摘要,确保知识的精简融合。
——宜设立民航知识资源审核机制,确保知识的准确性和合规性。
6.2 模型开发
6.2.1 数据收集处理
6.2.1.1 数据收集
——应支持常见数据源,包括支持线上OSS,线下文件作为数据源接入。
——应支持多种数据类型,支持excel、txt、json、pdf、word、PPT等多种格式数据导入,以及支持结构化数据、非结构化文本、音视频等多模态数据接入,提供数据去重工具。
——应支持文本、PDF、Word、Excel及各类结构化数据等多种格式的离线数据导入,覆盖航空业务全场景数据类型,实现数据“一站式归集 ”。
6.2.1.2 数据标注
——应支持微调语料标注能力,即对已有大规模通用语料库进行精细化标注,以满足特定任务或领域的需求。标注结果应具备一致性和可靠性,遵循相应的标注规范。
——应支持对齐语料标注能力,具备将不同来源、不同结构的文本进行整合和对齐的能力,形成一致、规范的文本数据。考虑文本的语法、语义和上下文信息,确保文本对齐和一致性。
——应支持QA抽取能力,从原始文本中提取问题与答案相关信息的能力,以构建问答对数据。关注问题的表述清晰度、答案的准确性以及上下文关联性,确保问答对质量。
——应确保标注过程的可追溯性,便于后期数据审核和质量控制。
——宜支持多人协同标注,提高标注效率。
6.2.1.3 数据增强
——应支持提示词扩写能力,具备对输入提示词进行拓展的能力,通过引入更多的描述性词汇和细节信息, 以丰富原始数据的表达形式。这有助于提高模型的泛化能力和表现力。
——宜支持对原始数据中的关键词或词组进行近义词替换,从而增加数据的多样性。近义词替换应考虑词义、语法和上下文信息的相似性, 以确保替换后的文本在语义上保持一致。
——宜支持对每个数据集实施精细化版本管理,任何修改、增强操作均会生成新版本,并完整记录变更历史,确保数据可追溯、可回溯。
——宜支持建立数据与模型的双向追溯机制,可清晰查询任一模型版本对应的训练数据集版本,保障模型训练过程的可复现性,为模型优化提供精准数据支撑。
6.2.2 部署推理服务
——应具备高性能、稳定可靠的算力资源,满足端侧大模型的计算和存储需求,提供高速、稳定的网络资源,确保大模型数据传输的实时性和准确性。
——应使用稳定、安全的操作系统,具备高效稳定的模型推理引擎,提供完善的数据管理机制,确保数据的完整性、一致性和安全性。
T/ISC 0102—2026
——应采用SSL/TLS或其他加密技术,确保数据传输过程中的安全性。
——应具备完善的权限管理机制,防止未经授权的访问和操作及完备的日志记录和实时监控机制,确保系统的稳定性和安全性。
——应具备自动或手动的故障恢复机制,确保推理服务的高可用性并采用负载均衡技术,均匀分配请求,防止单点故障。
——应提供定期更新和升级推理服务相关组件,确保系统的安全性和稳定性。
——宜具备根据需求弹性扩展或缩减推理服务资源的能力,支持同时部署和管理多个民航端侧大模型,提高资源利用效率。
——应具备大模型在端侧部署推理的能力,支持在无网络或弱网络情况下正常运行。
——应具备统一化量化配置界面,支持多种量化精度选择。用户可根据业务对模型精度与运行速度的需求,灵活选择量化策略,在“精度损耗最小化 ”与“推理速度最大化 ”之间实现最优平衡 。
6.2.3 模型选择与配置
——应支持多种自研通用大模型的选择和配置, 以满足民航端侧大模型的需求。
——应支持可以根据具体任务选择合适的模型。
6.2.4 模型管理
——应支持创建、存储和管理多个自研大模型的模型库。
——应支持模型计算性能监控管理能力,实时监测模型的计算资源利用率、响应时间等指标,及时发现并解决性能问题。
——应支持民航端侧大模型版本管理的能力,对不同版本的民航端侧大模型进行管理和追踪,方便用户回溯和比较不同版本的性能差异。
——应支持对模型库进行权限管理 确保只有授权人员可以访问和操作模型库中的模型。
——应支持记录微调意图管理能力,在模型文档中详细描述每个微调模型的目的、功能和适用场景。这有助于其他团队成员了解模型的设计思路, 以便在后续维护和优化过程中做出相应的调整。
——应具备民航端侧大模型持续改进运营能力,建立一个反馈机制,收集用户和团队成员对微调模型的意见和建议。根据这些反馈,持续改进模型,提高其准确性和实用性。
——应具备统一模型仓库,对基础模型、微调后模型、量化后模型等全版本模型进行集中存储与管理,
6.2.5 模型训练与精调
——应具备大模型精调、调优功能,可对全量或部分参数更新,并可对调优后的模型进行保存和版本管理。
——应支持大模型对齐训练,以确保在不同民航任务和场景间的知识迁移、共享和一致性,从而提高整体模型的性能和效率。
——应支持使用有标注的民航相关数据对预训练模型进行微调,以适应具体的民航相关任务。
——应具备容错和恢复机制,以确保训练过程的稳定性和可靠性。当发生错误或意外情况时,平台能够自动恢复并继续训练。
——应提供直观的可视化界面,方便用户监控和管理训练过程。用户可以通过界面查看模型的训练曲线、性能指标等信息,并进行相应的调整和优化。
T/ISC 0102—2026
6.2.6 端侧模型输出
——应提供直观的可视化界面,用户选定目标模型版本与目标平台(iOS、Android、HarmonyOS)后,系统自动封装生成配套 SDK 开发包。SDK内置模型文件、优化后推理引擎及标准化调用API,并提供详尽的集成文档与示例代码,助力开发人员快速将模型集成至现有移动APP或边缘应用。
——应支持用户选定终端设备并关联配置完成的云端智能体后,系统可一键打包生成可直接安装的基础APP安装包,实现“模型到应用 ”的快速转化。
——应支持APP在端侧离线运行的同时,可定期连接内网服务器, 以“静默更新 ”方式完成模型与知识库的迭代,确保应用功能持续优化,无需用户手动操作。
——应具备统一运维管理后台,实现用户登录与访问权限的集中管控;支持对指定的SDK和APP进行license授权;同时自动收集APP交互日志,通过分析用户高频问题与使用痛点,为后续模型迭代、数据优化提供数据驱动的决策依据。
6.2.7 模型优化
——应支持数据回流,支持将线上业务修正的结果保存回数据集,经人工筛选、调整以及优化处理后,用于下一次的模型优化训练,持续提升模型输出准确度。
——应支持模型压缩,可通过量化、稀疏化等方法在尽量减少精度损失的前提下,降低算力资源占用,提高推理速度。
——应采用 1+N的LoRA架构,用基座模型搭配若干个LoRA模型来支撑不同的业务场景。
——应具备大小模型融合的能力,由轻量级的意图识别小模型快速捕捉用户核心需求,再将精准意图传递给客舱服务大模型,使其聚焦生成场景化、高质量的服务响应,避免大模型在意图理解环节的算力浪费,实现能力互补与效率升级。
——应支持对民航端侧大模型进行指令微调,使其能够更好地理解和执行用户指令,可通过构建指令对的训练数据集,并使用高效微调、全量微调等方法进行微调,从而提升民航端侧大模型在多种应用场景下的智能交互体验。
——应具备灾难性遗忘防治能力,确保模型在持续学习过程中不会忘记先前知识,可通过输出保留先前学到的知识、对比测试、迁移学习测试、长期训练与验证、用户满意度调查或模型自我评估等方法进行验证。
——应具备大模型幻觉处理能力,可通过利用外挂知识库等方法去减轻大模型幻觉影响,采用自动化事实检查、人工审核、建立反馈机制或持续更新知识库等方法去验证,从而避免民航端侧大模型在生成回答时出现不准确或不合理的情况。
——宜具备基于动态采信策略构建闭环反馈学习机制,实现端侧大模型的自动进化
——应支持强化学习的训练方法,以实现模型在民航场景中的智能决策与优化。
——宜具备在推理过程优化的处理能力,如优化后的民航端侧大模型在处理用户请求时,应有相比优化前模型更快的作业完成时间。
——宜具备识别相同或相似问题并避免重复回答的能力,可通过引入问题去重机制,对输入问题进行预处理,识别重复问题并跳过已回答过的部分,或通过对模型输出的答案进行去重处理,针对性优化实现。
6.3 模型评估
6.3.1 技术评估
——应支持由专业人员对模型进行人工评估, 以获取更准确和全面的评估结果。
——应支持使用自动化工具和算法对模型进行评估,以提高评估效率和一致性。
T/ISC 0102—2026
——应支持将多个模型进行对比评估,以选择最佳模型或进行模型融合。
——应支持使用通用的评测集对模型进行评估,以验证模型在广泛任务上的性能。
——应支持使用民航行业的专门评测集对模型进行评估,以验证模型在特定领域任务上的性能。 ——应具备模型评估指标管理相应规范。
——应支持自定义评估指标和评估流程,满足不同场景下的需求。
6.3.2 可信评估
——应具备在不同环境和条件下通过调试信息展示展示推理过程,获得稳定且可持续的高准确率的能力,如民航端侧大模型对输入样本扰动具有一定的容忍程度。
——应具备对于推理和决策过程的解释能力。
6.4 应用服务组装
6.4.1 应用管理
——应支持整合与处理来自不同领域、不同层面的知识,从而更好地满足来自多样化场景的需求。将专业领域的知识与通用语言建模能力相结合,为用户提供高质量的内容和服务。
——应预置民航场景大模型应用模板,如政策文件、民航知识问答、民航数据要素等,模板中需预置行业大模型,大模型需具备民航行业属性,以实现快速构建民航端侧大模型应用能力,同时支持用户自定义调整模板的业务参数,以满足业务的个性化需求。
——应支持用户创建应用模板,应用模板支持配置模型、关联模型管理、知识库、应用相关能力的开启关闭等参数,支持在线调试。
——应具备大模型应用编排功能,支持用户将多个大模型进行组合和编排,形成复杂的应用流程,满足实际业务需求。
——应支持通过可视化交互页面进行效果评测测试。
——应支持开放架构,支持第三方工具集成,全流程工具链支持各类AI开发场景,支持外部通过API调用的方式实现智能化应用服务的调用,同时开放接口API需进行鉴权。
6.4.2 生成式应用组件
6.4.2.1 意图组件
意图识别服务能够通过准确理解用户意图,提供更加个性化和灵活的回答和服务,从而提升用户体验。同时,还可以结合垂直领域的知识库和机器学习技术,提供更加精准和高效的意图识别服务。
——应具备理解用户目的能力,意图识别服务能够通过对用户输入的文本进行分析,理解用户的意图,从而为后续的对话处理提供明确的方向。
——应具备自然语言交互的能力,意图识别服务可以支持自然语言交互,用户可以使用自然语言进行提问和查询,无需特定格式或关键词,使得对话更加自然和便捷。
——应具备多轮对话支持的能力,意图识别服务可以支持多轮对话,可以在对话过程中动态地调整意图识别结果,从而更好地引导对话过程。
——应具备强大的后端知识库,意图识别服务通常与强大的后端知识库相结合,可以提供更加全面和准确的信息和服务。
——宜具备自我学习和优化的能力,意图识别服务可以通过机器学习和自然语言处理技术进行自我学习和优化,不断提高对话系统的效率和准确性。
6.4.2.2 检索组件
T/ISC 0102—2026
检索组件允许用户高效地查询和获取文档中的关键信息,提升信息获取的效率,进而提升工作和决策的效能。
——应支持对表格、文本数据进行接入、上传,支持对详情进行预览查看。
——应支持配置检索库生成任务过程的配置,支持数据与处理算法、策略的配置和自定义。
——应支持对维修数据、飞行数据、客舱服务数据、政策文件、局方公文等民航主流数据的专属检索策略。
——应支持检索库的创建、配置、查询。
——应支持检索库的全量更新、增量更新、定时更新、手动更新。
——应支持检索库以API的形式进行调用。
6.4.2.3 提示(prompt)组件
提示(prompt)组件在大模型服务中可以通过自然语言的交互形式引导模型完成指定的任务和目标,同时起到引导用户输入、约束输入范围、提高用户体验和优化模型预测的作用。
——应具备引导用户输入的能力,提示组件可以引导用户输入,例如提示用户输入某个关键词或问题, 以便引导后续的对话处理。
——应具备提高用户体验的能力,提示组件可以提供自然语言交互和多轮对话支持,使用户可以更加自然和便捷地进行对话,提高用户体验。
——应具备优化模型预测的能力,提示组件还可以优化模型预测结果,通过提供特定的关键词或问题,引导模型更加准确地预测用户意图和提供相关回答。
——应支持提示词工程优化,对提示话术模板进行内容上和结构上的优化,便于获得更符合期望的大模型推理质量和结果。
——宜具备约束输入范围的能力,提示组件可以约束用户输入的范围,例如限制用户只能输入特定类型的问题或查询关键词。
6.4.2.4 会话日志组件
会话日志组件记录了用户与AI系统的对话历史和交互信息。这些信息对于系统开发者和管理员来说非常重要,因为它们可以帮助了解用户的需求和行为,从而优化AI系统的性能和用户体验。
会话日志组件应包括以下内容:
——应包括对话历史记录,会话日志记录了用户与AI系统中被允许收集的对话历史,包括文本输入、语音交互、表情符号等。这些对话记录可以展示用户的需求和问题, 以及AI系统的回答和反馈。
——应包括交互信息,会话日志还记录了用户与AI系统的交互信息,包括用户输入的时间、输入方式、AI系统的响应时间、回答内容等。这些信息可以帮助开发者了解用户与AI系统的交互方式和效果,从而优化系统的性能和用户体验。
——应包括意图识别结果,会话日志记录了AI系统对用户输入的意图识别结果,包括识别到的关键词、话题、任务等。这些信息可以帮助开发者了解用户的需求和行为模式,从而优化AI系统的意图识别算法和性能。
——宜包括情感分析结果,会话日志还可以记录AI系统对用户输入的情感分析结果,包括用户的情绪状态、情感倾向等。这些信息可以帮助开发者了解用户对AI系统的情感反馈,从而优化系统的情感分析算法和性能。
6.4.2.5 安全组件
安全和幻觉控制模块是生成式AI系统的重要组成部分,它们可以提供强大的安全防护、幻觉控制、可解释性和透明度等功能,并具有灵活性和可扩展性。
T/ISC 0102—2026
——应具备安全防护的能力,这些模块可以保护生成式AI系统的安全,防止恶意攻击和数据泄露。它们提供了数据加密、访问控制、安全审计等功能,以确保模型和数据的机密性和完整性。
——应具备幻觉控制的能力,幻觉控制是指通过技术手段实现对AI系统的控制和操纵。这些模块可以帮助开发者更好地理解和控制生成式AI系统的行为。例如,开发者可以通过幻觉控制来引导AI系统的决策过程,以确保系统能够按照预期的方式运行。
——应具备灵活性和可扩展性的能力,这些模块通常具有灵活性和可扩展性,可以适应不同的应用场景和需求。开发者可以根据具体的应用场景来选择适当的安全和幻觉控制模块,并对其进行定制和扩展。
——宜具备可解释性和透明度的能力,这些模块可以提高生成式AI系统的可解释性和透明度,使开发者能够更好地了解AI系统的内部工作原理和决策过程。这样可以帮助开发者更好地理解系统的行为,并发现潜在的安全风险。
6.4.3 插件库管理
在大语言模型中,插件是一种扩展功能,可以提供更加个性化和高效的语言处理体验。插件可以增强大语言模型的能力,使其能够访问新的、私人的或具体的,不包含在训练数据中的信息,还可以使大语言模型代为执行安全、受限的操作,从而提高整个系统的实用性。
6.4.3.1 智能知识文档插件
智能知识文档插件支持外部文档接入到系统中作为知识补充,并优先参考文档知识内容。
——应支持文档知识库的创建、删除等功能, 以满足用户对知识文档的分库管理。
——应支持doc、docx、wp s等若干种文档格式,同时支持单文档或者批量文档的上传、下载、删除、查询等功能, 以方便用户修改知识文档库。
——应具备文档理解的能力,能够自动解析和提取维修手册、局方规章、公司规范等文档中的关键信息,包括但不限于政策法规、通知公告、办事指南等。它应该具备对文档进行自动化的结构化分析能力,将文档中的重要信息提取出来,如主题、观点、论据等,帮助用户更好地掌握文档要点,以便于后续的问答处理。
——应具备自动摘要的能力,能够自动生成文档的摘要,方便用户快速了解文档内容。
——应具备文档分析的能力,能够分析文档的结构、语言风格、论述逻辑等,帮助用户更好地理解文档的写作特点和优缺点。
——宜具备内容建议的能力,通过分析文档内容,可以提供与文档相关联的其他资料或资源的建议,以扩展用户的阅读范围。
——宜具备跨语言支持的能力,支持多种语言,可以为不同语言的用户提供高质量的文档理解服务。
6.4.3.2 智能数据分析插件
智能数据分析插件帮助大模型应用针对数据表进行处理以及数据结果召回,用户需要新建对应的数据分组并绑定关联相关的数据库数据表,关联好的应用即可使用智能数据分析能力。
——应支持自定义数据源,支持接入多类型、多来源的数据,同时对数据进行预处理。
——应具备注册外部数据分析服务及其语义描述的能力。
——应具备自动调用外部相关数据分析服务并完成对应数据分析操作的推理行动能力。
——应能够从数据源中自动识别和提取与问题相关的信息,根据从数据源中获取到的信息进行数据分析与推理, 以满足用户需求。
——应支持将分析结果以直观的方式呈现给用户,以便用户能够更轻松地理解数据。数据可视化可以使用各种图表、图像等,将复杂的数据转化为易于理解的形式。
T/ISC 0102—2026
7 民航端侧大模型模型服务能力
7.1 交互式问答
——应具备准确理解和回答用户问题的能力,包括对问题的语义、语境和意图的深入解析,同时给出准确、简洁且符合事实的回答,避免产生歧义或误解。
——应具备对话管理的能力,能理解和遵循用户的意图和需求,进行连续、有逻辑的对话,以提供连贯、准确的服务。
——应支持对问答业务策略进行配置,支持根据场景需求,提供可自定义配置的开场话术和推荐问题,来确保面向民航各类业务领域能快速拓展。
——应支持根据所依赖的民航知识进行回答,在交互过程中能有效地从知识库中获取相关信息,并能在回答中进行引用和解释。
——应具备对用户问题和大模型回答的内容审核能力,包括敏感信息过滤、恶意言论识别、违法信息筛查、回答内容的审核等,以提供准确、可靠、安全的交互式问答服务。
——宜支持根据用户的问答内容,给出推荐问题,提升用户提问效率。
7.2 生成式 BI
——应支持通过单属性、多属性等简单条件对于对数据库表进行检索查询。
——应支持通过文本模糊匹配、去见判断、多条件逻辑计算等复杂条件对于对数据库表进行检索查询。
——应支持基于列名进行处理后计算,来进行检索查询。
——应支持基于用户自然语言Query找到对应数据表。
——应支持基于对话的多类型数据库查询能力,基于自然语言的交互形式进行底层数据的搜索及回复。
——应支持基于对话的多类型图表生成能力,可基于用户问题的理解,构建相应的可视化图表,如柱图、饼图、线图等。
——应支持数据分析及洞察能力,可基于用户问题,分析数据中的模式和趋势,提供相应的洞察及建议。
——宜支持人机协作能力,支持用户对大模型产生的中间结果,如数据库查询等,进行查看和修改,以确保获取数据的正确性。
7.3 多轮引导反问
——对于普通对话场景,应提供多轮闲聊问答能力。
——应提供多轮常识类问答以及对问答中意图和对上文问题的修改能力。
——应支持以职位为基础的问答,如以具体角色如客服人员的口吻对问题进行回答。
——应支持基于业务流程对于用户的对话内容进行意图识别,意图不明确时支持澄清范围。
——应支持基于流程对关键信息进行提取,对于未获取的关键引导信息进行澄清反问。
——应支持对于某事项的必要条件进行澄清,不确定时进行澄清反问、追问。
——应具备对问题边界识别的能力,能自动识别用户提问是否超出当前大模型的能力覆盖范围,对于超出能力边界的问题,能够以适当的方式拒绝回答,如可选择用兜底拒绝话术进行回答,或拒绝答复,并用标准术语答复,避免大模型在能力边界外产生不合理的回复。
——宜支持对用户问题进行相似问题推荐的能力。
7.4 数据定期更新能力
T/ISC 0102—2026
——应支持通过外挂知识库进行数据的人工或定期更新。
7.5 策略生成
——应具备遵循明确的语言规范和标准的能力,生成的文案应语法正确、用词准确、表达清晰,不出现错别字、语法错误和语义歧义。
——应具备对输入信息进行准确理解和处理的能力,以保证生成文案的准确性。这包括但不限于对输入信息的语义理解、实体识别、关系抽取等能力的掌握,以及能够根据这些信息生成准确、完整的文案。
——应具备语言表达的流畅性,应掌握不同文体的表达方式,生成的文案应语句通顺、逻辑清晰、符合语言习惯,避免出现语病和表达不畅的情况。
——应具备多语言支持能力,能够处理不同语言的输入信息并生成相应语言的文案。具备对多种语言的处理能力和掌握多种语言的语言资源库。
——应支持标注生成、摘要生成、文案生成等能力,支持用户自定义文案生成的要求,如数量、字数、主题等。
——应预置民航场景文案生成能力,如:公文生成、公文摘要、民航标注、民航新闻稿等。
7.6 计算机视觉(CV)
——宜支持图像分类,基于 CV 大模型的图像分类工作流,实现对图像的高精度分类,如文档识别、组件识别等, 以便快速识别和处理民航场景中的图像信息。
——宜支持异常检测,基于 CV 大模型的异常检测工作流,非正常即异常,用于如识别飞机部件故障, 以便及时发现潜在问题和风险。
——宜支持语义分割,基于 CV 大模型的语义分割工作流,根据图像语义将不同区域分割成不同类别,如机场、跑道、绿化等,有助于民航场景下的飞行仿真、场景模拟等应用。
7.7 多模态处理
多模态大模型是指模型中涉及到了两种及其以上的模态信息。目前,大多数的多模态模型只涉及了两种模态之间的建模,例如文本-图像,文本-语音等。根据民航场景中常见的数据类型,模型应支持图像、文本和语音等模态的处理。
宜支持以下能力:
T/ISC 0102—2026
8 民航端侧大模型安全保障能力
8.1 数据安全
——应具备制定全面、科学的数据去毒策略、去毒效果评估和去毒过程审计与追溯的能力,确保有毒数据在训练过程中不被使用。有毒数据包括但不限于:事实错误、涉恐、涉黄的敏感数据、不符合伦理道德的数据等。
——应具备数据来源可追溯性的能力,确保数据来源有据可依,避免使用恶意或有意篡改的数据。
——宜具备评估民航端侧大模型训练、部署、推理时数据的完整性和一致性,防止数据被篡改或恶意注入潜在的安全漏洞。
——宜支持敏感数据处理能力,对敏感数据不应使用弱加密,不应采用明文形式存储或网络传输敏感数据。
——宜具备数据清洗能力,涉及到用户隐私的数据需在获得许可后进行收集,并进行必要的数据清洗。
——各地区民航端侧大模型的数据管理宜支持符合各地区相关政策管理、条例,确保数据的合法使用和管理,可通过建立合规性管理制度,明确责任和权限,加强对数据的监管和审计。同时,应定期进行合规性检查和培训,确保员工了解并遵守相关法规要求。
——宜提供数据安全管控及审计能力,防止数据泄露、篡改等安全风险,可采用防火墙、入侵检测、安全审计等技术手段,确保数据安全。
8.2 模型安全
8.2.1 模型训练安全
——应支持模型训练安全,包括但不限于提供多种手段多种手段防范外部恶意攻击、 面对恶意攻击(如数据投毒、后门攻击)的应具备相应的防御性能力、具备对民航端侧大模型实时监控与预警的能力、对民航端侧大模型恢复与应急处理的能力等。
8.2.2 模型推理安全
——民航端侧大模型在推理阶段宜具备相应安全能力,包括但不限于对输入数据中的对抗样本进行检测的能力、采用鲁棒性优化技术、对对抗攻击事件的日志记录和审计功能等
8.2.3 模型文件安全
T/ISC 0102—2026
——应具备对模型文件提供安全能力,包括但不限于采用加密技术对模型参数和训练数据进行保护、实施严格的访问权限管理、对民航端侧大模型服务的访问日志进行审计和监控、民航端侧大模型服务中嵌入隐蔽的水印信息、明确民航端侧大模型服务的版权归属等
8.3 话术安全
——应具备有检查话术安全的能力,包括禁用词过滤、敏感词过滤、敏感内容图片过滤等。
——应遵守伦理原则,包括尊重个人的自主权利、保护弱势群体的利益、确保公正和公平等的能力。 ——应具备有隐私保护的能力,包括使用隐私识别技术、隐私脱敏技术、隐私伪装技术等。
——应具备一定的鲁棒性,对人为诱导情境下的偏见、毒害、攻击、不确定性具备鲁棒控制能力。
8.4 服务安全
8.4.1 安全组织与机制
——应具备专门的安全管理部门和人员,明确相应的岗位职责。
——宜具备明确的安全测评框架和安全测评机制,对模型自身、数据、平台等维度实现全方位测评。
8.4.2 访问控制
——应对授权访问的内容严格访问控制,不应有超出授权范围的访问,当第三方访问被保护的用户数据时,应先获得用户许可或同意。
——不应拦截或存留用户敏感或隐私信息,如用户支付密码等。
——应支持细粒度权限管控能力。
——应支持安全审计,能够实时监控、记录各类用户的登录和操作行为,并可以进行集中分析并生成审计报表。
8.4.3 可靠性
——应支持民航端侧大模型服务多方调用的统一流量管控能力。
——应支持民航端侧大模型服务历史日志监控与持久化能力。
——应支持民航端侧大模型服务运行状态的监控能力。
——宜支持业务激增时保证大模型稳定服务的按需扩缩容能力。
9 民航端侧大模型运维管理
9.1 业务运营
——应具备收集用户反馈和业务需求能力,从而对业务进行相应的调整和处理,以支持模型的持续优化和改进。
——应支持业务端到端专家评测所需的测试集管理功能,支持单论及多轮评测集的构建与查询。
——应支持业务评测任务的创建、分配、回收等管理能力,并支持基于大模型为预设任务生成答案。 ——应支持业务问答评测,包括单论、多轮预设问答与自由问答能力。
——宜支持知识依据反馈,具备知识依据过期或错误标记的能力。
9.2 平台运营
——应支持多账户与多角色管理能力,支持大模型以及民航AI 原生应用的统一权限管理。
T/ISC 0102—2026
——应支持基于角色的工作流设计,实现业务流程的自动化流转,应提供任务协同功能,支持不同角色间的在线协作,并监控和记录业务流程的执行状态,确保流程的合规性和高效性。
——应具备平台运维能力,包括服务器、存储、网络等基础设施的部署、配置、监控和故障排除等,确保平台的稳定性和可用性。
——宜支持各类接入服务的运营管控能力,支持发布、审批、 申请、回收等资产管理控制功能。 ——宜支持查询平台各民航端侧大模型服务以及各业务需求方的历史调用量。
——宜具备平台扩展能力,能够根据业务需求进行平台的扩展和升级,包括增加计算资源、存储容量、用户规模等, 以满足不断增长的模型训练和应用需求。
9.3 数据运营
——应设立专门的敏感词库,包括法律法规禁止使用的词汇、不当言论等,定期更新、维护,确保库内词汇的准确性和实时性。
——宜具备对大量数据的存储、检索和管理的能力。这包括提供高效的数据库系统,支持数据的备份和恢复,以及提供数据的安全保护措施。
——宜支持对数据服务、数据表、文件三种数据资产申请与资产运营管理。
——宜支持平台内数据资产态势概览,包括数据变化趋势、 申请热度,来源分布分析等。
9.4 服务运营
——应具备统一的服务接口规范,支持服务的动态编排组合,同时提供可复用的服务封装能力。
——应具备管理一体化能力,能够实现对推理服务的管理和调度,包括服务的创建、分配、监控和优化等。
——应具备用户支持与服务能力,提供用户支持和服务,包括技术咨询、培训服务、使用指南、在线测试、故障处理等,帮助用户更好地使用推理服务。
——应具备服务运营数据分析能力,能够对推理服务的运营数据进行收集、分析和挖掘,为优化服务提供数据支持。
——应支持民航端侧大模型的调用量统计分析,不限于用量排行、调用成功率、使用率等指标。 ——应支持民航端侧大模型服务的性能统计分析,包括资源占用、服务稳定性统计等指标。
——应支持民航端侧大模型以及民航AI原生应用的线上使用情况统计与分析能力。
10 民航端侧大模型场景服务能力
10.1 多角色适应性(服务对象)
——宜具备为多种角色提供服务的综合能力,至少能够满足民航航司其中一种角色,如机务维修、安全监控、客舱乘务人员、飞行员、安全员等角色的需求,确保为各角色提供准确、高效的服务,以保证民航端侧大模型在多元化用户场景下发挥最大价值。
10.2 民航场景应用能力
10.2.1 客舱服务类
——针对客舱乘务人员、飞行员、安全员等服务对象,宜提供端侧环境下的知识咨询服务,具备自动化处理和智能分析咨询问题之能力,为服务对象提供准确、及时的答复,并涵盖意图识别、交互式对
T/ISC 0102—2026
话、开放搜索、数据实时更新、条件补齐、安全回答等全方位能力, 以确保高效便捷的咨询服务体验,更好地满足各类服务对象的需求。
——宜支持端侧与云端结合服务能力,提供全天候有网、无网环境不间断模型服务,工作人员和乘客可以通过语音、文字等方式与大模型进行交流,实现业务咨询、办理、查询等功能的自助服务,涵盖端侧/在线民航业务指南能力、智能引导、实时更新指南内容、业务端侧预办理、智能预审、端侧支付功能等能力,帮助工作人员与乘客更好地了解和办理各类业务。
——宜支持多语言语音交互能力,并具备智能分类、解答问题的能力;同时提供端侧多语种双向翻译功能,涵盖语音识别与转换、自然语言理解、乘客需求分类与术语化、实时数据处理、数据隐私保护、可视化展示、智能提醒及全流程对话交互式翻译、引导服务等能力,实现语音/文本多轮交互式问答对话, 以全方位满足乘客需求,提升空中服务体验。
——宜支持多模态应急医疗诊断与处置建议能力,具备常见病症引导问诊能力,支持快速定位病症类型,并提供详细的处置指引。
10.2.2 机务维修类
——针对机务维修人员、地勤机师、空勤机师等服务对象,宜提供端侧环境下的故障识别诊断服务,具备图像故障识别和智能维修引导之能力,为服务对象提供准确、及时的答复,并涵盖意图识别、交互式对话、开放搜索、数据实时更新、条件补齐、安全回答等全方位能力,以确保高效便捷的咨询服务体验,更好地满足各类服务对象的需求。
——宜支持无网或者弱网环境下借助端侧模型快速查询维修手册、故障案例、部件参数等,提升排故效率。
——宜支持多模态故障分析的能力,具备机务维修标准与流程检索能力,支持快速检索故障内容,并提供详细的维修指引。
10.2.3 端侧办公类
——宜支持智能公文(客舱报告、飞行报告类)写作场景能力,涵盖智能写作、模板智能推荐、内容自动校对、语言智能润色、格式自动调整、用词智能建议以及实时更新等功能,以提升公文写作的效率、准确性规范性和美观性,以确保公文能够有效地传达信息,并符合组织或政府的规范和要求,实现便捷、高效的公文写作体验。
10.2.4 数字人
——验证是否支持提供知识问答能力,民航端侧大模型能够基于特定上传的文档,自动从给定文档特定领域的知识库或语料库中查找并生成答案。化身“智慧飞行助手 ”,为航班信息和天气信息等提供全面、高效的专业知识搜索问答和初级分析研判能力,实现智能客服、智能运维以及应急指挥等多种功能应用。
——验证支持是否可提供数字人驱动和配置管理能力;包括人形身份配置;设定人像配置,包含位置、大小、分辨率等设定声音配置等。
——验证是否支持接收各类数字人交互信息,可提供一个模块可以对接第三方自定义接口。
——验证是否支持会话创建和销毁,管理渲染资源,透传数字人驱动文本等。
——验证是否支持提供人像口型校准能力。
——验证是否支持提供操作记录查询和日志查询。
T/ISC 0102—2026
——验证是否支持配置数字人TTS语速、语调,是否支持选定发音人调参后的预置文案实时驱数字人播报试听。
——验证数字人是否支持在本地端渲染并在web端展示,并支持与客户web页面集成。
——验证是否提供端渲染引擎鉴权能力。
——验证数字人是否支持接受对话平台返回内容并进行播报。
——验证是否支持解析数字人动作指令并驱动数字人做动作。
——验证是否支持通过配置文件方式,对数字人区域参数进行配置。
——验证数字人区域是否可通过字幕形式展示数字人播报内容文本。
——验证是否支持显示ASR识别字幕:通过字幕形式展示ASR识别文本。
——验证是否支持基于交通系统内容,生成讲解话术,结合数字人讲解形象进行展示接待。
——验证是否支持基于系统实现的功能,生成讲解话术,结合数字人讲解形象进行展示接待。
——验证是否支持讲解开始/暂停/结束、继续播放、重新播放等状态控制。
——验证是否支持通过语音形式可实现虚拟人控制、屏幕操作控制。
——验证是否支持虚拟人唤醒、虚拟人显示和隐藏、虚拟人讲解;状态控制、虚拟人讲话控制(字幕显示/隐藏,语速调整)。
——验证是否支持主题页面切换、航迹/天气/机内视角切换、位置;查询和定位、事件查看等,覆盖屏幕所有按键操作功能。