欢迎访问学兔兔标准下载网,学习、交流 分享 !

返回首页 |
当前位置: 首页 > 资料下载>团体标准规范 > T/ISC 0101-2026 基于大模型的企业级 AI 知识库能力要求

T/ISC 0101-2026 基于大模型的企业级 AI 知识库能力要求

收藏
关键词:模型   企业级   知识库   ISC   0101
资源简介

  ICS 35.240 CCS L70

  团 体 标 准

  T/ISC0101—2026

  基于大模型的企业级AI 知识库能力要求

  Requirements for Enterprise-Level AI Knowledge Base Based on Large Models

  (发布稿)

  2026 - 03-03 发布 2026 - 04 - 03 实施

  T/ISC 0101—2026

  T/ISC 0101—2026

  前 言

  本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。

  请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

  本文件由中国互联网协会归口。

  本文件起草单位: 中国信息通信研究院、中国移动通信集团山东有限公司中移齐鲁创新院分公司、北京兴云数科技术有限公司、金现代信息产业股份有限公司、拉扎斯网络科技(上海)有限公司余杭分公司、北京搜狐新媒体信息技术有限公司、上海得物信息集团有限公司、广州荔支网络技术有限公司。

  主要起草人:徐恩庆、祖子月、车昕、李雪玉、赵君婷、伊洋洋、吴永航、王慧、马鑫林、丁真、蒋旭辉、郭洪文、杨欢、刘冶。

  ——

  T/ISC 0101—2026

  引 言

  本标准结合我国AI大模型与企业知识库的协同进化实际,充分考虑AI大模型与企业知识库的实际需求,提出了以“知识+AI大模型+多模态 ”融合发展形式的知识库升级实施指南。标准涵盖知识获取、处理、管理、分析、应用等多个维度内容,旨在为企业AI知识库能力评估提供科学、系统的技术指导,提升能力评估的科学性和可操作性,以期提高企业AI知识库的智能化水平,促进企业AI知识库的服务水平提升和各行业的数智化转型。

  T/ISC 0101—2026

  1 范围

  本文件规定了企业基于大模型的企业级AI知识库的技术功能水平和服务能力。从知识库的知识获取、知识处理和构建、知识管理、知识库服务能力等维度,对企业知识库平台从知识获取、处理、知识资产治理、知识消费应用构建等关键环节的技术能力和功能水平进行衡量。

  2 规范性引用文件

  本文件没有规范性引用文件。

  3 术语和定义

  本文件没有需要界定的术语和定义。

  4 概述

  4.1 基于大模型的企业级AI 知识库能力要求

  大模型作为构建和使用知识库的辅助工具,基于大模型的企业级AI知识库能力要求从知识库的知识获取、知识处理和构建、知识管理、知识库服务能力能力域展开,每个能力域下又包含多个能力项,完整的能力模型见表1。

  表1 基于大模型的企业级AI知识库能力要求

  4.2 基于大模型的企业级AI 知识库能力要求评价方法

  T/ISC 0101—2026

  《基于大模型的企业级AI知识库能力要求》包括问文本类知识场景、图像类知识场景等多个场景,每项场景可单独选择,能力项未特殊标注,即为通用能力要求,适用于所有场景,标注图像类知识、视频类知识场景等具体场景的能力项,适用于专门场景。对应场景内必选能力项中,通过85%即视为通过。

  5 知识获取能力

  5.1 外部知识采集

  外部知识采集是指系统能够从互联网、专业数据库、新闻媒体、社交媒体等外部来源自动收集和整合信息的能力。这一能力要求系统能够识别、获取并处理各种格式的数据,包括文本、图片、视频和音频等,以确保知识库内容的全面性。

  1) 应支持外部知识的多渠道采集,包括但不限于第三方网络、本地人工上传;

  2) 应支持从互联网上自动抓取公开发布的信息,例如新闻、博客、论坛、社交媒体等。

  3) 宜支持与业界常用的专业数据库(例如中国开放数据平台、万方数据知识服务平台、知网数据库等)建立数据接口,实现数据的自动同步和更新;

  4) 宜支持对采集的数据进行知识自动定期沉淀,同时具备纠错、相关提示、摘要自动生成、关键字抽取等智能辅助能力;

  5) 应支持对采集到的数据进行初步的清洗和格式化, 以便于后续的处理和分析

  6) 宜支持对采集内容的版权和授权情况进行识别和验证,确保合法合规地使用外部数据;

  7) 应支持对采集数据的来源进行记录和追溯,以便于数据的管理和审核;

  8) 应支持跟踪和记录数据获取操作过程,对超出法律法规规定和侵犯他人知识产权等异常行为自动检测并发出警报,立刻追溯并停止获取数据操作,及时采取相应的补救措施。

  9) 应能够明确引入外部知识的目的(如补充行业趋势、技术前沿、法规标准等),避免重复建设;

  5.2 内部知识采集

  内部知识采集是指系统对企业自身业务相关的各种信息、数据、专业知识及业务经验的整合与梳理。要求系统能够处理和分析来自业务部门、职能部门等的关键系统中客户服务记录、销售报告、项目文档等数据, 以确保企业能够充分利用内部的知识资源。

  1) 应明确业务知识的采集范围、数据格式以及采集流程,定期评估业务知识采集过程的合规性;

  2) 应支持各业务线数据接入任务灵活配置,包括但不限于同步周期、接入方式,支持增量更新、断点重传等;

  3) 宜具备将非结构化数据转化为结构化数据的能力,形成完整的知识体系;

  4) 应确保业务知识采集过程不会干扰或影响正常业务系统的稳定运行;同时确保业务知识的实时性、一致性、完整性以及真实性等;

  5) 应支持业务知识的自动加载、创建与更新,能够针对业务发展和市场变化需求实现知识的定期更新与及时补充;

  6) 应当配置业务知识采集的可视化界面,监控业务数据的流动与转换,针对涉密与核心数据建立完善的监管和审批流程, 自动检测违规操作并及时发出警报。

  7) 应能够将员工的经验、技能等隐性知识通过文档、视频、流程图等形式转化为显性知识;

  8) 应能够识别知识缺口,覆盖大模型问答中提问未覆盖内容。

  9) 应通过积分、排名、荣誉等激励机制提升参与度鼓励员工参与知识贡献。

  T/ISC 0101—2026

  5.3 数据源管理

  数据源管理是指系统能够对企业内外的数据源进行统一的管理和维护。这要求系统能够对数据源进行注册、认证、更新和监控,确保数据的可用性和安全性。

  1) 应支持对内部和外部的数据源进行注册和分类,建立数据源目录;

  2) 宜支持对数据源的访问权限进行管理,并能够进行访问频率和数据量进行监控;

  3) 应支持数据源的基本操作,包括但不限于添加、编辑、删除等;宜具备基本的检索能力,包括但不限于设定搜索范围、结果类型等;

  4) 应配备直观的可视化界面, 以便于用户能够清晰地浏览、监控和管理各类数据源;

  5) 数据源宜具备并符合相关安全性和规范性管理,确保数据采集和使用符合法律法规;

  6) 应具备数据源的备份和恢复机制,以防丢失和业务中断;

  7) 宜支持对数据源的可用性、安全性以及性能进行监控,全面诊断各数据源运行态势;

  6 知识处理和构建能力

  6.1 知识数据智能处理

  1) 应能打破传统知识组织形态,面向业务场景的知识分类和组织方式, 以知识图谱和知识内容标签为载体,更有序、更统一地组织海量知识;

  2) 应支持对知识进行去重,以及噪声和异常值的识别和处理。

  3) 应支持对数据进行清洗,如乱码、特殊字符、空白行等,及进一步可支持对噪声和异常值的识别和处理;

  4) 应支持对数据中的敏感信息进行处理;

  5) 应支持文件和数据的解压、格式转化等;

  6) (图像类知识、视频类知识场景)在多模态场景下,应利用多模态大模型、OCR、声轨识别等技术对不同类型的数据进行解析,提取深层次的语义信息,为后续的知识提取和融合提供基础;

  7) (图像类知识、视频类知识场景)宜在多模态模型的基础上,实现不同模态信息之间的融合与关联,以构建更加完整、准确的知识图谱,提升知识库的语义理解和应用能力;

  8) (图像类知识、视频类知识场景)应具备图像预处理能力,包括但不限于图像去噪、增强、归一化等操作, 以确保输入多模态模型的图像质量符合识别要求。

  6.2 信息智能抽取

  企业知识库中的数据类型日益丰富,涵盖了文本、图像、音频、视频等多种模态。为有效整合并利用这些多模态数据,企业应运用多模态模型进行信息智能抽取, 以提升知识库的构建效率与质量。

  1) 应支持多种方式信息提取,如三元组抽取、图像识别、语音识别等;

  2) 应支持通过简化的配置流程来构建事件抽取服务,抽取的结果可保存在多种形式的数据库或文件中,如关系数据库,图数据库,及文件等;

  3) (图像类知识、视频类知识场景)应支持收集并整合不同类型的信息,如文本、图像、音频、视频等, 以构建全面的知识集;

  T/ISC 0101—2026

  4) 宜允许用户通过可视化界面配置正则表达式等规则, 以便从非结构化数据中高效地提取知识;

  6.3 智能标签

  1) 应根据企业实际需求和知识库的内容特点来制定标签体系,包括确定标签的分类、命名规则以及层级结构;

  2) 应利用自然语言处理(NLP)技术,自动识别和分类企业内部的知识资源,包括文档、报告、邮件等,并自动生成智能标签;

  3) 应利用自然语言处理(NLP)技术自动生成标签,利用机器学习算法检测重复标签和冗余标签,提高标签维护的效率;

  4) (图像类知识、视频类知识场景)应通过多模态大模型整合图像、文本等不同模态的数据,并基于此生成细粒度的实体标签, 以增强知识库的检索和分类能力;

  5) (图像类知识、视频类知识场景)应采用知识蒸馏和提示学习技术,增强图像和文本Embedding的语义一致性,以更好地迁移图文模型的图文匹配能力,从而提高标签的准确性;

  6) 应建立机制以定期更新和维护智能标签,确保标签的时效性和相关性,以适应不断变化的业务需求和知识结构;

  7) 应设置不同的访问权限,确保敏感标签的安全,同时也能控制不同员工对不同知识标签的访问权限;

  6.4 知识建模

  知识建模是指系统能够对抽取出的知识进行结构化和形式化的表示,将业务知识有效转化为图谱形式表达,完成结构化数据到语义逻辑知识化的建模,并构建完善的知识图谱内容和知识库本体。

  1) 宜确定知识图谱的应用场景和目标领域,规划知识图谱的范围、预期规模以及目标用户群体;

  2) 宜明确定义知识图谱的Schema,包括实体类型、属性和关系类型,以确保知识图谱的结构化和语义化;

  3) 宜利用自动化工具和算法,从结构化数据到语义逻辑知识化的建模,减少人工干预,提高建模效率和准确性;

  4) 宜能够对知识建模的可信度进行量化评价,通过舍弃置信度较低的知识来保障知识库的质量;

  6.5 知识生产

  知识生产是指系统能够基于已有的知识,生成新的知识,为知识库持续丰富与更新的关键机制,其效能直接影响到企业的信息优势与决策支持能力。多模态模型,通过整合文本、图像、音频等多种数据类型,为知识生产提供了更为丰富与精准的输入,从而促进了创新知识的生成。

  1) 应能够明确知识生产的具体目标,包括但不限于提升特定领域知识的覆盖率、增强知识的时效性与准确性、促进跨领域知识的融合与创新等。目标需紧密结合企业实际业务需求,确保知识生产活动有的放矢;

  2) 宜能够基于原有知识内容进行更新,形成新的版本知识内容,并支持查询历史版本内容,标注更新部分;

  3) (图像类知识、视频类知识场景)应充分利用多模态模型的优势,设计有效的数据融合策略,确保文本、图像、音频等多种模态的数据能够相互补充、协同作用, 以更全面的视角理解和生成知识;

  4) 应建立有效的持续学习与迭代优化机制,不断引入新的数据、优化模型结构、调整训练策略,以适

  T/ISC 0101—2026

  应知识领域的快速发展与变化;

  5) 应支持知识的归纳和演绎,根据业务场景通过多种技术方式,例如聚类分析、关联规则挖掘、逻辑推理、因果推理、类比推理等,从已知知识中生成新知识;

  7 知识库资源管理能力

  7.1 知识存储

  知识存储是指系统能够将结构化和非结构化的知识内容以高效、安全的方式存储起来,以便于后续的检索、分析和应用。这一能力要求系统提供可靠的数据持久化机制,包括数据备份、恢复和迁移等。

  1) 应基于知识库中存储的知识数据类型(如文本、图像、音频、视频等),设计并构建支持多模态数据高效存储的架构。该架构应确保不同类型数据间的关联性与互操作性,便于后续的多模态检索与分析;

  2) 应制定并实施针对性的数据预处理策略,包括数据清洗、格式转换、特征提取等,以确保输入数据符合模型训练与推理的需求;

  3) 应支持知识的动态更新、修改与删除,同时建立版本管理机制,记录每次知识更新的内容、时间及原因,确保知识的时效性与准确性;

  4) 应支持对知识内容进行定期备份,防止数据丢失;

  5) 应建立完善的数据加密、备份与恢复策略,以及基于角色的访问控制机制,确保多模态数据的安全存储与合法访问;

  6) 为提高存储效率并降低存储成本,宜采用先进的数据编码与压缩技术,对多模态数据进行预处理;

  7) 应支持使用缓存技术,减少对存储系统的访问压力。

  8) 宜支持对知识数据的访问进行审计,记录数据的登录历史、使用情况等。

  9) 应能够基于访问频度与业务时效,对知识资产实施冷热分层存储,将公司级高频访问内容固化于向量数据库,实现毫秒级语义检索,将历史文档归档至低成本对象存储,并依据“ 18个月过期清理 ”策略自动退役。

  7.2 知识融合强化

  知识智能融合是指系统能够将来自不同来源和模态的知识内容进行整合和融合,形成统一的知识表示。这一能力要求系统提供数据融合、实体对齐和关系映射等技术, 以实现知识的深度整合。

  1) (图像类知识、视频类知识场景)应基于本体论和语义网技术,构建统一的知识表示框架,用于整合来自不同来源和模态的知识内容;

  2) (图像类知识、视频类知识场景)应对多模态数据进行预处理,包括数据清洗、格式转换、特征提取等,使用实体识别和消歧技术,对不同数据源中的相同实体进行对齐,以确保数据的质量和一致性。

  3) 宜支持使用关系抽取技术,识别不同数据源中的相同关系。

  4) (图像类知识、视频类知识场景)应应用先进的融合算法与技术,如深度学习、知识图谱、图神经网络等,以实现多模态知识的有效融合,捕捉不同模态数据间的内在联系,生成更加丰富和准确的知识表示。

  5) 宜支持对不同数据源中的实体进行相似性评估,识别相同实体。

  6) 应支持对疑似相同实体进行人工或自动的消歧,确定实体的身份。

  7) 应支持对不同数据源中的关系进行识别和映射,形成统一的关系表示。

  T/ISC 0101—2026

  8) 应支持对关系的变更历史进行跟踪, 以反映关系的最新状态。

  9) (图像类知识、视频类知识场景)在多模态模型的应用过程中,应实施知识对齐与映射策略,以消除不同模态知识间的语义鸿沟,包括但不限于文本与图像之间的视觉语义对齐、音频与文本之间的语音语义映射等;

  10) (图像类知识、视频类知识场景)宜利用多模态模型强化跨模态推理与解析能力,实现不同模态知识间的深度关联与理解,包括但不限于文本与图像的关联推理、音频与视频的同步解析等,以提供更加全面和深入的知识服务

  7.3 知识智能监控

  知识智能监控是指系统能够对知识库中的知识内容进行实时或定时监控和分析,以发现知识的变化趋势、异常模式和潜在风险。这一能力要求系统提供数据监控、异常检测等技术,以实现知识的动态管理。

  1) (图像类知识、视频类知识场景)应根据多模态数据的特性设计监控方案,应充分认识到多模态数据(包括文本、图像、语音等)在知识库中的重要作用,并根据数据特性设计监控方案,监控方案应能够全面覆盖知识库中的所有模态信息,确保信息的完整性和准确性;

  2) 应根据知识库内容的变动情况,建立实时或定时更新与验证机制,通过大模型对新知识进行快速识别和分类,确保知识库内容的时效性和准确性。同时,对更新后的知识进行验证,防止错误信息的引入。

  3) 应支持对知识库中的数据进行访问频率分析,识别热门和冷门知识。

  4) 宜支持对知识库中的数据进行访问模式分析,识别用户的偏好和需求。

  5) 宜支持对知识库中的数据进行异常检测,识别不符合预期的数据。

  6) 宜在知识库中建立异常检测与报警系统,通过多模态模型对知识库中的异常信息进行实时检测,一旦发现错误或潜在风险,立即触发报警机制,确保知识库的安全性和稳定性;

  7) 应支持对知识库中的数据进行异常原因分析,确定异常的根本原因。

  8) 企业应严格遵守数据隐私与安全的相关规定,通过加密、访问控制等技术手段,确保用户数据的安全性和合规性。同时,对模型的安全性进行持续评估和优化,防止潜在的安全风险;

  9) 应定期对知识智能监控方案进行评估与优化。通过收集用户反馈、分析数据指标等方式,评估监控方案的实施效果。

  7.4 知识图谱搜索

  知识图谱搜索是指系统能够对知识图谱中的知识实体、关系和属性进行高效的检索和查询。

  1) (图像类知识、视频类知识场景)应利用多模态嵌入模型(Multimodal Embedding Model)直接对文字与图像生成嵌入,并在单一的向量空间中保存生成的嵌入向量数据,以简化集成复杂性并提高检索精度;

  2) 应实现基于多模态数据的知识检索功能,包括但不限于文本、图像、视频和音频等多种类型数据的输入和输出;

  3) 宜具备跨模态关联搜索能力,能够根据查询内容,检索并关联其他模态;

  4) 宜能考虑多模态数据之间的关联性,实现跨模态索引,支持基于任意模态的查询

  5) 应具备智能搜索功能,可通过输入关键词、短语或问题,准确匹配用户意图与相关知识,并返回最相关、最准确的知识节点或知识路径;

  6) 宜具备个性化搜索能力,能够根据用户的历史行为和偏好提供定制化的搜索结果;

  T/ISC 0101—2026

  7) 应当实时跟踪并更新知识图谱中的变化,确保使用者获取到的是最新、最准确的知识信息;

  8) 应提供搜索结果优化机制,包括但不限于结果排序、相关性评估和用户反馈学习;

  9) 应确保知识图谱搜索系统的数据安全,保障用户隐私信息,防止数据泄露和滥用。

  7.5 知识质量评估与优化

  知识质量评估与优化是指系统能够对知识库中的知识内容进行质量控制、评估,并进行知识库内容优化,确保知识的准确性、完整性、一致性和可靠性,并保障知识库质量不断提升。这一能力要求系统提供质量指标、评估模型和改进建议等技术, 以实现知识的持续优化。

  1) 应制定明确的知识质量评估标准,包括但不限于知识的真实性、完整性、时效性、可用性、易用性等;

  2) 宜支持使用质量评估模型,如机器学习模型、规则引擎等,对知识质量进行评估。

  3) 宜支持使用质量评估模型的优化技术,提高评估的准确性和鲁棒性。

  4) 宜支持使用质量评估模型的解释技术,以便于用户理解和解释评估结果。

  5) 应对知识库中的知识内容进行定期评估,确保其符合既定的质量标准。评估频率应根据知识更新的速度和重要性确定;

  6) 应在自动化评估工具中集成用户反馈机制,收集用户对知识内容的意见和建议,作为评估和优化的重要依据;

  7) 宜根据质量评估的结果,不断调整和优化多模态模型,提高其生成和处理知识的能力;

  8) 宜定期对多模态模型进行审计,确保其在训练和应用过程中没有偏见和歧视,维护模型的公平性和透明性;

  9) 宜支持智能评估与算法模型结合,包括但不限于基于贝叶斯估计的知识评估、基于D-S证据理论的知识评估、基于图模型的知识评估等,对于知识的可信度、正确性、结构稳定性等进行评估;

  8 知识库服务能力

  8.1 文本类知识

  8.1.1 知识库问答

  交互对话能力指的是系统能够以对话的形式与用户进行交互,理解用户的自然语言输入,并提供相应的知识内容。这要求系统具备自然语言理解、对话管理、语言生成等能力,以实现自然、流畅的对话体验。

  1) 应支持对用户的自然语言输入进行解析和语义理解,识别用户的意图和关键信息并理解用户的隐含意图和上下文信息。

  2) 应支持对用户的输入进行情感分析,识别用户的情绪状态。

  3) 应确保启动时间和响应时间在合理范围内,实现上下文理解、反问、引导、推荐、多轮对话等交互能力,提供更加自然、流畅的交互过程应支持对话状态转移,根据对话的进展平滑地切换到不同的对话环节;

  4) 宜支持对话结束处理,优雅地结束对话并提供必要的总结或建议;

  5) 应支持使用自然语言生成技术,生成流畅、 自然的对话回复;

  6) 应支持根据对话上下文定制回复内容,确保回复的相关性和一致性;

  T/ISC 0101—2026

  7) 应支持多种语言的对话回复生成,满足不同用户的语言需求;

  8) 应支持敏感信息过滤,有效识别并屏蔽敏感问题,确保输出内容合法合规;

  9) 应支持知识的智能推理、自动创建等能力,能够基于用户的提问与反馈更新现有知识库,并不断优化对话模型;

  10) 应设置人工抽检、人工反馈、智能评估等监管机制,动态识别和修正系统中的算法偏见问题;

  11) 应根据用户的历史行为、查询记录、角色提供个性化的回答内容;

  8.1.2 文本处理

  1) 大模型应能够根据输入的提示或模板,生成高质量的文本内容,如自动摘要、文章撰写、对话生成等;

  2) 应利用大模型提供的文本编辑功能,实现文本的润色、简化、扩写等操作,提升文本的质量和适用性;

  3) 在使用大模型生成文本时,应确保生成的内容符合法律法规,避免敏感信息泄露和不当内容生成;

  4) 应在文本处理系统中集成多种分析功能,如情感分析、主题建模、关键词提取、命名实体识别(NER)等,以满足不同业务需求;

  5) 应开发或引入上下文管理机制,使大模型能够在多段文本中保持一致性,提高文本分析的连贯性和准确性。

  8.1.3 知识推理分析

  知识推理分析能力指的是系统能够对知识库中的知识进行推理和分析,发现新的知识关系和模式。这要求系统具备逻辑推理、因果分析、趋势预测等能力,以提供深入的知识洞察。

  1) 应支持使用规则引擎,根据预定义的规则进行知识推理;

  2) 宜支持对知识库中的数据进行因果关系分析,识别变量间的因果效应,并支持因果关系进行可视化展示和因果关系的稳定性进行评估;

  3) 应支持使用多种预测模型,如ARIMA、指数平滑和机器学习模型。

  4) 应支持对预测结果进行解释,提供预测的置信区间和潜在的风险因素。

  5) 宜实现基于知识图谱的知识问答与关联分析能力;

  6) 宜具备多模态知识图谱补全和推理功能,提高知识库的完整性和准确性;

  7) 应具备跨领域、跨模态的知识推理能力, 以提供更广泛的业务支持和服务范围;

  8) 宜支持对预测、分析结果、判断结果进行准确性评估,使用交叉验证等技术。

  8.1.4 智能推荐

  智能推荐能力指的是系统能够根据用户的行为、偏好和上下文信息,向用户推荐相关的知识内容。

  1) 应支持收集用户的行为数据,例如查询历史、浏览记录和互动反馈,进行用户行为分析,识别用户的兴趣和偏好,构建用户画像,整合用户的基本信息、行为数据和偏好标签。

  2) 应基于员工的职位、工作内容和历史行为,提供个性化的知识标签推荐,帮助员工及时发现有用信息,提升工作效率;

  3) 应支持对用户画像进行动态更新,反映用户的最新变化和需求;

  4) 应支持协同过滤、 内容推荐、深度学习推荐、多模态大模型推荐等智能推荐算法;

  5) 应支持使用基于内容的推荐算法,基于内容相似性进行知识推荐;

  T/ISC 0101—2026

  6) 宜支持使用混合推荐算法,结合多种推荐技术的优势;

  7) 宜能够对推荐内容提供简短的摘要以及推荐理由;

  8) 应支持对推荐结果进行用户反馈收集,用于优化推荐算法;

  8.1.5 内容智能生产

  内容智能生产能力指的是系统能够自动生成或编辑知识内容,以满足用户的需求。这要求系统具备内容生成、内容优化、 内容审核等能力, 以实现高效、智能的内容生产。

  1) 应能够根据输入提示、模板、大纲或草稿,生成不同类型的文本内容,如自动摘要、文章撰写等;

  2) 应能够对现有文本进行润色,提升文本的语言表达和专业性;

  3) 应能够根据需要,简化复杂文本或将简短文本扩展为更详细的描述,增强文本的适用性;

  4) 应建立内容审核机制,确保生成的内容符合语法规范,逻辑清晰,且具备较高的可读性和实用性;

  5) 应支持在内容生成过程中,对数据源进行准确性校验,并在生成结果中标明信息的来源和可信度;

  6) 应建立严格的审核机制,确保生成和编辑的内容符合相关法律法规和基本道德准则,避免敏感信息泄露和不当内容生成;

  7) 应集成用户反馈机制,收集用户的意见和建议,作为评估和优化的重要依据;

  8.1.6 文档处理

  文档处理能力指的是系统能够高效解析、提取、理解和生成文档内容,提升知识管理效率。

  1) 应能够从内部文档、报告、邮件等多渠道收集高质量的文档样本,确保数据的多样性和代表性;

  2) 应能够解析多种常见文档格式,如便携式文档格式(PDF)、文字文档文件(Word)、 电子表格文件(Excel)、演示文稿文件(PPT)等,确保不同格式文档的兼容性;

  3) 应能够从文档中高效提取关键信息,如标题、段落、表格、图表等,并将其转化为结构化数据;

  8.2 图像类知识

  8.2.1 图像识别和分析

  可以对图像内容进行理解和描述,识别图像中的物体、场景、人物等元素,并生成自然语言描述,帮助用户更好地理解图像内容。

  1) 应能够依据自身的业务场景和具体需求选择或开发相应的图像识别模型。该模型应能有效识别并分类特定领域的图像内容,包括但不限于产品、设备、人员、标志等,并根据业务需求对对象进行分类和标注;

  2) 应能够识别图像中的场景信息,包括但不限于办公环境、生产车间、户外场景等,并根据场景特征进行场景分类和描述;

  3) 应具备光学字符识别(OCR)能力,能够从图像中提取文字信息,并将其转换为可编辑的文本格式,以便后续处理和分析。

  T/ISC 0101—2026

  4) 宜能够理解图像中的语义信息,包括但不限于对象的属性、关系、行为等,并结合上下文进行语义推理;

  5) 宜能够识别图像中的情感信息和潜在意图,包括但不限于人脸表情、肢体语言、场景氛围等;

  6) 宜能够通过图像分析推理出潜在的意图信息,例如用户行为意图、场景发展趋势等,以支持更高层次的决策;

  7) 宜能够通过多模态数据进行跨模态推理,例如结合图像和文本信息推断出更丰富的语义内容;

  8.2.2 图文知识图谱构建

  建立包含文本和图像信息的知识图谱,支持更深层次的知识发现和推理。

  1) 应采用标准化的知识表示方法(如 RDF、OWL 等)对图像和文本知识进行结构化表示,以支持知识图谱的构建。

  2) 应能够将图像和文本知识融合到统一的知识图谱中,并确保知识的一致性和完整性。

  3) 宜支持基于知识图谱的推理能力,例如通过图像和文本的关联推理出新的知识或关系。

  4) 应提供知识图谱的可视化功能,支持用户直观地查看和理解图像和文本之间的关联关系。

  8.2.3 多模态搜索

  1) 应支持用户通过上传图像进行搜索,根据图像内容识别关键特征(如对象、场景、颜色等),并返回与之相似的图像资源;

  2) 应支持图文关联互译功能,通过输入文本关键词来搜索相关的图像,或通过上传图像来搜索相关的文本描述;

  3) 应支持用户通过输入关键词进行搜索,系统能够将文本信息与图像库中的标签、描述或语义信息进行匹配,返回相关图像资源;

  4) 宜支持基于知识图谱的多模态检索功能,例如通过图像检索相关文本,或通过文本检索相关图像。

  5) 宜支持用户同时使用图像和文本进行联合搜索,系统能够综合图像内容和文本信息,返回更精准的匹配结果;

  6) 应具备高效的图像特征提取能力,能够将图像转换为高维向量表示,以便进行相似度计算和匹配

  7) 应采用相似度计算算法(如余弦相似度、欧氏距离等),确保图像匹配结果的准确性和可靠性;

  8) 宜能够根据匹配度、相关性或其他业务规则对搜索结果进行排序,确保用户能够优先获取最相关的图像资源

  8.2.4 图像优化和创作

  通过技术手段提升图像质量,以及利用多模态模型生成或修改图像内容,利用自动化工具和算法来创造新的视觉内容,或是对现有图像进行创意性修改。

  1) 应具备图像质量、分辨率、特征增强等自动和手动的调节能力,调节图像在视觉上的清晰度和美观度;

  2) 应支持对现有图像进行编辑,包括但不限于裁剪、旋转、添加滤镜、修改内容等操作;

  3) 应能够将多张图像或图像与文本、音频等模态数据进行融合,生成新的图像内容;

  4) 应能够根据文本描述或其他模态输入生成符合业务需求的图像,例如生成产品设计图、广告素材等;

  T/ISC 0101—2026

  5) 宜能够将特定艺术风格迁移到目标图像上,例如将油画风格应用于产品设计图;

  6) 应支持基于文本、音频等多模态输入进行图像创作,例如根据语音描述生成图像或根据文本生成广告素材;

  7) 宜能够通过多模态数据进行跨模态创作,例如结合图像和音频生成动态视觉内容。

  8.2.5 图文内容推荐

  通过算法和模型自动识别用户兴趣,并据此向用户提供相关联的文字与图像组合内容。

  1) 宜能够根据用户的历史行为、偏好等信息构建用户画像,以支持个性化推荐;

  2) 宜支持基于用户输入的图像、文本等多模态数据进行需求分析,例如根据用户上传的图像或输入的文本推荐相关资源;

  3) 宜具备高效的图像和文本特征提取能力,能够将图像和文本转换为高维向量表示,以便进行相似度计算和匹配;

  4) 宜引入个性化推荐功能,根据用户的兴趣和行为习惯,动态调整展示给用户的图文知识图谱内容;

下载地址
T/ISC 0101-2026 基于大模型的企业级 AI 知识库能力要求资源截图