ICS 03.080 CCS A 10
SB
中华人民共和国国内贸易行业标准
SB/T 11269—2026
数字员工技术要求客户服务
Technical requirements for digital employees——Customer service
2026-01-12 发布 2026-07-01 实施
中华人民共和国商务部发布
前言
本文件按照GB/T 1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由数字商务行业标准化技术委员会(SW/TC 7)归口并解释。
本文件起草单位:中国标准化研究院、中国国际电子商务中心、浙江工商大学、蚂蚁科技集团股份有限公司、北京交通大学、长兴县质量技术监督检测中心、诸暨市市场监督管理局、滇西应用技术大学、湖北华中电力科技开发有限责任公司、诸暨市大数据发展有限公司、杭州石方信息科技有限公司。
本文件主要起草人:孙兆洋、吴功兴、毛郁欣、索昕煜、隋媛、宗琪、孟唯一、郭召芬、李欣欣、叶韪铭、徐佳、倪志伟、冯铁江、吴铭宇、方磊、任爽、段蕊、宋卓颖、刘学亮、王爱丽。
本文件及其所代替文件的历次版本发布情况为:
——本文件为首次发布。
数字员工技术要求客户服务
1 范围
本文件确立了数字员工客户服务能力框架,规定了数字员工客户服务的信息识别能力、认知能力、交互能力以及基础保障能力。
本文件适用于计划提供数字员工客户服务的组织改进和提升自身的服务能力,也适用于数字员工客户服务的需求方选择数字员工客户服务。
2 规范性引用文件
本文件没有规范性引用文件。
3 术语和定义
下列术语和定义适用于本文件。
3.1
数字员工 digital employee
利用数字化、智能化技术模拟人类员工的业务行为,具备交互、认知、决策、学习和服务能力的软件系统。
3.2
数字员工客户服务 digital employee customer service
应用数字员工(3.1),关注客户需求,通过信息识别、认知以及交互,帮助和服务客户的能力。
4 数字员工客户服务能力框架
数字员工客户服务能力框架(见图1)包括:
a) 信息识别能力:数字员工所具备的对自然语言、图像、语音、视觉信息以及文档等信息获取、解析等客户服务能力;
b) 认知能力:数字员工所具备的理解、决策、学习等客户服务能力;
c) 交互能力:数字员工所具备的应答、反馈等客户服务能力;
d) 基础保障能力:数字员工所具备的保障客户服务基本功能的能力。
图1 数字员工客户服务能力框架
5 信息识别能力
5.1 自然语言处理
5.1.1 语义理解
用于支持数字员工对用户输入话语的深层含义进行识别、解释和推理,可实现功能包括但不限于:
a) 支持简称、别称、代码的理解;
b) 支持对常见错别字的自动纠正;
c) 支持语义关系理解,包括部分与整体、地理位置、因果、时序、近义等关系。
5.1.2 意图识别
用于支持数字员工识别用户提问的目的或需求,可实现功能包括但不限于:
a) 根据用户的提问以及上下文的语境,识别出用户咨询的意图;
b) 信息过滤;
c) 信息预处理,如信息纠错、图片识别等;
d) 基于分词结果,结合知识库进行搜索召回和粗排。
5.2 图像识别
5.2.1 图片文本识别
可采用光学字符识别技术将图片类消息转化为可使用的文本。
5.2.2 图像处理
用于支持对用户上传或关联的图像信息进行自动化处理和解析,并基于图像特征进行决策或反馈。图像处理可实现的功能包括但不限于:
a) 图像语义分割;
b) 图像质量评估;
c) 图像场景理解。
5.2.3 图片内容识别
用于支持对图片中的视觉信息进行分析和理解,提取语义内容、对象、场景、特征等信息,实现对图片内容的识别、分类、标注或理解。
5.3 语音识别
用于支持用户语音输入的文本转换,可实现的功能包括但不限于:
a) 端点检测;
b) 说话人身份识别;
c) 方言识别;
d) 语种识别;
e) 混合语言识别;
f) 情感识别。
5.4 视觉识别
5.4.1 人脸识别
宜支持视觉人脸感知,用于对用户进行基于面部识别的身份验证。
5.4.2 视觉目标识别
用于支持视觉目标检测,识别图像或视频中的各类目标物体,并进行分类和定位。
5.5 富媒体信息解析
宜具备接收和处理用户发送的文本、语音、图片、视频等多媒体消息的能力。
6 认知能力
6.1 身份识别
宜具备可正确识别用户身份的能力,识别方式包括但不限于:
a) 人脸识别;
b) 指纹识别;
c) 短信验证码;
d) 密码。
6.2 对话理解
6.2.1 单轮对话
宜具备单轮对话的能力,数字员工不依赖上下文语境,可正确识别用户意图并提供正确解答。单轮对话宜实现的功能包括但不限于:
a) 基于语义相似度算法匹配用户问题与知识库;
b) 结合上下文关键词提取和实体识别技术。
6.2.2 多轮对话
当用户需求复杂或提问不清时,数字员工宜通过多轮询问、澄清或确认等方式收集多维度信息,为用户提供解答。多轮对话宜实现的功能包括但不限于:
a) 支持构建多轮对话测试数据集;
b) 多轮对话的每一轮次均应提供符合用户需求的有效信息,并在对话结束时,通过用户反馈或系统自检机制评估解答的准确性和完整性。
6.2.3 多语言交互
宜具备多语言、多语种交互能力,包括但不限于:
a) 支持多语言交互,可通过机器翻译自动进行双语转换,且译文可理解度高;
b) 构建多种方言、外语测试数据集,通过接口批量获取翻译结果。
6.2.4 话术管理
宜具备用户交流对话模板的规划、维护与优化能力,宜满足的要求包括但不限于:
a) 构建符合业务需求和用户体验的对话流程框架;
b) 根据用户问题的性质和复杂度,制定分类规则和自动路由策略;
c) 针对一般性问题构建标准化回复;
d) 针对场景化话术设计个性化的对话模板;
e) 定期评估、修订话术库,紧跟业务变化及用户需求。
6.3 文档知识库
通过文档解析、大数据存储、向量化、自然语言语义理解等技术手段,实现的文档检索和知识问答,功能包括但不限于:
a) 支持 txt、word、excel、pdf、图片等非结构化文档格式;
b) 支持文档智能切分,同时支持按照目录、分隔符等不同切分规则进行切分;
c) 支持不同场景可以设置不同的精度阈值;
d) 支持向量检索、ES、FAQ 多种检索模式;
e) 支持问答返回结果进行知识库溯源;
f) 支持知识库进行版本控制,能够设置不同版本的启用状态。
6.4 排队策略
宜具备对顾客或用户等待接受服务顺序进行优化管理的能力,包括但不限于:
a) 能够根据用户等级、问题紧急程度、服务历史等因素,动态调整服务优先级;
b) 能够基于历史数据预测高峰期,提前调配资源。
6.5 智能推荐
6.5.1 用户辅助
用于支持为用户提供的辅助功能和工具,可实现的功能包括但不限于:
a) 多渠道接入;
b) 智能搜索;
c) 转人工服务。
6.5.2 座席辅助
用于支持为人工客服提供的辅助工具和功能,可实现的功能包括但不限于:
a) 自动回复;
b) 知识库访问。
6.6 人机协作
宜具备与人工操作员协作的能力,进行任务分配、信息同步等,包括但不限于:
a) 辅助人工进行信息提供与决策;
b) 当用户问题超出处理能力范围时,可转接到人工,同时传递已收集到的信息;
c) 自动创建和分配服务工单给相应部门或个人,跟踪处理进度。
6.7 自动化操作能力
宜具备与业务系统、作业系统无缝衔接的自动化操作能力,包括但不限于:
a) 支持与主流业务系统集成,包括但不限于客户关系管理系统、工单系统等;
b) 自动化操作范围需覆盖客服场景中高频、重复性任务,例如工单流转、数据查询更新、订单处理、信息同步等;
c) 满足业务实时性需求,高并发场景下保持操作效率稳定,避免任务延迟或堆积;
d) 支持快速接入新业务系统及场景,提高不同业务场景下的可扩展性和泛化性;
e) 在系统集成过程中,应遵循通用的接口协议标准,确保不同系统之间数据交互的准确性。
6.8 敏感信息处理
宜具备自动识别和处理用户交互过程中涉及的敏感信息或不当言论的能力。敏感词检测要求包括但不限于:
a) 配备实时敏感词监测机制;
b) 维护可动态更新的敏感词库;
c) 检测到敏感内容时,能快速响应并预警处理。
6.9 会话异常管理
宜具备对用户交互过程中出现的非正常状况进行识别、响应和处理的能力,包括但不限于:
a) 自动识别并屏蔽用户提供的敏感信息(如身份证号、银行卡号等),保障信息安全,识别并拦截垃圾信息、恶意刷屏等行为,通过关键词、语义分析等手段,及时发现并干预偏离正常轨道的对话;
b) 宜具备会话异常管理的能力,以应对会话过程中出现断线、断网等异常情况;
c) 宜实时保存交互记录,并判断异常原因,尝试重连。当重新联系上用户,宜能够接续出现异常前的话题;
d) 在会话过程中,中断提问或回复时,系统应检测会话时长异常,主动对用户进行提醒或询问;示例:如“您还在吗?”“您的问题得到解决了吗?”。
e) 在会话过程中,关闭网络连接时,系统应检测会话网络异常、时长异常,并尝试重新连接,如切换渠道;
f) 会话重新连接后应能接续断点记录。
6.10 智能质检
宜具备对客户服务的交互内容进行自动化质量检测的能力,包括但不限于:
a) 合规审查;
b) 客情检测;
c) 风险控制;
d) 综合分析。
注:智能质检是利用语音识别、语义分析等技术对客户服务交互内容(包括文本、语音、图片等) 进行自动化质量检测,包括合规性审查、服务效果评估等。
6.11 多渠道接入策略
宜为用户提供多种接入渠道。
注:接入渠道的例子可包括电话、短信、桌面网站、移动网站、APP、小程序、公众号和邮件等。
6.12 报表分析
宜具备自动生成、分析和导出业务数据报表的能力,包括但不限于:
a) 实时生成可视化报表;
b) 自动生成报表结果并生成文档。
7 交互能力
7.1 信息质量
客户服务提供信息的质量宜包括但不限于:
a) 提供信息完整,排版组织统一有序;
b) 信息内容与用户问题高度契合;
c) 全面覆盖用户关注点。
7.2 应答能力
应具备符合以下要求的应答能力:
a) 客户服务的应答时限最长为 15s;
b) 人工服务的应答时限最长为 15s,人工服务的应答率≥85%。
注1:数字员工客户服务的应答时限指用户拨号完毕后,自听到回铃音起,至数字员工应答所需要的时间。
注2:人工服务的应答时限指自用户选择人工服务后,至人工话务员应答所需要的时间。
注3:人工服务的应答率指用户在接入客户服务后,实际得到人工话务员应答服务次数和用户选择人工服务总次数之比。
7.3 语音交互能力
通过集成的语音识别、处理、理解和合成等技术,实现通过音频交互与用户沟通,包括但不限于:
a) 宜支持接收、识别和处理用户发送的语音消息;
b) 音频文件转录文本;
c) 管理和检索语音交互数据。
d) 支持将文本转换为相应的语音信号,可实现的功能包括但不限于:
——多音色合成;
——多方言合成;
——混合语种合成;
——多语种合成;
——多语气合成;
——多格式数据合成。
7.4 人工支持
宜具备转接人工客服的能力,包括但不限于:
a) 主动提供转接人工服务;
b) 支持与人工客服共享对话历史和用户信息;
c) 支持将人工客服经验转化为知识库内容,供小模型学习和扩充语料库;
d) 支持结合客服算法对高频问题进行搜索和精排。
7.5 虚拟人形象
7.5.1 虚拟人形象类型
虚拟人形象是数字员工智能客服外在展示的核心载体,宜根据不同的场景和需求适配不同的形象类型,主要类型包括:
a) 2D 卡通;
b) 2D 拟真人;
c) 3D 拟真人:
d) 3D 超写实;
e) 3D 半写实;
f) 3D 卡通:包括动物、拟人化设计物等。
7.5.2 虚拟人形象构建
虚拟人形象构建方式包括但不限于:
a) 2D 类形象:包括视频/照片机器学习建模、AI 捏脸换脸建模(生成、组合或已有人脸建模)等;
b) 3D 类模型:包括人工建模、AI 捏脸建模(照片或参数调整方式)等。
7.6 增强现实技术服务
宜具备强现实技术(Augmented Reality,AR)功能。对于应用场景,宜允许用户通过AR功能进行互动,如通过虚拟模型展示产品特性或解决方案演示。
7.7 大模型对话
利用通用文本大模型的语义理解能力,结合行业专业知识,提高数字员工智能客服的理解能力和回答问题的精准度,可实现的功能包括但不限于:
a) 支持进行人设角色、情感及性格的设置;
b) 支持进行多轮对话,可基于上下文信息,进行信息补全,提供完整意图能力;
c) 支持利用大模型调用外部技能和接口能力,提高业务办理能力;
d) 支持对行业知识进行深度学习、监督微调、反馈增强多种训练模式,构建行业大模型。
7.8 共情能力
宜具备理解、识别和适当地回应用户情绪的能力,包括但不限于:
a) 互动人性化,交互过程中与真人无感知差异;
b) 如有情景需求,支持情感识别,理解用户情绪状态,以适当的情感表达回应;
c) 支持针对特殊群体(如老年人、残障人士等),提供无障碍交流支持和人性化帮助。
8 基础保障能力
8.1 安全隐私性
8.1.1 权限管理
具备管理和控制信息系统中用户的访问权限和操作权限的能力。
8.1.2 安全存储
具备保护数据安全性和交互合规性的能力。
8.1.3 隐私保护
具有确保用户个人信息和敏感数据得到充分保护和处理的能力,防止未经授权的访问、使用以及个人信息的泄露。
8.1.4 加密传输
具备通过加密算法对要传输的数据进行加密,及通过网络将加密数据传输给目标接收方的能力,确保数据传输过程中的安全性,防止数据泄露、篡改和删除。
8.2 系统成熟度
8.2.1 易用性
系统设计界面友好,功能齐全、操作便捷。易用性包括但不限于:
a) 响应时间短;
b) 界面清晰;
c) 操作简单;
d) 功能点显而易见;
e) 主要功能突出;
f) 无障碍引导用户使用业务流程。
8.2.2 可靠性
系统运行稳定、可信。可靠性包括但不限于:
a) 技术相关的可靠性;
b) 硬、软件及信息资源满足可靠性要求;
c) 容错能力;
d) 完善的安全管理体系;
e) 故障恢复功能;
f) 日志管理功能;
g) 容灾备份功能;
h) 更新功能。
8.2.3 主动性
与用户的每一轮交互结束后,主动询问问题是否解决或者是否还有其他需要帮助的问题。系统根据用户的回复做出的反应包括但不限于:
a) 用户回复已解决,系统表达感谢;
b) 用户回复未解决,系统会道歉并询问是否转人工客服或提供人工客服链接;
c) 用户回复无其他问题,系统将请用户对本次服务进行满意程度的评价。
8.2.4 支持多终端部署与应用
系统支持本地服务器和云端服务器等不同服务器部署,针对不同平台或设备具有可移植性和适应性,包括但不限于:
a) 移动设备,如智能手机,平板电脑;
b) 台式设备,如笔记本电脑,台式机;
c) 智能穿戴设备,如智能手表。
8.2.5 稳定性
系统在各种环境下均保持良好的运行状态,不出现频繁的崩溃或故障。
8.2.6 可维护性
系统可维护性包括但不限于:
a) 具有自动化运维技术;
b) 有运行监控,能快速定位系统运行问题。
参考文献
[1] GB/T 36464.3—2018 信息技术智能语音交互系统第3部分:智能客服
[2] GB/T 46483—2025 信息技术客服型虚拟数字人通用技术要求