当前位置: 首页 电子通信 电子信息 俄汉平行语音语料库词性标注一致性检查方法

俄汉平行语音语料库词性标注一致性检查方法

收藏
  • 大小:1.29 MB
  • 语言:中文版
  • 格式:PDF文档
  • 类别:电子信息
关键词:语料库   词性   标注   平行   语音

资源简介

俄汉平行语音语料库在语言学研究、跨文化交流、语言工程等领域具有广泛的应用价值,为此,提出一种俄汉平行语音语料库词性标注一致性检查方法,确保语料库中词性标注的准确性和统一性,提高俄汉平行语音语料库词性标注质量,提升处理俄汉双语任务的效率,为后续的语言研究、机器翻译等应用提供可靠的数据基础。利用双向循环神经网络识别语料库中的俄汉平行语音,将语音数据转变成文本数据,形成俄汉平行文本;通过隐马尔可夫模型获取俄汉平行文本词性标注集合,利用维特比算法求解最优词性标记序列,实现对俄汉平行文本的词性标注;依据聚类思想,采用重心聚类算法判断俄汉平行文本的词性标注是否一致,从而实现俄汉平行语音语料库词性标注的一致性检查。实验结果表明,所提方法可以有效实现俄汉平行语音语料库词性标注一致性检查,具有较好的准确性和可靠性。
  • 资料为PDF文档格式.
  • 本文档关键词:语料库,词性,标注,平行,语音
  • 下载地址