当前位置: 首页 电子通信 电子信息 基于互译特征词对匹配的老-汉双语句子相似度计算方法研究

基于互译特征词对匹配的老-汉双语句子相似度计算方法研究

收藏
  • 大小:1.35 MB
  • 语言:中文版
  • 格式:PDF文档
  • 类别:电子信息
关键词:双语   匹配   句子   相似   特征

资源简介

句子相似度的计算在自然语言处理的各个领域有很广泛的应用,但跨语言的句子相似度计算方法却非常少。文中提出一种基于互译特征词对匹配,构建老-汉双语句子相似度计算方法,改进了传统的依赖于词形词序通过计算相同词个数和共有单词的位置信息的相似度计算方法,充分考虑了老挝语和汉语句子中的词汇互译信息、相似概率,避免了由于特征词位置导致的精度丢失。此方法用来最终识别相似度较高的老-汉双语平行句对,依据相似度对源句子和目标句子进行对齐,在老-汉双语平行语料库的建设中使用。实验结果表明,此方法在一定程度上提高了老-汉双语句子相似度计算的准确率。
  • 资料为PDF文档格式.
  • 本文档关键词:双语,匹配,句子,相似,特征
  • 下载地址