基于决策树的藏语拉萨话三音子模型
Triphone models of Lhasa Tibetan based on decision tree作者机构:西北民族大学中国民族语言文字教育部重点实验室甘肃兰州730030
出 版 物:《计算机工程与科学》 (Computer Engineering & Science)
年 卷 期:2013年第35卷第9期
页 面:146-150页
核心收录:
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 08[工学] 081104[工学-模式识别与智能系统] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
基 金:国家自然科学基金资助项目(61262054) 西北民族大学中央高校基本科研业务费专项资金项目(zyz2011100)
主 题:藏语 拉萨话 大词表连续语音识别 隐马尔可夫模型 三音子模型
摘 要:对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。