藏语数词构造方法
作者机构:西藏信息化省部共建协同创新中心 西藏大学信息科学技术学院
出 版 物:《计算机仿真》 (Computer Simulation)
年 卷 期:2024年
学科分类:0501[文学-中国语言文学] 0304[法学-民族学] 0711[理学-系统科学] 03[法学] 05[文学] 050107[文学-中国少数民族语言文学(分语族)] 07[理学] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(62162057) 教育部人文社会科学研究项目(21YJCZH059)
摘 要:数词转写处理是语音合成技术中一项十分重要的基础性工作,是前端文本分析模块的首要任务之一,数词转写的结果直接关系到音素分析、字音转换、韵律标注等后续相关任务的有效处理,而目前为止鲜有针对藏语数词转写方面相对完整的研究报告。通过分析藏语数词的组成结构及表达方式,提出一种基于构造规则的藏语数词转写方案。实验结果表明,采用数词构造方法对纯数字符号转写成藏语数词的准确率达到99%以上,对2100个含各类数字符号的句子进行测试后,在实际文本中数词的转写准确率同样高达99%。