咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >富媒体环境下语音和文本内容的对齐研究 收藏

富媒体环境下语音和文本内容的对齐研究

Research on the Alignment of Speech and Text Contents in Rich Media Environment

作     者:韦向峰 袁毅 张全 池毓焕 WEI Xiangfeng;YUAN Yi;ZHANG Quan;CHI Yuhuan

作者机构:中国科学院声学研究所 

出 版 物:《情报工程》 (Technology Intelligence Engineering)

年 卷 期:2019年第5卷第2期

页      面:17-27页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:富媒体数字出版内容组织与知识服务重点实验室开放基金项目(ZD2018-07/03):“面向语音与文本内容的富媒体关联研究与技术实现” 

主  题:富媒体 语音识别 锚点词 编辑距离 最长递增子序列 

摘      要:语音媒体和文本媒体是富媒体中重要的两种媒体,本文试图解决富媒体内容关联中语音和文本的自动对应和关联问题。本文通过自动语音识别、语音纠错处理、文本相似度计算等技术和方法,把语音和文本的对齐问题转化为文本之间相似和对齐的问题,通过从语音到文本、从文本到语音两种应用场景,用实验证明了该方法的可行性和有效性。本文的语音文本对齐技术将是富媒体融合特别是语音媒体和文本媒体之间进行融合的重要支撑技术,同时也为文本媒体和语音媒体的进一步关联重组和应用提供坚实的技术基础。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分