基于K-L散度的int8量化方法研究与框架实现-南通市图书馆

文献详情 >基于K-L散度的int8量化方法研究与框架实现收藏

基于K-L散度的int8量化方法研究与框架实现

作者：钱源

作者单位：中国科学院大学(中国科学院人工智能学院)

学位级别：硕士

导师姓名：郭崎;孟小甫

授予年度：2020年

学科分类：08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程]

主题：神经网络执行框架神经网络量化方法 K-L散度 AI处理器

摘要：我们处在互联网的高速发展时期,计算机科学在生活中扮演着越来越重要的角色,人工智能AI(Artificial Intelligence),作为近几年计算机科学中最热门的分支,逐渐走进人们的日常生活,比如智能机器人、语音识别、图像识别、自然语言处理等。卷积神经网络(简称为神经网络)作为深度学习的重要研究手段,具有优秀的特征提取能力和抗噪声能力。同时,由于神经网络的复杂性,导致它对数据量、计算能力以及带宽的要求非常高。为了解决上述存在的问题,研究人员针对神经网络做了很多特殊的优化,优化手段包括压缩、编码和量化。作为常用的优化手段,量化在大多数神经网络中都取得了不错的结果。本论文的主要工作分为以下两个方面:(1)为了解决量化模型的精度损失问题,在传统int8量化方法的基础上,设计了基于K-L(Kullback-Leibler divergence)散度的int8量化方法。与传统的量化模型相比,通过K-L散度量化出来的int8模型具有更高的模型精度,适合应用于“AI医疗、“AI翻译、“目标识别等高精度的场景中;(2)本文在理解神经网络执行框架实现原理的基础上,对框架的功能进行拓展。根据软件设计的思想,在框架中实现了一个量化模块,专门用于量化float32模型。通过该模块,用户可以轻松地将float32模型转换成int8模型。在量化模块的内部,包含了在线量化模块和离线量化模块。对于在线量化模块来说,用户不用对代码进行任何修改就可以直接运行模型,验证int8量化后的结果。对于离线量化模块来说,本文提供了一套完整的离线量化方案,用户可以通过该方案直接生成离线模型。理想情况下,离线模型可以在不依赖任何框架的代码的情况下,独立运行。同时用户可以不用考虑框架和生产环境的差异,直接将离线模型集成到应用中,极大地简化了模型的部署和应用。本文中的int8量化方法和量化模块是一套完整的神经网络量化方案,对于发挥AI处理器低功耗、高并发计算的特点具有实际价值和意义。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于K-L散度的int8量化方法研究与框架实现

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于K-L散度的int8量化方法研究与框架实现

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：