基于深度学习的分子识别和图像生成技术研究
作者单位:南京邮电大学
学位级别:硕士
导师姓名:何利文
授予年度:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:分子识别 分子图生成 长短时记忆网络 高效神经网络 流模型
摘 要:随着化学研究的不断发展,许多新的化学物质和化合物被发现和合成,这些发现为各种工业和科研领域带来了巨大的发展潜力。然而,科学家们每天都在产生大量的新化学物质,这些化学物质的结构知识对于理解其性质和功能至关重要。在传统的化学研究中,分子结构信息通常以图像形式储存在文献和专利中,这使得从这些资源中提取、整理和利用这些信息变得非常困难。手动识别和生成分子图像的方法非常耗时且容易出错。化学领域的专业人士需要花费大量时间和精力来识别分子结构,并将其转换为机器可读的形式。此外,由于分子结构可能非常复杂,包括多种原子、化学键和立体构型,人工识别方法在准确性方面可能受到限制。在这个背景下,有必要寻找一种更有效的方法来识别和生成分子图像。深度学习作为一种强大的机器学习技术,在图像识别、分类和生成等领域表现出了优越的性能。本文将深度学习应用于分子图像识别和生成领域,有助于推动化学研究及相关领域的进一步发展。在分子图像识别领域,本文构建了一种融合Efficient Net V2与混合注意力机制的LSTM模型(Eff Net V2+Atten_LSTM)。这个模型将Efficient Net V2应用于图像特征的抽取,同时结合混合注意力机制的LSTM部分生成文本,以达到准确且高效的分子图像识别。实验数据证实,该模型在验证集上取得了93.1%的准确率,远高于其他方法,从而证实了它在分子图像识别领域的优势。在分子图像生成环节,本文提出了一种整合双向LSTM、自回归图神经网络和基于流的生成模型的策略。通过融合双向LSTM、自回归图神经网络以及流模型,使用双向LSTM捕捉分子间的相互关系,引入自回归图神经网络学习分子的拓扑结构特征,采用基于流的生成模型使得生成过程更加高效,实现了对分子图像的高效准确生成。实验结果表明,该策略在生成分子的有效性、唯一性和新颖性方面表现出色,与其他生成模型相比取得了显著进步,同时生成分子与原分子属性以及目标属性都较为接近,展示了其在分子图像生成领域的巨大潜力。本文还详细阐述了一个分子翻译系统的开发和实现过程,涵盖了需求分析、系统设计和功能展示等方面。这个系统以本文提出的分子图像识别与生成方法为基础,实现了对分子图像的高效识别和生成。这将有助于推动化学领域的研究和应用,提升分子识别和转换的效率。本文为分子图像识别和生成领域带来了新的观念和技术,有利于进一步提高分子识别和生成质量,为化学研究及相关产业的发展提供支持。