咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >融合材料领域知识的数据准确性检测方法 收藏

融合材料领域知识的数据准确性检测方法

Detection Method on Data Accuracy Incorporating Materials Domain Knowledge

作     者:施思齐 孙拾雨 马舒畅 邹欣欣 钱权 刘悦 SHI Siqi;SUN Shiyu;MA Shuchang;ZOU Xinxin;QIAN Quan;LIU Yue

作者机构:上海大学材料基因组工程研究院上海200444 上海大学材料科学与工程学院上海200444 上海大学计算机工程与科学学院上海200444 上海大学上海市智能计算系统工程技术研究中心上海200444 之江实验室杭州311100 

出 版 物:《无机材料学报》 (Journal of Inorganic Materials)

年 卷 期:2022年第37卷第12期

页      面:1311-1320,I0001-I0005页

核心收录:

学科分类:081704[工学-应用化学] 08[工学] 081104[工学-模式识别与智能系统] 0817[工学-化学工程与技术] 0805[工学-材料科学与工程(可授工学、理学学位)] 0811[工学-控制科学与工程] 

基  金:国家重点研发计划(2021YFB3802101) 国家自然科学基金(52073169) 之江实验室科研攻关项目(2021PE0AC02)。 

主  题:机器学习 材料科学 数据质量 领域知识 

摘      要:材料数据由于小样本、高维度、噪音大等特性,用于机器学习建模时常常会产生与领域专家认知不一致的结果。面向机器学习全流程,开发材料领域知识嵌入的机器学习模型是解决这一问题的有效途径。材料数据的准确性直接影响了数据驱动的材料性能预测的可靠性。本研究针对机器学习应用过程中的数据预处理阶段,提出了融合材料领域知识的数据准确性检测方法。该方法首先结合材料专家认知构建了材料领域知识库。然后,将其与数据驱动的数据准确性检测方法结合,从数据和领域知识两个角度对材料数据集进行基于描述符取值规则的单维度数据正确性检测、基于描述符相关性规则的多维度数据相关性检测以及基于多维相似样本识别策略的全维度数据可靠性检测。对于每一阶段识别出的异常数据,结合材料领域知识进行修正,并将领域知识融入到数据准确性检测方法的全过程以确保数据集从初始阶段就具有较高准确性。最后该方法在NASICON型固态电解质激活能预测数据集上的实验结果表明:本研究提出的方法可以有效识别异常数据并进行合理修正。与原始数据集相比,基于修正数据集的6种机器学习模型的预测精度都有不同程度的提升。其中,在最优模型上R2提升了33%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分