基于定量结构-活性关系预测苯及其衍生物的立即威胁生命或健康的浓度
Prediction of concentration immediately dangerous to life or health of benzene and its derivatives based on quantitative structure-activity relationship作者机构:常州大学安全科学与工程学院江苏常州213164 天地(常州)自动化股份有限公司江苏常州213015
出 版 物:《环境与职业医学》 (Journal of Environmental and Occupational Medicine)
年 卷 期:2023年第40卷第9期
页 面:1033-1038页
核心收录:
学科分类:100405[医学-卫生毒理学] 1004[医学-公共卫生与预防医学(可授医学、理学学位)] 10[医学]
主 题:定量结构-活性关系 立即威胁生命或健康浓度 近邻传播聚类算法 人工神经网络 预测
摘 要:[背景]随着工作场所危化品暴露的增多,员工的职业健康伤害和职业安全事故频发,危化品职业接触限值的获取迫在眉睫。[目的]为了获取更多未知的立即威胁生命或健康的浓度(IDLH),探索定量结构-活性关系(QSAR)预测研究方法应用于IDLH的情况,从而为评估与防控职业健康伤害提供一定的理论依据和技术支持。[方法]本文运用QSAR将50种苯及其衍生物的IDLH与化合物的分子结构关联起来并展开预测研究。首先应用近邻传播聚类算法对样本集进行聚类划分,随后运用Dragon2.1软件计算并预筛出537种分子描述符,然后运用遗传算法筛选出的6个特征分子描述符作为应变量,分别构建了多元线性回归模型(MLR)以及支持向量机(SVM)与人工神经网络(ANN)两种非线性模型。最后,采用内、外验证评估模型的性能并绘制Williams图确定模型的适用范围。[结果]ANN模型训练集和测试集的R^(2)分别为R^(2)_(train)=0.8526和R^(2)_(test)=0.8505,均方根误差(RMSE)=0.5243、平均绝对误差(MAE)=0.4610,内、外验证系数:Q1002=0.8476、Q^(2)_(ext)=0.8905。经比较,ANN模型各性能验证参数均优于MLR和SVM模型,且所有物质均在应用域之内。[结论]目前,ANN模型具备最好的拟合能力、稳定性、预测性,适用于预测苯及其衍生物的IDLH。通过QSAR的方法预测苯及其衍生物的IDLH值是一种有效方法,为职业健康与安全的发展提供了一定的理论依据和技术支持。