1.本技术涉及化学反应工艺优化和数据科学领域,特别是涉及基于机器学习的化学反应物配比优化方法。
背景技术:
2.本部分的陈述仅仅是提到了与本技术相关的背景技术,并不必然构成现有技术。
3.最优反应物配比是化工领域工艺优化的关键问题。化工生产中,出于成本及副反应等考量,最优反应物配比是指所有可能的反应物配比中,满足约束条件且反应目标最优的反应物配比方案,其中约束条件和反应目标则通常根据产率、能耗、成本以及产物品质等进行设定。由于反应物配比有效范围含大量不同的取值,因此最优反应物配比搜索空间巨大,通过测试此空间中所有配比的化学反应来选取最优配比在实践中是不现实的。目前,生产工艺中最优反应物配比的探究,通常由领域专家凭经验进行化学实验,根据实验效果确定最优配比。这种选定方式难以保证准确度,由此会影响到整个化学反应工艺体系与反应效果。
技术实现要素:
4.本发明的目的是解决现有技术的不足,提供一种数据驱动的化学反应物配比优化方法,该方法基于化学反应工艺历史数据建立反应物配比和目标工艺参量之间的关联模型,通过模型预测不同反应物配比对应的目标工艺参量,并通过数据样本更新和模型迭代,进而实现对海量反应物配比搜索空间的快速选优。
5.本发明所采用的技术方案是:
6.一种基于机器学习的化学反应物配比优化方法,其特征在于,包括确定反应条件与优化目标、数据采集、模型构建和模型迭代与样本优选4个步骤,具体为:
7.步骤1.确定反应条件与优化目标
8.确定反应条件集合及每个反应条件的有效取值范围,该反应条件集合包括所述反应物配比,根据反应条件集合及每个反应条件的有效取值范围设定反应条件搜索空间ω;确定优化目标参量g与优化条件c;
9.步骤2.数据采集
10.在搜索空间ω中选取n个数据样本,记为样本集x,其中每个数据样本为反应条件的一种组合,对任意样本x∈x,按照该样本对应的反应条件组合进行化学反应实验,采集该反应条件组合所对应的优化目标参量g(x),样本集x中所有样本对应的优化目标参量集合记为y,即y={g(x)|x∈x};根据优化条件c,在样本集x中选出最优样本记为标杆样本x
*
;
11.步骤3.模型构建
12.以样本集(x,y)作为建模数据集、y作为标签集,采用机器学习方法,建立优化目标参量的预测模型m;
13.步骤4.模型迭代与样本优选,此步骤包括以下分步骤:
14.(1)设样本空间ω中未经化学实验采集的样本的集合记为虚样本集合p,即:p=ω-x,对任意虚样本x∈p,将x输入预测模型m,计算其对应的优化目标参量值m(x),记集合q={m(x)|x∈p};
15.(2)根据集合q,在虚样本集合p中,根据m(x)选取满足优选约束c
′
的样本,记入优选样本集合x
*
,所述优选约束c
′
根据优化条件c设定;
16.(3)根据优选样本集合x
*
中的每个数据样本的反应条件组合分别进行化学实验,采集其对应的优化目标参量g,样本集x
*
中所有样本的优化目标参量集合记为标签集y
*
,根据优化条件c选取y
*
中最优者,设其对应的样本为x
′
,若x
′
比当前的标杆样本x
*
更优,则更新x
*
=x
′
;
17.(4)将优选样本集合x
*
纳入训练样本集x,将y
*
纳入训练标签集y,即:x
←
x∪x
*
,y
←
y∪y
*
;
18.重复步骤3和步骤4,直至连续k次循环标杆样本x
*
不再改变,则由当前标杆样本x
*
所对应的反应条件即可得到最优反应物配比。
19.本发明步骤1中所述优化目标参量与优化条件通常根据产率、能耗、成本以及产物品质等进行设定。
20.本发明步骤2所述的样本集x={x1,x2,...,xn},其中,任意数据样本xi=(a
i,1
,a
i,2
,...,a
i,k
),1≤i≤n,a
i,1
、a
i,2
、...,a
i,k
分别表示该数据样本所对应的k个反应条件,k为反应条件个数。
21.本发明步骤2所述的y={y1,y2,...,yn},其中yi为数据样本xi对应的优化目标参量值。
22.有益效果
23.与现有技术相比,本技术的有益效果是:
24.本技术提供了一种基于机器学习的化学反应物配比优选方法,此方法可大幅降低化学实验反应次数,缩短研发周期,为化学反应工艺优化提供了数据驱动的探究路径。
附图说明
25.构成本技术的一部分的说明书附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。
26.图1为本技术所述方法主要步骤流程示意图。
具体实施方式
27.如图1所示的基于机器学习的化学反应物配比优化方法,包括确定反应条件与优化目标、数据采集、模型构建和模型迭代与样本优选4个步骤,具体为:
28.步骤1.确定反应条件与优化目标
29.确定探究某一化学反应的最优反应物配比所涉及的反应条件集合及每个反应条件的有效取值范围,该反应条件集合包括所述反应物配比,根据反应条件集合及每个反应条件的有效取值范围设定反应条件搜索空间ω;确定优化目标参量g与优化条件c;所述优化目标参量与优化条件通常根据产率、能耗、成本以及产物品质等进行设定。
30.步骤2.数据采集
31.在搜索空间ω中选取n个数据样本,记为样本集x,x={x1,x2,...,xn},其中,任意数据样本xi=(a
i,1
,a
i,2
,...,a
i,k
),1≤i≤n,a
i,1
、a
i,2
、...,a
i,k
表示该数据样本的k个反应条件;对任意样本xi∈x,按照该样本所对应的反应条件组合进行化学反应实验,采集该反应条件组合对应的优化目标参量g(xi),样本集x中所有样本的优化目标参量集合记为y,即y={g(xi)|xi∈x};根据优化条件c,在样本集x中选出最优样本记为标杆样本x
*
。
32.步骤3.模型构建
33.以样本集(x,y)作为建模数据集、y作为标签集,采用机器学习方法,建立优化目标参量的预测模型m。
34.步骤4.模型迭代与样本优选,此步骤包括以下分步骤:
35.(1)设样本空间ω中未经化学实验采集的样本的集合记为虚样本集合p,即:p=ω-x.对任意虚样本x∈p,将x输入预测模型m,计算其对应的优化目标参量值m(x),记集合q={m(x)|x∈p};
36.(2)根据集合q,在虚样本集合p中,根据m(x)选取满足优选约束c
′
的样本,记入优选样本集合x
*
,所述优选约束c
′
根据优化条件c设定;优选约束c
′
可以为优化条件c中的一部分,也可以是根据优化条件c进行的更优的设定,优选约束c
′
的设定用于在优选过程中选出优选样本。
37.(3)根据优选样本集合x
*
中的每个数据样本的反应条件组合分别进行化学实验,采集其对应的优化目标参量g,样本集x
*
中所有样本对应的优化目标参量集合记为标签集y
*
,根据优化条件c选取y
*
中最优者,设其对应的样本为x
′
,若x
′
比当前的标杆样本x
*
更优,则更新x
*
=x
′
;
38.(4)将优选样本集合x
*
纳入训练样本集x,将y
*
纳入训练标签集y,即:x
←
x∪x
*
,y
←
y∪y
*
;
39.重复步骤3和步骤4,直至连续k次循环所获得的标杆样本x
*
不改变,则由当前标杆样本x
*
所对应的反应条件即可得到最优反应物配比。k为设定的阈值,例如k=5。
40.下面以酯交换反应合成三氟乙基碳酸甲酯(c4h5o3f3)反应为例,具体描述本发明的方法,此反应的反应物为碳酸二甲酯(c3h6o3)与三氟乙醇(c2h3f3o),催化剂为氢氧化钾(koh),需探究反应物c3h6o3与c2h3f3o的最优配比。
41.基于机器学习的反应物配比优化方法包括以下4个步骤:
42.步骤1.确定反应条件与优化目标
43.设探究酯交换反应合成三氟乙基碳酸甲酯(c4hso3f3)反应中最优反应物配比涉及3个反应条件变量:c2h3f3o质量、c3h6o3与c2h3f3o摩尔比值(简称酯醇摩尔比)及koh与c2h3f3o的质量比(简称钾醇比),设定此三个条件变量取值范围为:c2h3f3o质量取值100g~500g,酯醇摩尔比取值1~5,钾醇质量比取值0.1%~0.5%,根据此三个条件的有效取值范围建立反应条件搜索空间ω;确定反应条件优化目标参量g为c2h3f3o转化率;设优化条件c为:c3h6o3转化率≥85%且酯醇摩尔比最小。
44.步骤2.数据采集
45.在搜索空间ω中选取n个数据样本,记为样本集x={x1,x2,...,xn},其中,任意数据样本xi=(a
i,1
,a
i,2
,a
t,3
),1≤i≤n,a
i,1
、a
i,2
、a
i,3
分别表示该样本对应的三个反应条件参量:c2h3f3o质量、酯醇摩尔比和钾醇比。即:每个数据样本即为三个反应条件的某种组合,按
照该反应条件组合进行化学实验,采集其对应的c3h6o3转化率,得到标签集合y={y1,y2,...,yn},其中yi即为数据样本xi对应的c3h6o3转化率。
46.根据优化条件c,在样本集x中选出c3h6o3转化率达到85%且酯醇摩尔比最小的样本记为标杆样本x
*
。
47.步骤3.模型构建
48.以样本集(x,y)作为建模数据集、y作为建模标签,采用机器学习方法,如选择基础模型lightgbm,建立c3h6o3转化率预测模型m。
49.步骤4.模型迭代与样本优选,此步骤包括以下分步骤:
50.(1)设样本空间ω中未经实验采集的样本的集合记为虚样本集合p,即:p=ω-x.对任意虚样本x∈p,将x输入预测模型m,计算其对应的反应目标值m(x),记集合q={m(x)|x∈p};
51.(2)根据集合q,在虚样本集合p中,根据m(x)选取满足优选约束的样本,记入优选样本集合x
*
,所述优选约束设为c3h6o3转化率达到85%且酯醇摩尔比最小;
52.(3)根据优选样本集合x
*
中的每个数据样本的反应条件组合分别进行化学实验,采集其对应的优化目标参量g,样本集x
*
中所有样本对应的优化目标参量集合记为标签集y
*
,选取酯醇摩尔比最小者,设其对应的样本为x
′
,若x
′
比当前的标杆样本x
*
更优,则更新x
*
=x
′
;
53.(4)将优选样本集合x
*
纳入训练样本集x,将y
*
纳入训练标签集y,即:x
←
x∏x
*
,y
←
y∪y
*
;
54.重复步骤3和步骤4,直至连续k次循环所获得的标杆样本x
*
不改变,则由当前标杆样本x
*
所对应的酯醇摩尔比即为最优反应物配比,k=5.
55.此方法可大幅降低化学实验反应次数,缩短研发周期,为化学反应工艺优化提供了数据驱动的探究路径。