1.本发明涉及用于生成合成规范的计算机实现方法、用于生成合成规范的系统和用于生成合成规范的计算机程序产品。本发明还涉及所生成的合成规范用于生产化学产品的用途。本发明进一步涉及根据合成规范制造的化学产品,所述合成规范通过用于生成合成规范的方法而生成。本发明进一步涉及用于根据所生成的合成规范来合成化学产品的计算机实现方法、系统和计算机程序产品。
背景技术:
2.在化学工业中,寻找用于特定目标应用属性的新化学组合物是一项困难的任务。必须基于专家知识和探索潜在参数空间来设计实验。由于大的参数空间,这很快变得非常复杂和昂贵。随着从商品化学品转向以客户为中心的j9九游会真人的解决方案的趋势,其中客户要求特定的目标应用属性,情况更是如此。这需要产生各种化学组合物并随后测试它们是否满足要求。
技术实现要素:
3.为了解决上述问题,提出以下方案;
4.一种用于生成化学产品,特别是混合物的目标合成规范的计算机实现方法,其包括以下步骤:
5.经由通信接口向计算机处理器提供目标应用属性;
6.经由通信接口向计算机处理器提供数据驱动模型,所述数据驱动模型基于包括历史化学组分和每一种组分的历史量以及历史应用属性的历史合成规范而被参数化;
7.基于数据驱动模型和目标应用属性,经由计算机处理器确定包括化学组分和每一种组分的量的目标合成规范;
8.经由通信接口向输出单元提供适于合成化学产品的控制数据,所述控制数据包括目标合成规范。
9.上述方法在寻找提供目标应用属性的新合成规范中大大减少了时间和成本。这变得更加相关,因为标准化学产品通常是商品,并且提供定制产品变得更加重要以进行区分。
10.根据一个方面,提供本文公开的方法用于合成规范的虚拟筛选的用途。
11.根据一个方面,提供根据本文公开的方法确定的合成规范。
12.根据一个方面,基于根据本文公开的方法确定的合成规范来提出化学产品。
13.根据一个方面,公开一种包括计算机可读指令的计算机程序或计算机程序产品或计算机可读非易失性存储介质,所述计算机可读指令在由计算机处理器加载和执行时执行本文公开的方法。
14.根据一个方面,一种计算设备包括处理器、通信接口和存储指令的存储器,所述指令在由处理器执行时使所述设备配置为执行本文所公开的方法。
15.根据一个方面,提出一种合成化学产品的计算机实现方法,该方法包括以下步骤:
在控制单元处接收根据权利要求1至12之一产生的控制数据,根据该控制数据控制与含有该化学产品的组分的容器相关联的阀,在反应器中混合这些组分,提供化学产品。
16.在另一方面,一种用于生产化学产品的系统,其包括:控制单元,其被配置成包括处理器,所述处理器被配置成执行权利要求18或19之一所述的方法步骤,所述系统进一步包括与含有化学产品的组分的容器相关联的阀和与所述阀流体连通的反应器。
17.数据驱动模型可以包括白箱模型。“白箱模型”是指基于物理化学定律的模型。物理化学定律可以从第一原理导出。物理化学定律可以包括化学动力学,质量、动量和能量的守恒定律,任意维度的粒子数中的一种或多种。白箱模型可以根据管理相应问题的物理化学定律来选择。
18.数据驱动模型可以包括混合模型。“混合模型”是指包括白箱模型、黑箱模型的模型,参见例如von stoch et al.,2014,computers&chemical engineering,60,pages 86to 101的综述论文。经训练的模型可以包括白箱模型和黑箱模型的组合。
[0019]“数字表示”可指呈计算机可读形式的材料或材料混合物(例如聚合物共混物)的表示。具体而言,这可以是例如结构式、商标名称、cas号、合成规范、smiles表示、亚单元中聚合物的表示。inci名称、具有单体浓度和工艺条件的动力学模型。
[0020]“机器学习”可以指通过经验改善的计算机算法。机器学习算法基于通常被描述为训练数据的样品数据构建模型。
[0021]“通信接口”可以指用于建立诸如传送或交换或信号或数据之类的通信的软件和/或硬件接口。软件接口例如可以是函数调用、api通信接口可以包括收发器和/或接收器。通信可以是有线的,或其可以是无线的。通信接口可以基于一个或多个通信协议或其支持一个或多个通信协议。通信协议可以是无线协议,例如:短距离通信协议诸如或wifi,或长距离通信协议诸如蜂窝或移动网络,例如,第二代蜂窝网络或(“2g”)、3g、4g、长期演进(“lte”),或5g。替代地或另外,通信接口甚至可以基于专有的短距离或长距离协议。通信接口可以支持任何一个或多个标准和/或专有协议。
[0022]“计算机处理器”可以指被配置用于执行计算机或系统的基本操作的任意逻辑电路,和/或通常指被配置用于执行计算或逻辑操作的装置。特别地,处理装置或计算机处理器可以被配置用于处理驱动计算机或系统的基本指令。作为实例,处理装置或计算机处理器可包括至少一个算术逻辑单元(“alu”)、至少一个浮点单元(“fpu”)(例如数学协处理器或数字协处理器)、多个寄存器(具体地,被配置用于将操作数供应到alu且存储操作结果的寄存器)以及存储器(例如l1和l2高速缓冲存储器)。特别地,处理装置或计算机处理器可以是多核处理器。具体地,处理装置或计算机处理器可以是或可以包括中央处理单元(“cpu”)。处理装置或计算机处理器可以是复杂指令集计算(“cisc”)微处理器、精简指令集计算(“risc”)微处理器、超长指令字(“vliw”)微处理器、或实现其它指令集的处理器或实现指令集的组合的处理器。处理装置还可以是一个或多个专用处理装置,例如专用集成电路(“asic”)、现场可编程门阵列(“fpga”)、复杂可编程逻辑装置(“cpld”)、数字信号处理器(“dsp”)、网络处理器等。本文所述的方法、系统和装置可实施为dsp中、微控制器中或任何其它侧处理器中的软件或asic、cpld或fpga内的硬件电路。应当理解,术语处理装置或处理器还可以指一个或多个处理装置,例如位于多个计算机系统(例如,云计算)上的处理装置的分布式系统,并且不限于单个装置,除非另有说明。
[0023]
合成规范可以指用于合成化学产品的指令,具体可包括组分、每一种组分的量并且还可以包括关于条件(例如温度)的指令,或混合指令。
[0024]
组分的量可以指单个组分在化学产品中的分布。它可以指每种组分的浓度(如摩尔分数、体积分数、质量分数、质量摩尔浓度、体积摩尔浓度或当量浓度或混合比)。量也可以指绝对值(例如体积、质量)。
[0025]
在一个方面,数据驱动模型可以是生成模型。使用生成模型具有以下优点:利用相对低的计算能力,可以确定将满足目标应用属性的新合成规范。这可以极大地减少寻找满足目标应用属性的新合成规范的努力。因此,该方法可用于筛选。生成模型可以指可以生成新数据实例的数据驱动模型。合适的生成模型可以是贝叶斯网(bayesian net)、马尔可夫链(markov chain)、自回归模型、潜变量模型、隐式密度模型、rnn、cnn、vae、gan。
[0026]
在一个方面中,数据驱动模型是基于每一种组分的量的序列而参数化的。术语序列可以指任何排序,其中组分的比例以经排序的列表的形式以降序或升序排序。该信息通常在各种合成规范中已经是固有的,例如在个人护理产品诸如营养品、药品、化妆品、家庭护理中,合成规范以每一种组分的量的降序排序。每一种组分的量的序列可以不包括绝对值或浓度。在一个实例中,每一种组分的量的序列可以包括相对顺序,例如多于或少于经排序的列表中的前一组分。
[0027]
当不容易获得每一种组分的量的序列时,可以预处理历史合成规范,使得产生每一种组分的量的序列。一个实例可以是其中组分和浓度是已知的,但没有给出序列顺序的合成规范。然后,任选的预处理步骤可以包括以降序或升序对组分进行排序,从而产生每一种组分的量的序列。
[0028]
由此向所述模型提供附加信息。这可以允许使用简化的数据集。如果使用该附加信息,则可以显着地降低构建数据驱动模型的成本。这也意味着每种组分也取决于经排序的列表中的前一组分。此外,这可以允许将组分比例的序列作为时间序列来处理。
[0029]
在一个方面,数据驱动模型可以包括停止令牌组分。停止令牌组分可指示序列的结束。停止令牌组分是虚拟组分,其除了指示合成规范的结束之外没有其它目的。
[0030]
在一个方面,数据驱动模型可以包括开始令牌组分。开始令牌组分提供使数据驱动模型初始化的标准化方式。
[0031]
在一个方面,数据驱动模型-模型包括包含在用于训练的历史合成规范中的组分。组分可以以列表的形式提供。该列表可以是包含所有组分的完整列表,或者该列表可以是包含在用于训练的合成规范中的组分的简化列表。如果目标是完整的合成规范,则完整的列表可能是有利的,如果合成规范可包含与目标应用属性无关的组分,则简化列表可能是有利的。一个实例可以是其中目标应用属性是防晒个人护理产品并且香料不提供对防晒的贡献。在这种情况下,目标合成规范可以从包括组分的简化列表的数据驱动模型中确定,其中该列表仅包含与目标应用属性相关的组分。其中简化列表可能是有益的其他实例可以是涂料和/或油漆,其中目标应用属性是某种物理性质,并且颜色可以稍后例如以颜料的形式添加。
[0032]
在一个方面,基于数据驱动模型和目标应用属性经由计算机处理器确定目标合成规范的步骤可以包括根据数据驱动模型对组分进行重复采样的步骤。在这种情况下,数据驱动模型可以包括每种组分的概率分布。
[0033]
根据包括每种组分的概率分布的数据驱动模型进行采样具有以下优点:目标合成规范的组分的序列将类似于形成数据驱动模型中的历史合成规范的已知合成规范的组分的序列。
[0034]
提供包括停止令牌组分的数据驱动模型的方面和根据包括每种组分的概率分布的数据驱动模型重复采样的步骤具有协同效果。可以重复采样过程直到目标合成规范包括停止令牌组分。当合成规范完成时,在数据驱动模型中提供指示结束的停止令牌组分提供一个定义。当按降序对组分的序列进行排序时,该方法可能提供包含可忽略量的组分的非常长的列表,例如,可忽略量的许多成分。这可以通过提供序列指示符的结束来防止,该序列指示符定义对组分列表的限制。此外,它允许模型随机终止生成过程,这使得模型自动生成具有不同长度的组分列表,这增加了另一益处。
[0035]
在一个方面,数据驱动模型可以包括递归神经网络。递归神经网络对于时间序列特别有用。在本发明中,时间序列的概念被转移到合成规范。
[0036]
在一个方面,目标应用属性可以以目标应用属性的矢量表示来提供。以矢量表示的形式提供目标应用属性的优点减少了目标应用属性的维数,因此降低了模型的复杂度,从而降低了计算成本。此外,数据驱动模型的稳健性增加,特别是当使用深度神经网络时,因为这些网络在训练期间对于参数动态非常脆弱。这导致更可靠地生成合成规范。
[0037]
矢量表示还可用于确定目标标准之间的相似性。在个人护理产品的情况下,身体乳可类似于防晒产品,两者均为皮肤护理产品,不同之处可在于由防晒效果提供的防晒保护。
[0038]
在一个方面中,可以以矢量表示提供组分。
[0039]
以矢量表示的形式提供目标应用属性的优点减少了目标应用属性的维数,因此降低了模型的复杂度,从而降低了计算成本。此外,数据驱动模型的稳健性增加,特别是当使用深度神经网络时,因为这些网络在训练期间对于参数动态非常脆弱。
[0040]
在一个方面,生成合成规范的方法可以进一步包括验证步骤。在一个方面,验证过程可以包括评估是否满足附加要求。这些附加要求可以包括目标合成规范不同于历史合成规范。
[0041]
验证步骤可以包括将目标合成规范与历史合成规范进行比较,并且仅在目标合成规范与历史合成规范不同时提供目标合成规范。附加要求可以包括相稳定性参数,例如目标保存期限,并且验证步骤可以包括向用于预测目标保存期限的系统提供目标稳定性参数,接收预测的相稳定性参数并将预测的相稳定性参数与目标相稳定性参数进行比较。
[0042]
在一个方面,目标应用属性可以以应用标识符的形式提供,应用标识符可以是容易解释的形式,例如合成规范的预期应用或任何其它目标应用属性。目标应用属性的相应矢量表示然后可以从应用标识符中导出,例如通过从数据库中选择。这允许以容易理解的方式提供目标应用属性。为了生成合成规范,矢量表示是有用的。不幸的是,这不是非常直观的表示,因此,经由通信接口以应用标识符的形式向计算机处理器提供目标应用属性的步骤可以提高可用性。
[0043]
另外或替代地,验证步骤可以包括评估组分中的至少一种是否是目标应用属性的活性组分的步骤。再次转到防晒剂的实例,活性组分可以是吸收uv光的有机化学化合物,反射、散射和吸收uv光的无机颗粒或主要像有机化学化合物那样吸收uv光但含有像无机颗粒
那样反射和散射一部分光的多个发色团的有机颗粒。活性组分的实例是对氨基苯甲酸、帕地马酯o、苯基苯并咪唑磺酸、西诺沙酯、二羟苯宗、氧苯酮、胡莫柳酯、邻氨基苯甲酸薄荷酯、氰双苯丙烯酸辛酯、甲氧基肉桂酸辛酯、水杨酸辛酯、磺异苯酮、三乙醇胺水杨酸盐、阿伏苯宗、依莰舒(ecamsule)、二氧化钛、氧化锌、4-甲基亚苄基樟脑、parsol max、tinosorb m、parsol shield、tinosorb s、tinosorb a2b、neo heliopan ap、mexorylxl、二苯酮-9、uvinul t 150、uvinul a plus、uvasorb heb、parsol slx、阿米洛酯(amiloxate)。
[0044]
本文描述的任何公开内容和实施方案涉及上面列出的方法、系统、处理装置、计算机程序元件,反之亦然。有利地,任何实施方案和实例提供的益处同样适用于所有其它实施方案和实例,反之亦然。
[0045]
如本文所使用的,“确定”还包括“发起或引起确定”,“生成”还包括“发起或引起生成”,并且“提供”还包括“发起或引起确定、生成、选择、发送或接收”。“发起或引起执行动作”包括触发计算装置执行相应动作的任何处理信号。
附图说明
[0046]
为了容易地识别对任何特定元件或动作的讨论,附图标记中的一个或多个最高有效数位指的是该元件首先被引入的图号。
[0047]
图1显示出根据一个实施方案的用于生成合成规范的例程100。
[0048]
图2显示出根据一个实施方案的主题的一个方面。
[0049]
图3显示出用于生成合成规范的系统的一个方面。
[0050]
图4显示出根据一个实施方案的主题的一个方面。
[0051]
图5显示出用于生产化学产品的工作流程。
[0052]
图6显示出用于生产化学产品的系统。
具体实施方式
[0053]
下面参考附图描述提供本发明的实施方式的非限制性实例。出于说明的目的,在所提供的实例中组合各种任选特征。对于本领域技术人员显而易见的是,并非所有特征都是执行本发明所必需的。
[0054]
在框102中,例程100经由通信接口向计算机处理器提供所提议的目标应用属性,其中在该实例中,目标应用属性以矢量表示来提供。在框104中,例程100经由通信接口向计算机处理器提供数据驱动模型,该数据驱动模型基于包括组分的历史列表、每一种组分的历史量和历史目标标准的历史合成规范而被参数化,其中数据驱动模型包括生成模型,基于每一种组分的量的序列被参数化,包括停止令牌组分,包括开始令牌组分,包括包含在历史合成规范中的组分的列表,基于历史目标标准的矢量表示和组分的列表中的组分的矢量表示而被参数化,包括递归神经网络。在框106中,例程100经由计算机处理器基于数据驱动模型和目标应用属性来确定目标合成规范,其中确定步骤进一步包括根据数据驱动模型对组分重复采样。在框108中,例程100经由通信接口向输出单元提供目标合成规范,包括目标组分的列表和每一种组分的量。
[0055]
在图2中,显示出用于执行根据本发明的方法的循环网络的工作流程。以应用标识符的形式提供目标应用属性202。在该实例中,应用标识符可以是“防晒剂”,因为新合成规
范的应用旨在成为防晒个人护理产品。然后从数据库204中选择目标应用属性206的相应矢量表示。目标应用属性206的矢量表示可以是一个热矢量,然而,可以选择更复杂的矢量表示。这允许以容易理解的方式提供目标应用属性。为了生成目标应用属性206的合成规范矢量表示,矢量表示是有用的。然后使用矢量表示来初始化数据驱动模型,在该实例中,数据驱动模型是递归神经网络。数据驱动模型进一步包括组分的列表210,在该实例中,该组分的列表210可以是组分数据库210的形式。组分的列表可以包括组分的列表中的组分的矢量表示。组分的列表中的组分的矢量表示可以是每一种组分的一个热矢量,然而,可以选择更复杂的矢量表示。选择开始令牌组分作为到递归神经网络中的输入x0。隐藏状态h0提供组分的概率分布。这表示组分将处于新合成规范的序列的那个位置的概率。在采样步骤中,根据概率分布对下一种组分x1进行采样。在该实例中,下一种组分将是水。递归神经网络的输出212包含关于先前采样的组分x0和目标应用属性206的矢量表示的信息。然后将输出212作为输入214馈送到递归神经网络中。接下来,提供组分x1作为到递归神经网络中的输入。隐藏状态h1提供组分的概率分布。这表示组分将处于新合成规范的序列的那个位置的概率。示例性概率分布表示为216。在采样步骤中,根据概率分布对下一种组分x2进行采样。在该实例中,下一种组分是甘油。递归神经网络的输出212包含关于先前采样的组分x0和x1以及目标应用属性206的矢量表示的信息。然后将输出212作为输入214馈送到递归神经网络中。重复该采样步骤,直到停止令牌组分xn被采样。新的合成规范包括以序列形式的组分x1、
……
、x
n-1
。然后可以经由通信接口提供该序列。
[0056]
图3显示出计算设备314的一个实例,该计算设备包括:计算机处理器306;通信接口308、310、312,存储指令的存储器316,当被处理器执行时,所述指令使该设备配置为执行以下步骤:经由通信接口向计算机处理器提供目标应用属性;经由通信接口向计算机处理器提供数据驱动模型,所述数据驱动模型基于包括组分的历史列表、每一种组分的历史量和历史目标标准的历史合成规范而被参数化;经由计算机处理器,基于数据驱动模型和目标应用属性来确定目标合成规范;以及经由通信接口向输出装置提供目标合成规范,所述目标合成规范包括目标组分的列表和每一种组分的量。
[0057]
在该实例中,计算机设备进一步包括输入/输出装置304。在该实例中,数据驱动模型存储在数据库302中。数据库302经由通信接口308连接到计算机处理器。在该实例中,输入/输出装置304用于经由通信接口310提供目标应用属性。在该实例中,以应用标识符的形式提供目标应用属性。在这种情况下,应用标识符可以是“防晒剂”。然后,计算机处理器306从数据库302中检索目标应用属性的矢量表示。然后将目标应用属性的矢量表示提供给计算机处理器306。数据驱动模型经由通信接口308提供给计算机处理器306。利用计算机处理器306,基于数据驱动模型和目标应用属性来确定目标合成规范。目标合成规范经由通信接口312提供给输入/输出装置304。在另一实例中,可以经由通信接口308向数据库302提供相位稳定性参数。
[0058]
转到图4,显示出用于生成合成规范的基于因特网的系统。系统400包括服务器402,该服务器可以通过一个或多个客户端装置406.1至406.n经由网络404诸如因特网访问。服务器可以是http服务器,并且经由传统的基于因特网网站的技术来访问。客户端装置406可以是用户可访问的计算机终端,并且可以是定制装置,例如数据输入亭,或通用装置,例如个人计算机。打印机408可以连接到客户端装置406。如果向客户提供服务或在更大的
公司设置中提供服务,则基于因特网的系统特别有用。客户机可用于向服务器的计算机处理器提供目标应用属性。
[0059]
在一个方面中,客户端可基于目标应用属性产生启动合成规范的产生的请求,其中客户端装置被配置为向服务器装置提供目标应用属性。
[0060]
图5描绘用于生产化学产品的示例性工作流程700。在步骤710,提供包括化学产品的合成规范的控制数据。该控制数据包括与组分相关联的信息和每一种组分的量。在步骤720,根据控制数据控制与含有组分的容器相关联的阀,使得在反应器中组分以合成规范中指定的量提供。在任选的步骤730中,可以控制反应器中的混合器以确保组分的良好混合。在任选的步骤740,可控制加热器以根据合成规范加热组分。在步骤750,提供化学产品。这可以通过打开反应器处的出口阀来进行。
[0061]
图6显示出用于基于根据本发明产生的合成规范来生产化学产品的系统500。在该实例中,该系统包括与控制单元540相关联的用户接口510和处理器520,该控制单元被配置成用于接收根据本发明生成的控制数据。在该实例中,从数据库530提供控制数据,在其他实例中,可以从服务器提供控制数据。容器550、552各自包含化学产品的组分。通常存在两个以上的容器。出于说明的目的,该实例仅显示出两个容器。阀560、562与容器550、552相关联。根据合成规范,可以控制阀550和552以在反应器570中计量加入适当量的每种组分。混合器580的马达600也可由控制单元根据合成规范来控制。任选的加热器590也可以根据合成规范来控制。最后,与反应器流体连通的出口阀610可由控制单元控制以向容器或测试系统620提供化学产品。