电子病历数据分析方法、装置、计算机设备及存储介质与流程-j9九游会真人

文档序号:35696901发布日期:2023-10-11 19:52阅读:5来源:国知局


1.本发明涉及一种人工智能技术领域以及医疗健康领域,尤其涉及一种电子病历数据分析方法、装置、计算机设备及存储介质。


背景技术:

2.传染病是由各种病原体引起的能在人与人、动物与动物或人与动物之间相互传播的一类疾病。医院是一个高风险的传染病传播场所,患者、医务人员或者访客都有可能成为病原体的携带者和传播者,因此医院内部的传染病预防和控制非常重要。
3.现有的医院预防措施,通常采用设立院感疾控科或者疾病预防控制科的方式,由各个科室上报疑似传染病病历。具体的过程为,科室人员通过获取患者的相关数据,通过分析相关数据确定患者的病情特征。由于传染病的病原体容易变异,使得传染病的病情特征容易发生改变,因此此种人为对患者的相关数据进行分析的方式,难以适配病情特征易于变化的传染病,导致分析准确度降低,分析效果难以保证。


技术实现要素:

4.有鉴于此,本发明提供了一种电子病历数据分析方法、装置、计算机设备及存储介质,用于解决现有技术中分析病情特征的效果差的问题。为达上述之一或部分或全部目的或是其他目的,本发明提出一种电子病历数据分析方法、装置、计算机设备及存储介质,第一方面:
5.一种电子病历数据分析方法,所述方法包括:
6.获取各个患者各自对应的电子病历数据;
7.根据所述电子病历数据中数据的类型,分别对各个所述电子病历数据中各个类型的数据进行转向量及拼接处理,得到各个患者各自对应的就诊患者病历向量;
8.利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果。
9.第二方面:
10.一种电子病历数据分析装置,所述装置包括获取模块,用于获取各个患者各自对应的电子病历数据;
11.向量模块,用于根据所述电子病历数据中数据的类型,分别对各个所述电子病历数据中各个类型的数据进行转向量及拼接处理,得到各个患者各自对应的就诊患者病历向量;
12.识别模块,用于利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果。
13.第三方面:
14.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述第一方面所述电子
病历数据分析方法的步骤。
15.第四方面:
16.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述电子病历数据分析方法的步骤。
17.实施本发明实施例,将具有如下有益效果:
18.相比于医院等医疗机构,采用人工分析病情特征的方式,本方法通过获取各个患者各自对应的电子病历数据,对电子病历数据中不同类型的数据,分别进行转向量处理后再拼接,最后利用病情特征分析模型得到病情特征分析结构。不仅整个过程无需人工参与,自动获取自动分析,节省了人工成本,提高了分析效率,而且电子病历数据中不同类型的数据分别转向量,使得传染病的病情特征发生变化时,能够针对部分类型的数据,改变转向量的处理方式,提高电子病历数据中各类型数据的转向量处理精度,从而有助于提高传染病病情特征分析的准确性,使得分析效果提高。
附图说明
19.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
20.其中:
21.图1为一个实施例中一种电子病历数据分析方法的应用场景示意图。
22.图2为一个实施例中一种电子病历数据分析方法的另一应用场景示意图。
23.图3为一个实施例中一种电子病历数据分析方法的整体流程图。
24.图4为一个实施例中一种电子病历数据分析方法中就诊患者病历向量的获取流程图。
25.图5为一个实施例中一种电子病历数据分析方法中获取个人信息类型的就诊患者一阶向量的示意图。
26.图6为一个实施例中一种电子病历数据分析方法中针对传染病a获取诊断信息类型的就诊患者一阶向量的示意图。
27.图7为一个实施例中一种电子病历数据分析方法中针对传染病b获取诊断信息类型的就诊患者一阶向量的示意图。
28.图8为一个实施例中一种电子病历数据分析装置的结构框图。
29.图9为一个实施例中计算机设备的一结构示意图。
30.图10为一个实施例中计算机设备的另一结构示意图。
具体实施方式
31.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
32.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
33.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
34.本发明实施例提供一种电子病历数据分析方法。可以应用在如图1所示的应用场景中,包括终端001和服务器002。终端001与服务器002通信连接,能够交互数据。在需要分析病情特征时,终端001从自己的存储空间中调取各个患者的电子病历数据,终端001根据电子病历数据中的数据类型,分别将各个电子病历数据转换成对应的就诊患者病历向量。而后,终端001利用病情特征分析模型,分别对每个患者的就诊患者病历向量进行处理,得到每个患者对应的病情特征分析结果。最后,终端001将病情特征分析结果上传至服务器002。服务器002用于存储病情特征分析结果,以便根据病情特征分析结果判断各个患者携带传染病的情况,及时进行告警。
35.此外,在另一应用场景中,如图2所示,多个终端001均与服务器002连接。不同的终端001存储有不同患者的电子病历数据,每个终端001均将自身存储的电子病历数据上传给服务器002。服务器002根据电子病历数据中的数据类型,分别将各个电子病历数据转换成对应的就诊患者病历向量。而后,服务器002利用病情特征分析模型,分别对每个患者对应的就诊患者病历向量进行处理,得到每个患者对应的病情特征分析结果,以便根据病情特征分析结果判断各个患者携带传染病的情况,及时进行告警。
36.具体的,终端001可以但不限于是各种智能手机、个人计算机、笔记本电脑、平板电脑、智能控制面板、便携式可穿戴设备或者其他可实施网络连接的设备,服务器002可以用独立的服务器或者是多个服务器组成的服务器集群来实现,对此本实施例不做具体限定。
37.传染病是一种极易传播且对人体产生较大损害的疾病,通常在人与人、动物与人之间相互传播。无论是为了保证社会的稳定,还是人类的健康,在各行各业均需要对传染病进行监控,以及时发现、及时阻断传播路径和及时治疗,降低传染病的危害。
38.尤其是对于医疗领域,例如医院、诊所、药店等场景,均是患者频繁出入且容易长时间驻足的地方。而患有不同疾病的人长时间聚集,极大增加了传染病的传播几率,因此需要对上述场景进行传染病的监测。
39.现有的医院预防措施,通常采用设立院感疾控科或者疾病预防控制科的方式,由各个科室上报疑似传染病病历。具体的过程为,科室人员通过获取患者的相关数据,通过分析相关数据确定患者的病情特征。但此种人为对患者的相关数据进行分析的方式,人员容易受外界因素影响,导致分析准确度降低,分析效果难以保证。
40.基于此,本发明实施例提供的一种电子病历数据分析方法,如图3所示,所述方法包括:
41.101、获取各个患者各自对应的电子病历数据。
42.需要说明的是,本技术实施例指出所述方法用于检测目标传染病。其中,目标传染病可以是多个传染病,也可以是一个传染病。即本实施例对于同时监测传染病的数量不做具体限定,为了便于理解,下面以监测一个传染病为例进行说明,被监测的传染病为目标传
染病。
43.此外,本实施例中所称的传染病指具有传染性的疾病,可以是呼吸道传染,也可以是血液传染,具体对于传染病的定义可参考医学领域的文献,本实施例对此不作赘述。
44.在一实施例中,患者指到医院诊断,至少具有电子病历的个体,可以是人,也可以动物。例如,在一应用场景中,需要对动物间的传染病进行监测,适用的场景为宠物医院,此时,患者则为到宠物医院进行病情检查的动物。在另一应用场景中,需要对医院内的传染病进行监测,此时,患者则为到医院进行病情检查的人。
45.在另一实施例中,患者泛指具有电子病历的个体,即电子病历可以是患者之前进行病情检查时开具的电子病历,也可以是当下时刻,患者进行病情检查开具的电子病历。
46.随着信息化技术的发展,医院等医疗场地在对患者进行病情诊断时,通常会在虚拟系统中生成患者的电子病历。电子病历上记载有患者的就诊时间、患者姓名、患者性别、患者年龄、患者体重、患者身高、患者的症状、诊断结果、仪器检查结果、药品清单和收费等信息,通过提取电子病历上的部分或全部信息,即可得到电子病历数据。需要说明的是,本技术对于电子病历数据的具体内容不作限定,可以根据需要监测的传染病的不同,调整电子病历数据的内容。但是通过电子病历数据至少应该能够确定对应的患者是谁,以便于在发现传染病时,能够找到对应的患者。
47.例如,传染病a的特点比较突出,只要通过患者是否发热即可确定,此时,即可从各个患者的电子病历中提取体温信息作为对应患者的电子病历数据。再例如,传染病b与传染病c的症状较为相似,此时,则需要从各个患者的电子病历中提取较多的信息,例如就诊时间、患者的症状、诊断结果和药品清单。
48.需要说明的是,本实施例中对于如何根据分析结果确定患者是否携带有目标传染病不作具体限定。也就是说,本实施例的目的在于对电子病历数据进行分析,以便确定各个患者的病情特征,至于通过病情特征确定患者是否为目标传染病携带者,不属于本技术实施例考虑的范围。
49.102、根据所述电子病历数据中数据的类型,分别对各个所述电子病历数据中各个类型的数据进行转向量及拼接处理,得到各个患者各自对应的就诊患者病历向量。
50.如同前文说明,不同的目标传染病具有不同的病情特征特点,通过患者的病情特征即可确定患者是否携带有目标传染病,其中,目标传染病的病情特征可以通过患者的就诊时间(例如传染病是在某一个时间段内集中传播的)、患者性别(例如传染病只传播给某一种性别)、患者体重(例如传染病只会在较大重量或较小重量的人群中传播)、患者身高、患者症状、诊断结果、仪器检查结果和药品清单(例如某种药品只用于治疗一种传染病)中的至少一个确定。
51.由于不同的目标传染病具有不同的病情特征特点,因此在确定了目标传染病后,即可根据目标传染病的病情特征特点对各个电子病历数据进行转向量处理,在转向量处理时,会根据电子病历数据中不同数据的类型进行转向量,得到各个患者对应的就诊患者病历向量;其中,电子病历数据中数据的类型例如个人信息类型的数据和有关病情类型的数据,本实施例对此不作具体限定。
52.103、利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果。
53.在一实施例中,预先设置有病情特征分析模型,且不同的目标传染病具有对应的病情特征分析模型。例如,目标传染病是传染病a时,则使用与传染病a对应的病情特征分析模型对各个患者的就诊患者病历向量进行计算;目标传染病包括传染病b和c时,则使用与传染病b对应的以及与传染病c对应的病情特征分析模型分别对各个患者的就诊患者病历向量进行识别。
54.病情特征分析模型计算后,即可得到各个患者的病情特征分析结果,也就完成了电子病历数据的分析。而后可以通过病情特征分析结果确定各个患者是否携带有传染病病原或者说各个患者是否患有目标传染病,实现对目标传染病的监测。
55.通过上述步骤,相比于医院等医疗机构,采用人工分析病情特征的方式,本方法通过获取各个患者各自对应的电子病历数据,对电子病历数据中不同类型的数据,分别进行转向量处理后再拼接,最后利用病情特征分析模型得到病情特征分析结构。不仅整个过程无需人工参与,自动获取自动分析,节省了人工成本,提高了分析效率,而且电子病历数据中不同类型的数据分别转向量,使得传染病的病情特征发生变化时,能够针对部分类型的数据,改变转向量的处理方式,提高电子病历数据中各类型数据的转向量处理精度,从而有助于提高传染病病情特征分析的准确性,使得分析效果提高。
56.在本技术的另一种实施方式中,如图4所示,所述根据所述电子病历数据中数据的类型,分别对各个所述电子病历数据中各个类型的数据进行转向量及拼接处理,得到各个患者各自对应的就诊患者病历向量,包括:
57.201、采用一位有效编码的编码方式,按照预设的编码模版以及所述数据的类型,分别对每个所述电子病历数据进行编码,得到每个患者对应的多种类型各自对应的就诊患者一阶向量。
58.其中,一位有效编码又称独热编码(one-hot编码),是使用n位状态寄存器对n个状态进行编码,每个状态都有独立的寄存器位,并且在任意时候,其中只有一位有效。
59.为了便于理解,例如,对于患者的性别,包括3个编码位,分别是男性、女性和未知;如果患者a为男性,则编码为100;如果患者b为女性,则编码位010。再例如对于患者的年龄,包括4个编码为,分别是0-20岁,21-40岁,41-60岁,61-无穷大;如果患者a为18岁,则编码位1000。
60.每个目标传染病均对应有编码模版,编码模版中的数据类型和数据段可能不同。例如,对于传染病a,至少需要知道患者的性别、年龄、体重、症状、诊断结果和药品;则有编码模版如下:
61.男、女、未知;
62.0-10、11-20、20-100、101-无穷大;
63.0-50kg、51-100kg、101-200kg;
64.症状1、症状2、症状3;
65.诊断结果1、诊断结果2、诊断结果3;
66.药品1、药品2、药品3、药品4、药品5。
67.对于传染病b,至少需要知道患者的年龄、体重、身高、近期居住地、症状、诊断结果和药品;则有编码模版如下:
68.0-18、19-30、31-35、36-无穷大;
69.0-50kg、51-100kg、101-200kg;
70.0-150cm、151-170cm、171-无穷大;
71.东北、华北、西北;
72.症状1、症状3、症状4;
73.诊断结果3、诊断结果5、诊断结果8;
74.药品1、药品2、药品4、药品7、药品11。
75.可见,针对不同的目标传染病,可以设置相同或者不同的编码模版,具体可以根据目标传染病的病情特征特点进行设定,旨在通过编码模版中的内容,得到能够表征目标传染病病情特征特点的病情特征分析结果,从而利于判断出患者是否患有目标传染病,本实施例对于编码模版的构建过程和内容不作具体限定。
76.在得到编码模版和患者的电子病历数据后,即可采用一位有效编码得到对应患者的就诊患者一阶向量。
77.例如,在一实施例中,患者m对于传染病a的就诊患者一阶向量为:
78.100;
79.0010;
80.010;
81.000;
82.100;
83.10111。
84.此外,需要说明的是,由于电子病历数据中的数据类型较多,因此将不同类型的数据分开编码,得到多种类型的就诊患者一阶向量。具体的,在一实施例中,将电子病历数据中有关个人信息的数据判定为同一个类型,将电子病历数据中个人信息以外的数据判定为同一个类型,以得到多个类型的就诊患者一阶向量。在另一实施例中,将电子病历数据中的患者身高判定为一个类型,将患者体重判定为一个类型,将药品判定为一个类型,从而得到多个类型的就诊患者一阶向量。本实施例对于如何划分类型数据不作具体限定。
85.例如,对于上述例子中的患者m,将其就诊患者一阶向量分为两个类型,第一个类型与患者m的个人信息有关,则得到一个类型的就诊患者一阶向量为:
86.100;
87.0010;
88.010。
89.第二个类型与患者m的诊断信息有关,则得到另一个类型的就诊患者一阶向量为:
90.000;
91.100;
92.10111。
93.202、将每个类型对应的所述就诊患者一阶向量分别映射为就诊患者二阶向量。
94.其中,所述就诊患者一阶向量为高维稀疏向量;所述就诊患者二阶向量为低维紧密向量。需要说明的是,高维是相对于低维而言的,同样,低维也是相对于高维而言的,旨在表征就诊患者一阶向量的维数大于就诊患者二阶向量的维数;稀疏是相对于紧密而言的,同样,紧密是相对于稀疏而言的,旨在表征就诊患者一阶向量比就诊患者二阶向量稀疏。为
了便于理解,例如,在一实施例中,医院对于传染病a,设置有1000维的编码模版,因此得到的就诊患者一阶向量就是1000维的向量,但是就诊患者一阶向量中非0即1,因此为稀疏向量。在将就诊患者一阶向量映射为就诊患者二阶向量时,就诊患者二阶向量为50维,且值是0~1之间的小数的向量,因此就诊患者二阶向量为低维紧密向量。
95.本实施例对于映射方式不作具体限定,可以是采用自编码器完成映射,也可以是采用特征抽取完成映射。
96.203、将同一患者的所有所述就诊患者二阶向量进行拼接,得到各个患者各自对应的所述就诊患者病历向量。
97.本实施例对拼接方式不作具体限定,可参考向量拼接方法。
98.通过上述步骤,采用一位有效编码的编码方式,配置编码模版,将电子病历数据进行转向量处理,一方面,转向量的过程简单快捷,不易占用较多的计算资源;另一方面,便于在传染病的病情特征特点发生变化时,直接对编码模版进行修改,无需重新设计整个转向量过程,易于提高就诊患者病历向量的质量,使病情特征分析结果更为准确。
99.在本技术的另一种实施方式中,所述采用一位有效编码的编码方式,按照预设的编码模版以及所述数据的类型,分别对每个所述电子病历数据进行编码,得到每个患者对应的多种类型各自对应的就诊患者一阶向量,包括:
100.301、根据各个所述电子病历数据中的个人信息数据,确定所述编码模版中个人信息模版内各基础项的数值。
101.302、将同一患者的所述个人信息数据对应的所有基础项的数值进行整合,得到各个患者的个人信息类型的所述就诊患者一阶向量。
102.303、根据各个所述电子病历数据中的诊断信息数据,确定所述编码模版中诊断信息模版内各诊断项的数值。
103.304、将同一患者的所述诊断信息数据对应的所有诊断项的数值进行整合,得到各个患者的诊断信息类型的所述就诊患者一阶向量。
104.在一实施例中,将电子病历数据中包含的各个数据分类成个人信息数据和诊断信息数据。为了便于理解,例如,在一应用场景中,电子病历数据包括患者的就诊时间、患者姓名、患者性别、患者年龄、患者体重、患者身高、患者的症状、诊断结果、仪器检查结果、药品清单和收费。其中,患者的就诊时间、患者姓名、患者性别、患者年龄、患者体重、患者身高属于个人信息数据,患者的症状、诊断结果、仪器检查结果、药品清单和收费属于诊断信息数据。
105.个人信息数据对应有个人信息模版,个人信息模版中多个基础项,每个基础项对应个人信息数据中的一种数据。例如,在一实施例中,个人信息模版中包括性别基础项,用于与患者性别对应;包括年龄基础项,用于与患者年龄对应。诊断信息数据对应有诊断信息模板,诊断信息模板中也包含多个基础项,每个基础项对应诊断信息数据中的一种数据,与个人信息数据同理,不再赘述。
106.根据个人信息数据即可确定个人信息模版中各个基础项的数值,其中,数值为0和1,个人信息数据中与对应基础项相同的,则数值为1,不同则为0。例如,在一应用场景中,与患者性别对应的基础项包括男、女、未知,如果个人信息数据中的患者性别为男,则对应基础项的数值分别是1、0、0。
107.通过上述步骤,将电子病历数据分为个人信息数据和诊断信息数据,有助于将电子病历数据分块处理,易于得到电子病历数据的主要特征,从而进行后续的向量映射步骤,以便于减小计算量。
108.在本技术的另一种实施方式中,所述将每个类型对应的所述就诊患者一阶向量分别映射为就诊患者二阶向量,包括:
109.采用预设的自编码器,将各个类型的所述就诊患者一阶向量分别映射为就诊患者二阶向量。
110.自编码器能够提取就诊患者一阶向量的主要特征,并根据主要特征,还原就诊患者一阶向量。采用历史的电子病历数据训练自编码器,使训练完成的自编码器能够得到准确的就诊患者一阶向量的主要特征,再将各个就诊患者一阶向量的主要特征判定为就诊患者二阶向量即完成映射过程。需要说明的是,本实施例对自编码器的型号和训练过程不做限定,利用现有自编码器即可。如图5所示,对于患者的个人信息数据,使用自编码器从个人信息数据对应的就诊患者一阶向量中,提取向量a,即得到对应患者个人信息数据的就诊患者二阶向量。如图6和7所示,对于患者的诊断信息数据,使用自编码器从各个患者的就诊新数据对应的就诊患者一阶向量中,提取向量b,即得到对应患者就诊信息数据的就诊患者二阶向量。
111.通过上述步骤,采用自编码器将各个类型的就诊患者一阶向量映射为就诊患者二阶向量,降低向量维度,有助于得到各个患者的就诊患者一阶向量的主要特征,减少后续计算量。
112.在本技术的另一种实施方式中,所述利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果,包括:
113.501、分别计算每个所述就诊患者病历向量与所述病情特征分析模型中所有聚类集的中心向量之间的距离,得到各个患者的识别距离。
114.病情特征分析模型中包含有至少一个聚类集,其中,聚类集指包含有多个向量的单元。每个聚类集中均具有中心向量,计算各个就诊患者病历向量到各个中心向量之间的距离,得到各个患者的至少一个识别距离。
115.502、查找每个患者的所述识别距离中的最小值,将最小值对应的中心向量判定为该名患者的目标向量,同时获取病情特征分析模型中与所述目标向量对应的最远距离。
116.找到各个患者的至少一个识别距离中的最小值,将最小值对应的中心向量判定为对应患者的目标向量。每个聚类集中均具有最远距离,其中,最远距离指中心向量与所在聚类集中其他向量之间距离的最大值。
117.503、分别对每个患者对应的所述识别距离和所述最远距离进行对比,得到每个患者对应的所述病情特征分析结果。
118.例如,在一实施例中,针对各个传染病均建立病情特征分析模型,每个病情特征分析模型中均包含有多个聚类集,每个聚类集中均具有中心向量,且具有最远距离。通过各个患者对应的就诊患者病历向量确定各个病情特征分析模型中匹配的聚类集,而后比对识别距离与确定的聚类集的最远距离,将识别距离与最远距离的比对结果作为该名患者的病情特征分析结果。
119.通过上述步骤,将向量比较过程转变为距离比较过程,有助于提高病情特征分析
结果的准确度,利于医院等医疗机构对传染性疾病进行监测。
120.在本技术的另一种实施方式中,在所述利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果之前,所述方法还包括:
121.601、获取未携带病情特征的患者的历史病历数据。
122.在使用目标传染病的病情特征分析模型之前,对病情特征分析模型进行训练,且使用未携带病情特征的患者的历史病历数据。
123.602、计算各个未携带病情特征的患者的历史患者病历向量。
124.同样将各个患者的历史病历数据转变为历史患者病历向量。
125.603、利用密度聚类算法对所有所述历史患者病历向量进行计算,得到至少一个聚类集。
126.其中,所述聚类集采用计算各个所述历史患者病历向量之间的余弦距离,得到所述聚类集中各个所述历史患者病历向量之间的距离值。
127.604、利用所有所述聚类集,构建所述病情特征分析模型。
128.病情特征分析模型中可以只有对应的所有聚类集,也可以包含其他内容,本实施例对此不做具体限定。
129.通过上述步骤,采用未携带病情特征的患者的历史病历数据计算聚类集,计算过程简单方便。
130.在本技术的另一种实施方式中,在所述利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果之后,所述方法还包括:
131.701、每经过预设的时间阈值,在所有所述病情特征分析结果中包含有超过第一数量阈值的携带病情特征结果时,进行中风险报警。
132.702、在所有所述病情特征分析结果中包含有超过第二数量阈值的携带病情特征结果时,进行高风险报警。
133.在一实施例中,时间阈值可以是10分钟,也可以是15分钟,本实施例对此不做具体限定,时间阈值的确定可以根据实际的需求进行设定。例如,对于工作日,或者人流量较大的时间段,医院等医疗机构可以减小时间阈值,对于休息日或者人流量较小的时间段,医院等医疗机构可以增大时间阈值。
134.通过上述步骤,利用信息化技术,将各个患者的个人信息和诊断信息均使用电子病历记录,从而通过电子病历得到有关患者且较为全面的电子病历数据。而后采用预设编码模版和一位有效编码的方式,将各个患者的电子病历数据进行转向量处理,得到就诊患者病历向量。其中,为了简化计算过程,对各个患者依据编码模版得到的高维向量进行降维处理。而后,采用病情特征分析模型对每个患者的就诊患者病历向量进行计算,得到病情特征分析结果。整个过程无需人工参与,自动执行,节省了人工成本,同时,能够针对部分类型的数据,改变转向量的处理方式,提高电子病历数据中各类型数据的转向量处理精度,从而有助于提高传染病病情特征分析的准确性,提高了分析效果。
135.本技术实施例还公开一种电子病历数据分析装置,如图8所示,所述装置包括:
136.获取模块1,用于获取各个患者各自对应的电子病历数据;
137.向量模块2,用于根据所述电子病历数据中数据的类型,分别对各个所述电子病历数据中各个类型的数据进行转向量及拼接处理,得到各个患者各自对应的就诊患者病历向量;
138.识别模块3,用于利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果。
139.在本技术的另一种实施方式中,所述向量模块2包括编码单元,用于采用一位有效编码的编码方式,按照预设的编码模版以及所述数据的类型,分别对每个所述电子病历数据进行编码,得到每个患者对应的多种类型各自对应的就诊患者一阶向量,其中,所述就诊患者一阶向量为高维稀疏向量;
140.映射单元,用于将每个类型对应的所述就诊患者一阶向量分别映射为就诊患者二阶向量,其中,所述就诊患者二阶向量为低维紧密向量;
141.拼接单元,用于将同一患者的所有所述就诊患者二阶向量进行拼接,得到各个患者各自对应的所述就诊患者病历向量。
142.在本技术的另一种实施方式中,所述编码单元包括第一赋值子单元,用于根据各个所述电子病历数据中的个人信息数据,确定所述编码模版中个人信息模版内各基础项的数值;
143.第一整合子单元,用于将同一患者的所述个人信息数据对应的所有基础项的数值进行整合,得到各个患者的个人信息类型的所述就诊患者一阶向量;
144.第二赋值子单元,用于根据各个所述电子病历数据中的诊断信息数据,确定所述编码模版中诊断信息模版内各诊断项的数值;
145.第二整合子单元,用于将同一患者的所述诊断信息数据对应的所有诊断项的数值进行整合,得到各个患者的诊断信息类型的所述就诊患者一阶向量。
146.在本技术的另一种实施方式中,所述映射单元包括编码器子单元,用于采用预设的自编码器,将各个类型的所述就诊患者一阶向量分别映射为就诊患者二阶向量。
147.在本技术的另一种实施方式中,所述识别模块3包括距离单元,用于分别计算每个所述就诊患者病历向量与所述病情特征分析模型中所有聚类集的中心向量之间的距离,得到各个患者的识别距离;
148.最远距离单元,用于查找每个患者的所述识别距离中的最小值,将最小值对应的中心向量判定为该患者的目标向量,同时获取病情特征分析模型中与所述目标向量对应的最远距离,其中,所述最远距离指所述中心向量与所在聚类集中其他向量之间距离的最大值;
149.对比单元,用于分别对每个患者对应的所述识别距离和所述最远距离进行对比,得到每个患者对应的所述病情特征分析结果。
150.在本技术的另一种实施方式中,所述装置还包括训练模块,用于获取未携带病情特征的患者的历史病历数据;
151.计算各个未携带病情特征的患者的历史患者病历向量;
152.利用密度聚类算法对所有所述历史患者病历向量进行计算,得到至少一个聚类集,其中,所述聚类集采用计算各个所述历史患者病历向量之间的余弦距离,得到所述聚类集中各个所述历史患者病历向量之间的距离值;
153.利用所有所述聚类集,构建所述病情特征分析模型。
154.在本技术的另一种实施方式中,所述装置还包括告警模块,用于每经过预设的时间阈值,在所有所述病情特征分析结果中包含有超过第一数量阈值的携带病情特征结果时,进行中风险报警;
155.在所有所述病情特征分析结果中包含有超过第二数量阈值的携带病情特征结果时,进行高风险报警。
156.通过上述内容,获取模块1通过电子病历得到有关患者且较为全面的电子病历数据。而后向量模块2采用预设编码模版和一位有效编码的方式,将各个患者的电子病历数据进行转向量处理,得到就诊患者病历向量。其中,为了简化计算过程,对各个患者依据编码模版得到的高维向量进行降维处理。最后,识别模块3采用病情特征分析模型对各个患者的就诊患者病历向量进行识别,得到病情特征分析结果。通过病情特征分析结果即可确定各个患者是否携带有传染病。整个过程无需人工参与,节省了人工成本,提高了分析效果。
157.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种电子病历数据分析方法服务端侧的功能或步骤。
158.在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种电子病历数据分析方法客户端侧的功能或步骤。
159.在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
160.获取各个患者各自对应的电子病历数据;
161.根据所述电子病历数据中数据的类型,分别对各个所述电子病历数据中各个类型的数据进行转向量及拼接处理,得到各个患者各自对应的就诊患者病历向量;
162.利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果。
163.处理器执行计算机程序时能够根据信息化技术,将各个患者的个人信息和诊断信息均使用电子病历记录,从而通过电子病历得到有关患者且较为全面的电子病历数据。而后采用预设编码模版和一位有效编码的方式,将各个患者的电子病历数据进行转向量处理,得到就诊患者病历向量。其中,为了简化计算过程,对各个患者依据编码模版得到的高维向量进行降维处理。而后,采用病情特征分析模型对各个患者的就诊患者病历向量进行识别,得到病情特征分析结果。整个过程无需人工参与,节省了人工成本,提高了分析效果。
164.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
165.获取各个患者各自对应的电子病历数据;
166.根据所述电子病历数据中数据的类型,分别对各个所述电子病历数据中各个类型的数据进行转向量及拼接处理,得到各个患者各自对应的就诊患者病历向量;
167.利用病情特征分析模型,分别对每个所述就诊患者病历向量进行计算,得到每个患者对应的病情特征分析结果。
168.存储的计算机程序在执行时会利用信息化技术,将各个患者的个人信息和诊断信息均使用电子病历记录,从而通过电子病历得到有关患者且较为全面的电子病历数据。而后采用预设编码模版和一位有效编码的方式,将各个患者的电子病历数据进行转向量处理,得到就诊患者病历向量。其中,为了简化计算过程,对各个患者依据编码模版得到的高维向量进行降维处理。而后,采用病情特征分析模型对各个患者的就诊患者病历向量进行识别,得到病情特征分析结果。整个过程无需人工参与,节省了人工成本,提高了分析效果。
169.需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。
170.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
171.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
172.以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图