1.本发明涉及一种信息安全、医疗健康以及数据处理技术领域,尤其涉及一种数据识别方法、装置、计算机设备及计算机可读存储介质。
背景技术:
2.随着互联网信息技术的发展,生活中的大部分事件均采用虚拟数据进行记录,例如医院中的就诊记录和治疗记录等,均是存储在存储器中,不仅不仅丢失,而且易于调取查看。
3.在理赔过程中,为了合理为客户进行理赔服务,通常在进行理赔前,需要调取客户的医疗记录。根据医疗记录识别客户是否存在不合理赔付情况,以保证理赔的准确性,防止客户存在医疗浪费、过度医疗等欺诈行为。
4.在现有技术中,通常是核赔人员根据与客户本次理赔对应的医疗记录进行核对,但是医疗记录往往信息繁多,尤其对于严重疾病,容易因核赔人员缺乏相关的专业知识,导致医疗记录合理性的识别结果准确度差,难以发现欺诈行为。
技术实现要素:
5.有鉴于此,本发明提供了一种数据识别方法、装置、计算机设备及计算机可读存储介质,用于解决现有技术中医疗记录的识别准确度差的问题。为达上述之一或部分或全部目的或是其他目的,本发明提出一种数据识别方法、装置、计算机设备及计算机可读存储介质,第一方面:
6.一种数据识别方法,包括:
7.响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据;
8.根据所述医疗理赔数据中各个医疗事件的发生时间,确定至少一个事件窗,其中,每个所述事件窗至少包括一个所述医疗事件;
9.根据所述医疗理赔数据中包含的数据的类型,确定所述医疗理赔数据的组别;
10.将每个所述事件窗对应的事件费用与所述组别中对应的阈值范围进行比较,得到数据识别结果。
11.第二方面:
12.一种数据识别装置,所述装置包括获取模块,用于响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据;
13.事件模块,用于根据所述医疗理赔数据中各个医疗事件的发生时间,确定至少一个事件窗,其中,每个所述事件窗至少包括一个所述医疗事件;
14.组别模块,用于根据所述医疗理赔数据中包含的数据的类型,确定所述医疗理赔数据的组别;
15.识别模块,用于将每个所述事件窗对应的事件费用与所述组别中对应的阈值范围进行比较,得到数据识别结果。
16.第三方面:
17.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述所述数据识别方法的步骤。
18.第四方面:
19.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述所述数据识别方法的步骤。
20.实施本发明实施例,将具有如下有益效果:
21.在对客户的医疗理赔数据进行识别之前,先对医疗理赔数据或者客户的相关信息进行了初步识别,如果发现异常,则会产生异常事件信号,从而触发后续的再次识别过程。即对客户或者医疗理赔数据进行了多次异常识别,有助于提高数据识别结果的准确度。
22.在识别客户的医疗理赔数据是否存在异常时,根据医疗理赔数据中各个医疗事件的发生时间,确定了多个事件窗,而且每个事件窗至少包括一个医疗事件。使得医疗理赔数据中关联性较大的医疗事件能够属于同一个事件窗,相对关联性较小的医疗事件则属于不同的事件窗。从而在后续判断医疗理赔数据中的医疗事件是否存在费用过高时,能够利用事件窗反映出关联事件的总费用,只要总费用合理,则表明对应的所有医疗事件不易存在异常。相较于判断每个医疗事件的费用是否过高,更为简单和合理,而且因单个医疗事件识别的不准确而影响最后的识别结果的准确度。
23.利用医疗理赔数据中的数据的类型确定医疗理赔数据的组别,由于医疗理赔数据中可以包含多个数据的类型,因此能够利用数据的类型匹配到与医疗理赔数据更为接近的组别,从而使用更准确的阈值范围对各个事件窗对应的事件费用进行比较,得到准确度更高的数据识别结果。
附图说明
24.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
25.其中:
26.图1为一个实施例中一种数据识别方法的应用场景示意图。
27.图2为一个实施例中一种数据识别方法的另一应用场景示意图。
28.图3为一个实施例中一种数据识别方法的整体流程图。
29.图4为一个实施例中一种数据识别方法的整体流程框图。
30.图5为一个实施例中一种数据识别方法的事件窗示意图。
31.图6为一个实施例中一种数据识别方法的医疗事件的事件费用示意图。
32.图7为一个实施例中一种数据识别装置的结构框图。
33.图8为一个实施例中计算机设备的一结构示意图。
34.图9为一个实施例中计算机设备的另一结构示意图。
具体实施方式
35.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
36.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
37.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
38.本发明实施例提供一种数据识别方法。可以应用在如图1所示的应用场景中,包括终端001和服务器002。终端001与服务器002通信连接,能够交互数据。在终端001接收到异常事件信号后,终端001响应于异常事件信号,并从服务器002中获取对应客户的医疗理赔数据;根据医疗理赔数据中各个医疗事件的发生时间,确定事件窗,同时根据医疗理赔数据中包含的数据的类型,确定医疗理赔数据的组别;而后将每个事件窗对应的事件费用与组别中对应的阈值范围进行比较,得到针对医疗理赔数据的数据识别结果;最后将数据识别结果输出。服务器002用于存储各个客户的医疗理赔数据,以便在需要对某个客户发起的理赔需求进行欺诈识别时,调取该客户对应的医疗理赔数据。
39.此外,在另一应用场景中,如图2所示,多个终端001均与服务器002连接。终端001用于在接收到客户发起的理赔需求后,对该客户发起的理赔需求进行识别,如果存在异常,则生成针对该客户的异常事件信号,并将异常事件信号上传给服务器002。服务器002获取对应客户的医疗理赔数据;根据医疗理赔数据中各个医疗事件的发生时间,确定事件窗,同时根据医疗理赔数据中包含的数据的类型,确定医疗理赔数据的组别;而后将每个事件窗对应的事件费用与组别中对应的阈值范围进行比较,得到针对医疗理赔数据的数据识别结果;最后根据数据识别结果将客户发起的理赔需求的处理结果推送给对应的终端001。终端001将处理结果进行显示,以供客户进行查看。
40.具体的,终端001可以但不限于是各种智能手机、个人计算机、笔记本电脑、平板电脑、智能控制面板、便携式可穿戴设备或者其他可实施网络连接的设备,服务器002可以用独立的服务器或者是多个服务器组成的服务器集群来实现,对此本实施例不做具体限定。
41.无论是对于保险等金融行业,还是对于医院等医疗行业,通常会推出一些保险项目,一旦客户进行了相关类型疾病的治疗,或者购买了指定的药品,客户都可以到保险公司或者医院申请理赔。而在理赔过程中,为了合理为客户进行理赔服务,通常在进行理赔前,需要调取客户的医疗记录。根据医疗记录识别客户是否存在不合理赔付情况,以保证理赔的准确性,防止客户存在医疗浪费、过度医疗等欺诈行为。
42.在现有技术中,通常是核赔人员根据与客户本次理赔对应的医疗记录进行核对,但是医疗记录往往信息繁多,尤其对于严重疾病,容易因核赔人员缺乏相关的专业知识,导致医疗记录合理性的识别结果准确度差,难以发现欺诈行为。
43.基于此,本发明实施例提供的一种数据识别方法,如图3所示,包括:
44.101、响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据。
45.在一实施例中,客户发起理赔需求后,会先对客户发起理赔需求事件进行异常评估,若评估结果为异常,则针对该客户发起的理赔需求产生异常事件信号。具体的,本实施例对评估方式不作具体限定,为了便于理解,例如,在一应用场景中,对客户发起的理赔需求中的理赔金额进行评估,若理赔金额超过预设的阈值,则判定为异常事件,并产生异常事件信号;在另一应用场景中,对客户发起的理赔需求的频率进行评估,若改名客户在短时间内发起了多次理赔需求,则判定本次理赔需求属于异常事件,产生对应的异常事件信号。
46.异常事件信号关联有能够区分客户的信息或者异常事件信号中携带有能够区分客户的信息,本实施例对此不作具体限定。其中,能够区分客户的信息可以是客户编号,也可以是客户身份证号或者电话号码,旨在根据客户的信息能够识别出唯一的客户即可。
47.在得到异常事件信号后,从存储空间中调取对应客户的医疗理赔数据。需要说明的是,医疗理赔数据指与医疗有关的理赔数据,例如客户需要理赔有关治疗疾病的费用,则治疗疾病过程中产生的治疗数据、医院数据等均可以判定为医疗理赔数据。即,本实施例中的医疗理赔数据旨在能够表征客户在治疗上产生的数据。
48.需要说明的是,本实施例中的医疗理赔数据不仅包括客户需要进行理赔的数据,还可以包括客户之前已经进行过理赔的数据,即客户的历史理赔数据。
49.102、根据所述医疗理赔数据中各个医疗事件的发生时间,确定至少一个事件窗。
50.在一实施例中,每个所述事件窗至少包括一个所述医疗事件。
51.在一实施例中,医疗事件指在客户治疗疾病过程中经历的事件,例如挂号事件、问诊事件、治疗事件等。
52.在一实施例中,医疗理赔数据中包含客户在治疗疾病过程中所经历的所有事件,在需要对客户的医疗理赔数据的医疗事件进行完善时,可以通过到医院的疾病库、处方治疗库、医院医生库等数据库中查找相关数据,而后按照各个医疗事件的发生时间,形成整个治疗过程,本实施例对此不作具体限定。
53.为了便于理解,例如,对于治疗癌症的客户,在客户申请理赔时,获取客户的医疗理赔数据。则医疗理赔数据中会包括客户确诊癌症时的医院信息、诊断过程(即做了哪些检查)、诊断结果,以及各个时间发生的事件,还会包括客户进行化疗时的医院信息、化疗时间、化疗费用,还会包括客户复诊时的医院信息、诊断过程、诊断结果、所用费用等。可见,医疗理赔数据中至少包括各个医疗事件的发生时间和所花费的费用。需要确定事件窗时,则可以根据各个医疗事件发生时间之间的时间距离,将确诊和化疗确定为一个事件窗,确诊和化疗所花费的费用则为该事件窗对应的费用;因为复诊的发生时间与化疗的发生时间间隔较长,则将复诊确定为第二个事件窗,复诊所花费的费用则为第二个事件窗对应的费用。
54.103、根据所述医疗理赔数据中包含的数据的类型,确定所述医疗理赔数据的组别。
55.医疗理赔数据中包含有多种类型的数据,即医疗理赔数据中的数据之间具有数据的类型的差别。为了便于理解,例如,客户的医疗理赔数据中包括客户年龄、主要疾病、合并症疾病、并发症疾病、治疗方式、疾病严重程度等,均可以判定为不同的数据的类型。需要说明的是,在一实施例中,所称的数据的类型不同,指数据所表征的含义属于不同类型的含
义,例如用于表征客户基本信息含义的数据与用于表征客户主要疾病含义的数据为不同类型的数据。
56.在一实施例中,组别预设设置有多个,通过医疗理赔数据中包含的数据的类型,判断医疗理赔数据属于哪个预设的组合,从而实现组别的确定。
57.104、将每个所述事件窗对应的事件费用与所述组别中对应的阈值范围进行比较,得到数据识别结果。
58.在一实施例中,每个事件窗均对应有至少一个医疗事件,每个医疗事件均对应有费用,将每个事件窗中包含的所有医疗事件的费用求和后,作为该事件窗的事件费用。每个组合均对应有至少一个阈值范围,阈值范围用于衡量事件费用的合理性。将每个事件窗对应的事件费用与组别中对应的阈值范围进行比较,即可确定各个事件窗的事件费用是否处于合理范围。如果有任一个事件费用超过了对应的阈值范围,则证明客户的医疗理赔数据存在异常,生成异常的数据识别结果。此外,在一实施例中,数据识别结果还可以使用0和1进行表示,其中,0表示正常,1表示异常。本实施例对于数据识别结果的具体内容不作限定,旨在能够表征医疗理赔数据是否异常即可。
59.需要说明的是,在一实施例中,各个组别中对应的阈值范围根据同组别中其他无异常的医疗理赔数据确定。由于组别是根据医疗理赔数据包含的数据的类型进行确定的,因此,能够确定为同一个组别的多个医疗理赔数据中,包含了相同数据的类型的数据,也就是说,对于相同组别中的各个医疗理赔数据,对应客户的主要疾病、并发症疾病等均相同,因此,相同组别中的各个医疗理赔数据对应的事件费用也应相差不多。根据这一原理,利用各个组别中无异常的医疗理赔数据能够得到无异常时的事件费用,从而将其作为阈值范围即可。
60.通过上述步骤,在对客户的医疗理赔数据进行识别之前,先对医疗理赔数据或者客户的相关信息进行了初步识别,如果发现异常,则会产生异常事件信号,从而触发后续的再次识别过程。即对客户或者医疗理赔数据进行了多次异常识别,有助于提高数据识别结果的准确度。
61.在识别客户的医疗理赔数据是否存在异常时,根据医疗理赔数据中各个医疗事件的发生时间,确定了多个事件窗,而且每个事件窗至少包括一个医疗事件。使得医疗理赔数据中关联性较大的医疗事件能够属于同一个事件窗,相对关联性较小的医疗事件则属于不同的事件窗。从而在后续判断医疗理赔数据中的医疗事件是否存在费用过高时,能够利用事件窗反映出关联事件的总费用,只要总费用合理,则表明对应的所有医疗事件不易存在异常。相较于判断每个医疗事件的费用是否过高,更为简单和合理,而且因单个医疗事件识别的不准确而影响最后的识别结果的准确度。
62.利用医疗理赔数据中的数据的类型确定医疗理赔数据的组别,由于医疗理赔数据中可以包含多个数据的类型,因此能够利用数据的类型匹配到与医疗理赔数据更为接近的组别,从而使用更准确的阈值范围对各个事件窗对应的事件费用进行比较,得到准确度更高的数据识别结果。
63.在本技术实施例的另一种实施方式中,所述根据所述医疗理赔数据中包含的数据的类型,确定所述医疗理赔数据的组别,包括:
64.201、将所述医疗理赔数据中所有类型的数据分别与预设的各个分组条件进行比
对。
65.在一实施例中,确定医疗理赔数据的组别时采用疾病诊断相关分组(diagnosis related groups,drg)方法,医疗理赔数据中包含的不同类型的数据包括drg版本、主诊断编码(icd-10)、其他诊断编码、主操作编码、性别、年龄、就诊类型、住院天数、离院方式(医嘱离院、医嘱转院、非医嘱离院等)等。
66.分组条件为预先设置,每个组别均对应有分组条件,如果医疗理赔数据中所有类型的数据均符合某一个分组条件中的要求,则将医疗理赔数据确定为该分组条件对应的组别。
67.为了便于理解,例如,在一应用场景中,组别a的分组条件是年龄大于60岁、主要疾病为癌症、具有并发症c1和c2、治疗方式为化疗。将医疗理赔数据中的年龄数据、主要疾病数据、并发症疾病数据、治疗方式数据分别进行比较,如果全部符合,则判定医疗理赔数据与该分组条件匹配,确定医疗理赔数据属于组别a。
68.202、在所述医疗理赔数据中所有类型的数据与任一个所述分组条件匹配时,将所述医疗理赔数据确定为该所述分组条件对应的组别。
69.需要说明的是,在一实施例中,将drg分组与分组比对过程通过模型实现。其中,模型可以是无监督模型,也可以是其他神经网络模型,本实施例对此不做具体限定。旨在该模型能够识别出医疗理赔数据中不同类型的数据,并将医疗理赔数据与各个预设的分组条件进行比对即可。
70.通过上述步骤,利用预设的分组条件对医疗理赔数据中所有类型的数据进行约束,在医疗理赔数据中所有类型的数据与某个分组条件完全匹配时,才将医疗理赔数据确定为对应的组别,有利于提高阈值范围与医疗理赔数据的适配度,从而提高数据识别结果的准确度。
71.在本技术实施例的另一种实施方式中,所述分组条件中至少包含疾病诊断类型和并发症类型的数据。
72.在一实施例中,对于医院等医疗领域,具有并发症的疾病的治疗费用往往较高,在分组条件中设置并发症类型,使医疗理赔数据在匹配分组条件时,并发症类型也需要相同,从而有助于提高阈值范围与医疗理赔数据的适配度,从而提高数据识别结果的准确度。
73.在本技术实施例的另一种实施方式中,所述根据所述医疗理赔数据中各个医疗事件的发生时间,确定至少一个事件窗,包括:
74.401、将所述医疗理赔数据中对应同一种疾病,且发生时间的时间间隔小于预设第一时间阈值的所述医疗事件聚合为一个所述事件窗。
75.在一实施例中,同一种疾病指的是主要疾病,不包括合并症疾病和并发症疾病。例如,客户a的主要疾病是k1,客户b的主要疾病是k2,但是客户b的并发症中包含有k1,对于此种情况,客户a与b仍不属于具有同一种疾病。
76.第一时间阈值根据具体的疾病进行设置,例如对于慢性病,第一时间阈值则可以设置的较大,对于在短时间内则可以治好的疾病,第一时间阈值则可以设置的较小。
77.402、将所述医疗理赔数据中对应同一种疾病,且发生时间的时间间隔大于预设第二时间阈值的所述医疗事件划分到不同的所述事件窗。
78.第二时间阈值与第一时间阈值的设置原理相同,均根据具体的疾病进行设置。在
时间间隔大于第二时间阈值时,证明两个医疗事件在花费上容易产生较大差异,划分到不同的事件窗,利于保证识别结果的准确度。
79.在本技术实施例的另一种实施方式中,在所述响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据之前,所述方法还包括:
80.501、响应于理赔识别信号,获取对所述理赔识别信号对应的客户的所述医疗理赔数据,所述医疗理赔数据中包括客户信息、历史理赔和投保记录。
81.在一实施例中,在客户发起理赔需求时,产生理赔识别信号。理赔识别信号关联有或者包含有能够区分客户的信息,根据客户的信息到存储空间中调取客户信息、历史理赔和投保记录等数据作为医疗理赔数据。
82.502、根据预设的打分规则对所述医疗理赔数据进行打分,得到分数结果。
83.在一实施例中,预设有打分规则,通过打分规则能够对各个医疗理赔数据进行打分。旨在根据分数结果判断医疗理赔数据是否存在异常,本实施例对于打分规则的具体内容不作限定。为了便于理解,在一应用场景中,根据医疗理赔数据中需要理赔的金额进行打分,如果超过预设的金额阈值,则分数为0,反之分数为1;在另一应用场景中,由于医疗理赔数据中不仅包括客户目前需要进行理赔的数据,还包括客户之前已经进行过理赔的数据,因此根据客户发起理赔的频率进行打分,如果在预设的时间长度内,客户发起理赔的次数大于次数阈值,则分数结果为0,反之分数结果为1;在其他应用场景中,根据医疗理赔数据中治疗地点的变化进行打分,如果客户进行疾病治疗的地点发生跨医院、跨市或跨省的变化,则分数结果为0,反之分数结果为1。此外,也可以同时对费用、频率和地点变化进行评估,而后综合打分,得到分数结果。
84.503、在所述分数结果大于预设的异常阈值时,生成所述异常事件信号。
85.通过上述内容,通过单项数据,先对医疗理赔数据进行预评估,判断医疗理赔数据的异常情况,有利于提高异常识别结果的准确度。
86.在本技术实施例的另一种实施方式中,在所述响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据之前,所述方法还包括:
87.对所述医疗理赔数据进行结构化整合,以使各个客户对应的所述医疗理赔数据的结构相同。
88.在一实施例中,对医疗理赔数据进行结构化的整合包括对医疗理赔数据中各个数据的类型、长度、顺序等进行整合,本实施例对此不作具体限定,可以通过预设标准化结构的数据模板,根据数据模板中包含的数据种类和各个数据的结构对医疗理赔数据进行整合,使各个整合后的医疗理赔数据包含的数据种类和各个数据的结构相同。此外,还可以对医疗理赔数据进行清洗、归一化等处理,本实施例对此不作具体限定。
89.通过上述步骤,统一各个医疗理赔数据的结构,有助于提高医疗理赔数据的质量以及后续对医疗理赔数据进行识别、分析的效率和准确度,从而有助于提高识别结果的准确度。
90.在本技术实施例的另一种实施方式中,在所述将每个所述事件窗对应的事件费用与所述组别中对应的阈值范围进行比较,得到数据识别结果之后,所述方法还包括:
91.在所述数据识别结果表征无异常时,对所述医疗理赔数据进行理赔处理,并更新对应客户的历史理赔。
92.通过上述步骤,对客户进行理赔处理后,将本次进行了理赔的数据以及理赔处理过程中的数据,例如理赔金额、理赔时间等更新到客户的历史理赔中,便于在该客户后续进行再次理赔申请时,提高后续异常识别的准确度。
93.为了便于理解,如图4所示,在客户发起理赔请求后,模型一接收到理赔识别信号。根据理赔识别信号从数据库中调取发起理赔请求的客户的客户信息、历史理赔和投保记录,形成医疗理赔数据。而后模型1根据预设的打分规则对医疗理赔数据进行打分,得到分数结果,如果判定为正常件,则进入理赔处理流程,并在理赔处理完成后,更新该客户的历史理赔;如果判定为异常件,则将医疗理赔数据作为模型二的入参,模型二先根据医疗理赔数据中包含的数据的类型,采用drg分组方法确定组别,而后如图5所示,根据医疗理赔数据中各个医疗事件的发生时间,例如客户共化疗了8次,复查了一次,确定事件窗。最后得到如图6所示的各个事件窗各自对应的事件费用,将各个事件费用与对应组别中对应的阈值范围进行比较,得到数据识别结果。如果数据识别结果为1,则表明医疗理赔数据存在异常,存在欺诈行为,将医疗理赔数据输出,供人工复核;如果数据识别结果为0,则判定医疗理赔数据不存在异常,进行正常的理赔处理流程。
94.此外,在drg分组规范更新时,医疗知识库同步周期性更新,模型二根据新数据的录入,周期性迭代更新。
95.本技术实施例还公开一种数据识别装置,如图7所示,所述装置包括:
96.获取模块1,用于响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据;
97.事件模块2,用于根据所述医疗理赔数据中各个医疗事件的发生时间,确定至少一个事件窗,其中,每个所述事件窗至少包括一个所述医疗事件;
98.组别模块3,用于根据所述医疗理赔数据中包含的数据的类型,确定所述医疗理赔数据的组别。
99.识别模块4,用于将每个所述事件窗对应的事件费用与所述组别中对应的阈值范围进行比较,得到数据识别结果。
100.通过上述内容,在识别客户的医疗理赔数据是否存在异常时,事件模块2根据医疗理赔数据中各个医疗事件的发生时间,确定了多个事件窗,而且每个事件窗至少包括一个医疗事件。使得医疗理赔数据中关联性较大的医疗事件能够属于同一个事件窗,相对关联性较小的医疗事件则属于不同的事件窗。从而在后续判断医疗理赔数据中的医疗事件是否存在费用过高时,能够利用事件窗反映出关联事件的总费用,只要总费用合理,则表明对应的所有医疗事件不易存在异常。相较于判断每个医疗事件的费用是否过高,更为简单和合理,而且因单个医疗事件识别的不准确而影响最后的识别结果的准确度。
101.组别模块3利用医疗理赔数据中的数据的类型确定医疗理赔数据的组别,由于医疗理赔数据中可以包含多种数据的类型,因此能够利用数据的类型匹配到与医疗理赔数据更为接近的组别,从而使识别模块4能够使用更准确的阈值范围对各个事件窗对应的事件费用进行比较,得到准确度更高的数据识别结果。
102.在本技术的另一种实施方式中,所述组别模块3包括比对单元,用于将所述医疗理赔数据中所有类型的数据分别与预设的各个分组条件进行比对;
103.确定单元,用于在所述医疗理赔数据中所有类型的数据与任一个所述分组条件匹
配时,将所述医疗理赔数据确定为该所述分组条件对应的组别。
104.在本技术的另一种实施方式中,所述分组条件中至少包含疾病诊断类型和并发症类型的数据。
105.在本技术的另一种实施方式中,所述事件模块2包括第一单元,用于将所述医疗理赔数据中对应同一种疾病,且发生时间的时间间隔小于预设第一时间阈值的所述医疗事件聚合为一个所述事件窗;
106.第二单元,用于将所述医疗理赔数据中对应同一种疾病,且发生时间的时间间隔大于预设第二时间阈值的所述医疗事件划分到不同的所述事件窗。
107.在本技术的另一种实施方式中,所述数据识别装置还包括预处理模块,用于在所述响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据之前,响应于理赔识别信号,获取对所述理赔识别信号对应的客户的所述医疗理赔数据,所述医疗理赔数据中包括客户信息、历史理赔和投保记录;
108.分数模块,用于根据预设的打分规则对所述医疗理赔数据进行打分,得到分数结果;
109.生成模块,用于在所述分数结果大于预设的异常阈值时,生成所述异常事件信号。
110.在本技术的另一种实施方式中,所述数据识别装置还包括结构模块,用于在所述响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据之前,对所述医疗理赔数据进行结构化整合,以使各个客户对应的所述医疗理赔数据的结构相同。
111.在本技术的另一种实施方式中,所述数据识别装置还包括更新模块,用于在所述将每个所述事件窗对应的事件费用与所述组别中对应的阈值范围进行比较,得到数据识别结果之后,在所述数据识别结果表征无异常时,对所述医疗理赔数据进行理赔处理,并更新对应客户的历史理赔。
112.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据识别方法服务端侧的功能或步骤。
113.在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种数据识别方法客户端侧的功能或步骤。
114.在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
115.响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据;
116.根据所述医疗理赔数据中各个医疗事件的发生时间,确定至少一个事件窗,其中,每个所述事件窗至少包括一个所述医疗事件;
117.根据所述医疗理赔数据中包含的数据的类型,确定所述医疗理赔数据的组别;
118.将每个所述事件窗对应的事件费用与所述组别中对应的阈值范围进行比较,得到数据识别结果。
119.处理器执行计算机程序时能够在识别客户的医疗理赔数据是否存在异常时,根据医疗理赔数据中各个医疗事件的发生时间,确定了多个事件窗,而且每个事件窗至少包括一个医疗事件。使得医疗理赔数据中关联性较大的医疗事件能够属于同一个事件窗,相对关联性较小的医疗事件则属于不同的事件窗。从而在后续判断医疗理赔数据中的医疗事件是否存在费用过高时,能够利用事件窗反映出关联事件的总费用,只要总费用合理,则表明对应的所有医疗事件不易存在异常。相较于判断每个医疗事件的费用是否过高,更为简单和合理,而且因单个医疗事件识别的不准确而影响最后的识别结果的准确度。
120.利用医疗理赔数据中的数据的类型确定医疗理赔数据的组别,由于医疗理赔数据中可以包含多个数据的类型,因此能够利用数据的类型匹配到与医疗理赔数据更为接近的组别,从而使用更准确的阈值范围对各个事件窗对应的事件费用进行比较,得到准确度更高的数据识别结果。
121.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
122.响应于异常事件信号,获取与所述异常事件信号对应的客户的医疗理赔数据;
123.根据所述医疗理赔数据中各个医疗事件的发生时间,确定至少一个事件窗,其中,每个所述事件窗至少包括一个所述医疗事件;
124.根据所述医疗理赔数据中包含的数据的类型,确定所述医疗理赔数据的组别;
125.将每个所述事件窗对应的事件费用与所述组别中对应的阈值范围进行比较,得到数据识别结果。
126.存储的计算机程序在执行时会在识别客户的医疗理赔数据是否存在异常时,根据医疗理赔数据中各个医疗事件的发生时间,确定了多个事件窗,而且每个事件窗至少包括一个医疗事件。使得医疗理赔数据中关联性较大的医疗事件能够属于同一个事件窗,相对关联性较小的医疗事件则属于不同的事件窗。从而在后续判断医疗理赔数据中的医疗事件是否存在费用过高时,能够利用事件窗反映出关联事件的总费用,只要总费用合理,则表明对应的所有医疗事件不易存在异常。相较于判断每个医疗事件的费用是否过高,更为简单和合理,而且因单个医疗事件识别的不准确而影响最后的识别结果的准确度。
127.利用医疗理赔数据中的数据的类型确定医疗理赔数据的组别,由于医疗理赔数据中可以包含多个数据的类型,因此能够利用数据的类型匹配到与医疗理赔数据更为接近的组别,从而使用更准确的阈值范围对各个事件窗对应的事件费用进行比较,得到准确度更高的数据识别结果。
128.需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。
129.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以
通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
130.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
131.以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。