1.本说明书涉及计算机技术领域,尤其涉及一种对话意图识别方法、装置、存储介质及电子设备。
背景技术:
2.随着ai技术的发展,社会上涌现了很多对话机器人,比如微软小冰,谷歌助手等。对话机器人通常是基于大量样本对神经网络模型经过迭代训练后得到,在此过程中需要大量训练样本使得模型收敛。
3.然而,在某些需要对话的场景中,由于场景存在时间较短,场景活跃用户较少,可能不存在较多的训练样本供模型进行训练,此时对话机器人就无法在此类场景中进行对话。
技术实现要素:
4.本说明书实施例提供的一种对话意图识别方法、装置、存储介质及电子设备,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。所述技术方案如下:
5.第一方面,本说明书实施例提供了一种对话意图识别方法,应用于对话意图匹配表和对话意图识别模型,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述对话意图匹配表包括指定对话数据和对话意图的对应关系,所述小样本子模型为基于少量样本训练数据训练的识别模型,所述主分类子模型为基于大量样本训练数据训练的识别模型,所述方法包括:
6.实时采集用户输入的对话数据;
7.基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;
8.基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。
9.第二方面,本说明书实施例提供了一种对话意图识别模型训练方法,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述方法包括:
10.当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;
11.基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;
12.基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;
13.基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。
14.第三方面,本说明书实施例提供了一种对话意图识别装置,所述装置包括:
15.对话数据采集模块,用于实时采集用户输入的对话数据;
16.对话意图识别模块,用于基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;
17.对话意图确定模块,用于基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。
18.第四方面,本说明书实施例提供了一种对话意图识别模型训练装置,所述装置包括:
19.对话数据提取模块,用于当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;
20.训练数据生成模块,用于基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;
21.第一模型训练模块,用于基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;
22.第二模型训练模块,用于基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。
23.第五方面,本说明书实施例提供一种计算机程序产品,所述计算机程序产品存储有至少一条指令,所述至少一条指令适于由处理器加载并执行上述的方法步骤。
24.第六方面,本说明书实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行上述的方法步骤。
25.第七方面,本说明书实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
26.本说明书一些实施例提供的技术方案带来的有益效果至少包括:
27.采用本说明书实施例提供的对话意图识别方法,首先实时采集用户输入的对话数据,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结
果,然后基于对话意图匹配表、小样本子模型对应的第一识别范围以及主分类子模型对应的第二识别范围从各对话意图识别结果中确定对话数据对应的对话意图,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
附图说明
28.为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
29.图1为本说明书实施例提供的一种对话意图识别方法的流程示意图;
30.图2为本说明书实施例提供的一种对话意图识别的举例示意图;
31.图3为本说明书实施例提供的一种对话意图识别的举例示意图;
32.图4为本说明书实施例提供的一种对话意图识别方法的流程示意图;
33.图5为本说明实施例提供的一种对话意图识别模型训练方法的流程示意图;
34.图6为本说明实施例提供的一种对话意图识别模型训练方法的流程示意图;
35.图7为本说明书实施例提供的一种对话意图识别装置的结构示意图;
36.图8为本说明书实施例提供的一种对话意图识别装置的结构示意图;
37.图9为本说明书实施例提供的一种对话意图识别模型训练装置的结构示意图;
38.图10为本说明书实施例提供的一种电子设备的结构方框图。
具体实施方式
39.下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
40.在本说明书的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本说明书的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本说明书中的具体含义。此外,在本说明书的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
41.下面结合在本说明书实施例中实施例进行详细说明。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是如所附权利要求
书中所详述的、本说明书的一些方面相一致的装置和方法的例子。附图中所示的流程图仅是示例性说明,不是必须按照所示步骤执行。例如,有的步骤是并列的,在逻辑上并没有严格的先后关系,因此实际执行顺序是可变的。
42.请参见图1,为本说明书实施例提供的一种对话意图识别方法的流程示意图。在本说明书实施例中,所述对话意图识别方法应用于对话意图识别装置或配置有对话意图识别装置的电子设备,对话意图识别装置或配置有对话意图识别装置的电子设备包括对话意图匹配表和对话意图识别模型,对话意图识别模型包括小样本子模型以及主分类子模型,对话意图匹配表包括指定对话数据和对话意图的对应关系,小样本子模型为基于少量样本训练数据训练的识别模型,主分类子模型为基于大量样本训练数据训练的识别模型。下面将针对图1所示的流程进行详细的阐述,所述对话意图识别方法具体可以包括以下步骤:
43.s102,实时采集用户输入的对话数据;
44.在本说明书实施例中,实时采集用户输入的对话数据,对话数据为用户在会话界面数据输入的会话数据,对话数据用于对话意图识别装置基于对话意图匹配表和对话意图识别模型对对话数据进行对话意图识别。其中,对话意图匹配表包括指定对话数据和对话意图的对应关系,小样本子模型为基于少量样本训练数据训练的识别模型,主分类子模型为基于大量样本训练数据训练的识别模型。
45.需要说明的是,小样本子模型为轻量级的神经网络模型,仅需少量样本训练数据即可使得模型收敛,训练后的模型具有一定的泛化性且具有灵活配置的特点;主分类子模型为重量级的神经网络模型,需要大量样本训练数据进行迭代训练,训练后的模型具有较好的泛化性。
46.可选的,小样本子模型可以为语义解析网络加分类网络的结构,其中语义解析网络用于对对话数据进行语义解析,生成对话数据对应的词向量,分类网络用于对词向量进行分类,以确定对话数据对应的对话意图。其中,语义解析网络可以为word2vec、sentence-bert、all-mpnet-base-v2等轻量化的神经网络,分类网络可以为svm支持向量机网络或fc全连接层网络。
47.可选的,主分类子模型可以为语义解析网络加分类网络的结构,其中语义解析网络用于对对话数据进行语义解析,生成对话数据对应的词向量,分类网络用于对词向量进行分类,以确定对话数据对应的对话意图。其中,语义解析网络可以为bert编码网络,分类网络可以为fc全连接层网络。
48.需要说明的是,在本说明书实施例中,小样本子模型和主分类子模型为需要基于样本训练数据进行模型训练的神经网络模型,每次训练结束后可以确定小样本子模型和主分类子模型可识别的对话意图,其中,模型训练所需的样本训练数据可从用户对话日志中获取。
49.在将对话意图匹配表和对话意图识别模型布置在新场景的初期阶段,因为缺少相关的样本训练数据,对话意图识别模型中的小样本子模型和主分类子模型无法识别用户在新场景中对话数据的对话意图,则此时仅基于对话意图匹配表对对话数据进行对话意图匹配,确定对话数据对应的对话意图。
50.值得一提的是,每次对话的会话内容数据会存储在对话日志中,待对话日志中累积的对话数据达到预设数量时,可从对话日志中提取预设数量的对话数据和各对话数据分
别对应的对话意图,根据对话数据和对话意图生成样本训练数据,基于样本训练数据对对话意图识别模型中的小样本子模型和主分类子模型进行训练,并确定训练结束后的小样本子模型和主分类子模型可识别的对话意图。以便于对后续采集的对话数据,使用对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果。
51.s104,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果;
52.在本说明书实施例中,在采集得到对话数据之后,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果。其中,小样本子模型和主分类子模型为经过对话日志中样本训练数据训练后的神经网络模型,小样本子模型可识别的对话意图对应于第一识别范围,主分类子模型可识别的对话意图对应于第二识别范围。
53.可选的,所述对话意图匹配表对应的对话意图识别结果可以为指示对话意图匹配表无法识别对话数据的指示信息,也可以为确定的对话意图。当对话意图匹配表无法识别对话数据时,生成无法识别对话数据的对话意图识别结果,当对话意图匹配表可以识别对话数据时,生成对话意图识别结果为确定的对话意图。可以理解是,对话意图匹配表中包含了对话数据和对话意图之间一一对应的对应关系,不具备泛化性,针对对话意图匹配表中不存在的对话数据,对话意图匹配表无法识别。
54.在本说明书实施例中,若小样本子模型不存在第一识别范围且主分类子模型不存在第二识别范围,则在采集到对话数据后,仅基于对话意图匹配表对对话数据进行对话意图匹配,确定对话数据对应的对话意图。
55.s106,基于对话意图匹配表、小样本子模型对应的第一识别范围以及主分类子模型对应的第二识别范围从各对话意图识别结果中确定对话数据对应的对话意图,第一识别范围包括小样本子模型可识别的对话意图,第二识别范围包括主分类子模型可识别的对话意图。
56.其中,第一识别范围为小样本子模型经过模型训练后确定的可识别的样本意图范围,第一识别范围包含了小样本子模型可识别的各样本意图类型,第二识别范围为主分类子模型经过模型训练后确定的可识别的样本意图范围,第二识别范围包含了主分类子模型可识别的各样本意图类型。
57.在本说明书实施例中,在基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果之后,根据对话意图匹配表、小样本子模型可识别的样本意图范围、主分类子模型可识别的样本意图范围在对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果中确定对话数据对应的对话意图。
58.需要说明的是,在采集得到用户输入的对话数据之后,在与对话数据对应的场景中,若小样本子模型和主分类子模型不存在可识别的对话意图,则表明小样本子模型和主分类子模型对该对话数据没有对话意图识别效果,此时,仅基于对话意图匹配表对用户输入的对话数据作匹配处理。
59.请参见图2,为本说明书实施例提供的一种对话意图识别的举例示意图。如图2所示,在小样本子模型和主分类子模型对场景下的对话数据不具备对话意图识别效果时,针对实时采集的对话数据仅基于对话意图匹配表识别对话数据对应的对话意图,实时采集的对话数据以及识别得到的对话意图被存储收集在对话日志中。
60.待对话日志中积累足够多的对话数据样本之后,提取对话日志中的对话数据生成样本训练数据,基于样本训练数据对小样本子模型和主分类子模型进行训练,得到训练结束的小样本子模型,并确定训练结束的小样本子模型对应的第一识别范围,第一识别范围包括小样本子模型可识别的对话意图,得到训练结束的主分类子模型,并确定训练结束的主分类子模型对应的第二识别范围,第二识别范围包括主分类子模型可识别的对话意图。
61.另一种情况下,在采集得到用户输入的对话数据之后,在与对话数据对应的场景中,若小样本子模型和主分类子模型存在可识别的对话意图,则表明小样本子模型和主分类子模型对该场景下某些对话意图具有识别效果,此时,基于对话意图匹配表、小样本子模型和主分类子模型分别对用户输入的对话数据进行对话意图识别处理,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果,然后在对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果中确定准确性最高的对话意图识别结果为对话数据对应的对话意图。
62.请参见图3,为本说明书实施例提供的一种对话意图识别的举例示意图。如图3所示,在小样本子模型和主分类子模型存在可识别的对话意图,即小样本子模型和主分类子模型对场景下的对话数据具备对话意图识别效果时,此时,针对实时采集的对话数据,基于对话意图匹配表、小样本子模型和主分类子模型分别对用户输入的对话数据进行对话意图识别处理,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果,并在对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果中确定准确性最高的对话意图识别结果为对话数据对应的对话意图。实时采集的对话数据以及确定的对话意图被存储收集在对话日志中。
63.可以理解的是,对话意图匹配表中预设有对话数据和对话意图一一对应的对应关系,具有最高的准确性,但是由于对话意图匹配表不具有泛化性,可匹配的对话数据的数量较少。小样本子模型基于少量样本进行训练后,可对部分对话意图进行识别,并具有一定泛化性,其识别准确性低于主分类子模型。主分类子模型基于大量样本训练后,针对可识别的对话意图具有较强的泛化性,且识别准确性较高。
64.在本说明书一个实施例中,若对话意图匹配表对应的对话意图识别结果为确定的对话意图,则将对话意图匹配表对应的对话意图识别结果作为对话数据对应的对话意图。
65.在本说明书一个实施例中,若对话意图匹配表对应的对话意图识别结果指示对话意图匹配表无法识别对话数据,则基于第一识别范围以及第二识别范围从小样本子模型、主分类子模型分别对应的对话意图识别结果中确定对话数据对应的对话意图。
66.可选的,若所述小样本子模型对应的对话意图识别结果存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果不存在于所述第二识别范围中,则将所述小样本子模型对应的对话意图识别结果作为所述对话数据对应的对话意图;
67.可选的,若所述小样本子模型对应的对话意图识别结果存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果存在于所述第二识别范围中,则将所述主
分类子模型对应的对话意图识别结果作为所述对话数据对应的对话意图;
68.可选的,若所述小样本子模型对应的对话意图识别结果不存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果存在于所述第二识别范围中,则将所述主分类子模型对应的对话意图识别结果作为所述对话数据对应的对话意图。
69.在本说明书实施例中,首先实时采集用户输入的对话数据,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果,然后基于对话意图匹配表、小样本子模型对应的第一识别范围以及主分类子模型对应的第二识别范围从各对话意图识别结果中确定对话数据对应的对话意图,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
70.请参见图4,为本说明书实施例提供的一种对话意图识别方法的流程示意图。如图4所示,对话意图识别方法可以包括以下步骤:
71.s202,实时采集用户输入的对话数据;
72.在本说明书实施例中,步骤s202请参见本技术另一实施例中对步骤s102的详细描述,在此不再赘述。
73.s204,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果;
74.在本说明书实施例中,在采集得到对话数据之后,基于对话意图匹配表中记录的各对话数据和对话意图的对应关系,得到对话意图匹配表对所采集的对话数据生成的对话意图识别结果;将采集到的对话数据输入至小样本子模型中,小样本子模型输出对应的对话意图识别结果;将采集到的对话数据输入至主分类子模型中,主分类子模型输出对应的对话意图识别结果。
75.s206,若对话意图匹配表对应的对话意图识别结果为确定的对话意图,则将对话意图匹配表对应的对话意图识别结果作为对话数据对应的对话意图;
76.可以理解的是,在对话意图匹配表中预设有对话数据和对话意图一一对应的对应关系,虽然不具有泛化性,但是对于对话意图匹配表可识别的对话数据,匹配得到的对话意图必然是准确的。因此,在基于对话意图匹配表对采集的用户输入的对话数据进行对话意图识别后,若对话意图匹配表可识别对话数据对应的对话意图,即得到的对话意图识别结果为确定的对话意图,此时直接将该对话意图识别结果对应的对话意图作为对话数据对应的对话意图。
77.s208,若对话意图匹配表对应的对话意图识别结果指示对话意图匹配表无法识别对话数据,则基于第一识别范围以及第二识别范围从小样本子模型、主分类子模型分别对应的对话意图识别结果中确定对话数据对应的对话意图。
78.可以理解的是,由于对话意图匹配表不具有泛化性,仅可识别记录在表中的对话数据的对话意图,在基于对话意图匹配表对采集的用户输入的对话数据进行对话意图识别后,若对话意图匹配表无法识别对话数据对应的对话意图,此时,则根据小样本子模型对应
的第一识别范围、主分类子模型对应的第二识别范围从小样本子模型、主分类子模型分别对应的对话意图识别结果中确定对话数据对应的对话意图。
79.可选的,若小样本子模型对应的对话意图识别结果存在于第一识别范围中且主分类子模型对应的对话意图识别结果不存在于第二识别范围中,则将小样本子模型对应的对话意图识别结果作为对话数据对应的对话意图;
80.可以理解的是,小样本子模型对对话数据进行对话意图识别后的对话意图识别结果存在于第一识别范围中,表明对话数据对应的对话意图可以被小样本子模型进行有效识别。主分类子模型对应的对话意图识别结果不存在于第二识别范围中,表明对话数据对应的对话意图不可以被主分类子模型进行有效识别。此时,直接将小样本子模型对对话数据的对话意图识别结果作为对话数据对应的对话意图。
81.可选的,若小样本子模型对应的对话意图识别结果存在于第一识别范围中且主分类子模型对应的对话意图识别结果存在于第二识别范围中,则将主分类子模型对应的对话意图识别结果作为对话数据对应的对话意图;
82.可以理解的是,小样本子模型对对话数据进行对话意图识别后的对话意图识别结果存在于第一识别范围中,表明对话数据对应的对话意图可以被小样本子模型进行有效识别。主分类子模型对应的对话意图识别结果存在于第二识别范围中,表明对话数据对应的对话意图可以被主分类子模型进行有效识别。此时,由于主分类子模型是基于大量样本训练数据训练得到的模型,在小样本子模型和主分类子模型均可以识别对话数据对应的对话意图的情况下,主分类子模型对对话数据具有更好的识别效果。此时,将主分类子模型对对话数据的对话意图识别结果作为对话数据对应的对话意图。
83.可选的,若小样本子模型对应的对话意图识别结果不存在于第一识别范围中且主分类子模型对应的对话意图识别结果存在于第二识别范围中,则将主分类子模型对应的对话意图识别结果作为对话数据对应的对话意图。
84.可以理解的是,小样本子模型对对话数据进行对话意图识别后的对话意图识别结果不存在于第一识别范围中,表明对话数据对应的对话意图不可以被小样本子模型进行有效识别。主分类子模型对应的对话意图识别结果存在于第二识别范围中,表明对话数据对应的对话意图可以被主分类子模型进行有效识别。此时,直接将主分类子模型对对话数据的对话意图识别结果作为对话数据对应的对话意图。
85.在本说明书实施例中,首先实时采集用户输入的对话数据,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果,若对话意图匹配表对应的对话意图识别结果为确定的对话意图,则将对话意图匹配表对应的对话意图识别结果作为对话数据对应的对话意图,若对话意图匹配表对应的对话意图识别结果指示对话意图匹配表无法识别对话数据,则基于第一识别范围以及第二识别范围从小样本子模型、主分类子模型分别对应的对话意图识别结果中确定对话数据对应的对话意图,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
86.请参见图5,为本说明书实施例提供的一种对话意图识别模型训练方法的流程示
意图。如图5所示,对话意图识别模型训练方法可以包括以下步骤:
87.s302,当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取预设数量的对话数据以及各对话数据分别对应的对话意图,对话数据为用户在会话系统中输入的文本数据;
88.其中,对话日志用于记录用户和对话机器人进行对话的全部对话数据。在本说明书实施例中,用户和对话机器人进行对话的内容数据会记录在对话日志中,当对话日志中新记录的对话数据积累到预设数量后,从对话日志中提取预设数量的对话数据,以及各对话数据分别对应的对话意图。
89.不难理解,本说明书实施例中,对话机器人通过对话意图匹配表、小样本子模型、主分类子模型三者结合的方式预测用户对话数据对应的对话意图,其中,小样本子模型和主分类子模型为需要样本训练数据进行训练的神经网络模型,针对新场景,只有通过大量样本训练数据进行训练才能够获得较好的对话意图识别效果。
90.在本说明书实施例中,通过对话日志记录用户和对话机器人进行对话的内容数据,并在对话日志中的对话数据积累到一定数量后,将对话日志中的对话数据进行提取作为样本训练数据对小样本子模型和主分类子模型进行训练,以保证模型的对话意图识别效果。
91.s304,基于对话数据以及对话数据分别对应的对话意图生成样本训练数据;
92.在本说明书实施例中,在对话日志提取预设数量的对话数据以及各对话数据对应的对话意图之后,将一一对应的对话数据和对话意图组合生成样本训练数据。
93.s306,基于各样本训练数据训练小样本子模型,得到训练结束的小样本子模型,并确定训练结束的小样本子模型对应的第一识别范围,第一识别范围包括小样本子模型可识别的对话意图;
94.在本说明书实施例中,基于生成的各样本训练数据训练小样本子模型,得到训练结束的小样本子模型,并确定训练结束的小样本子模型对应的第一识别范围。其中,第一识别范围为小样本子模型经过模型训练后确定的可识别的样本意图范围,第一识别范围包含了小样本子模型可识别的各样本意图类型。
95.可选的,请参见图6,为本说明实施例提供的一种对话意图识别模型训练方法的流程示意图,如图6所示,所述基于各样本训练数据训练小样本子模型,得到训练结束的小样本子模型,并确定训练结束的小样本子模型对应的第一识别范围,具体包括以下步骤:
96.s3061,将各样本训练数据按照对话意图进行分类,得到各对话意图分别对应的样本训练数据集合;
97.具体的,在从对话日志中提取各对话数据以及各对话数据对应的对话意图,并生成各样本训练数据之后,将各样本训练数据按照对话意图进行分类,将同属于一种对话意图的样本训练数据划分为统一样本训练数据集合中,得到各对话意图分别对应的样本训练数据集合。
98.s3062,将各样本训练数据集合分别输入至小样本子模型中进行训练,并确定训练结束的小样本子模型对各对话意图的识别性能指标;
99.在本说明书实施例中,将各样本训练数据集合分别输入至小样本子模型中进行训练,并确定训练结束的小样本子模型对各对话意图的识别性能指标,具体包括:将样本训练
数据集合中的各样本训练数据划分为训练数据和验证数据,得到训练数据子集合和验证数据子集合,将各训练数据子集合输入至小样本子模型中进行训练,得到训练结束的小样本子模型,将各验证数据子集合输入至小样本子模型中进行验证,得到训练结束的小样本子模型对各对话意图的识别性能指标。
100.可选的,所述识别性能指标可以为识别准确率、识别精准率、召回率中的一种或几种。
101.s3063,将识别性能指标大于预设性能指标的对话意图作为小样本子模型可识别的对话意图。
102.在本说明实施例中,将各样本意图分别对应的样本训练数据集合输入至小样本子模型中进行训练后,根据得到识别性能指标判断该对话意图是否为小样本子模型可精准识别的对话意图,将识别性能指标大于预设性能指标的对话意图作为小样本子模型可精准识别的对话意图。
103.s308,基于各样本训练数据训练主分类子模型,得到训练结束的主分类子模型,并确定训练结束的主分类子模型对应的第二识别范围,第二识别范围包括主分类子模型可识别的对话意图。
104.在本说明书实施例中,基于生成的各样本训练数据训练主分类子模型,得到训练结束的主分类子模型,并确定训练结束的主分类子模型对应的第二识别范围。其中,第二识别范围为主分类子模型经过模型训练后确定的可识别的样本意图范围,第二识别范围包含了主分类子模型可识别的各样本意图类型。
105.可选的,请参见图6,为本说明实施例提供的一种对话意图识别模型训练方法的流程示意图,如图6所示,所述基于各样本训练数据训练主分类子模型,得到训练结束的主分类子模型,并确定训练结束的主分类子模型对应的第二识别范围,具体包括以下步骤:
106.s3081,将各样本训练数据按照对话意图进行分类,得到各对话意图分别对应的样本训练数据集合;
107.具体的,在从对话日志中提取各对话数据以及各对话数据对应的对话意图,并生成各样本训练数据之后,将各样本训练数据按照对话意图进行分类,将同属于一种对话意图的样本训练数据划分为统一样本训练数据集合中,得到各对话意图分别对应的样本训练数据集合。
108.s3082,将各样本训练数据集合分别输入至主分类子模型进行训练,并确定训练结束的主分类子模型对各对话意图的识别性能指标;
109.在本说明书实施例中,将各样本训练数据集合分别输入至主分类子模型中进行训练,并确定训练结束的主分类子模型对各对话意图的识别性能指标,具体包括:将样本训练数据集合中的各样本训练数据划分为训练数据和验证数据,得到训练数据子集合和验证数据子集合,将各训练数据子集合输入至主分类子模型中进行训练,得到训练结束的主分类子模型,将各验证数据子集合输入至主分类子模型中进行验证,得到训练结束的主分类子模型对各对话意图的识别性能指标。
110.可选的,所述识别性能指标可以为识别准确率、识别精准率、召回率中的一种或几种。
111.s3083,将识别性能指标大于预设性能指标的对话意图作为主分类子模型可识别
的对话意图。
112.在本说明实施例中,将各样本意图分别对应的样本训练数据集合输入至主分类子模型中进行训练后,根据得到识别性能指标判断该对话意图是否为主分类子模型可精准识别的对话意图,将识别性能指标大于预设性能指标的对话意图作为主分类子模型可精准识别的对话意图。
113.在本说明书实施例中,当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取预设数量的对话数据以及各对话数据分别对应的对话意图,基于对话数据以及对话数据分别对应的对话意图生成样本训练数据,基于各样本训练数据训练小样本子模型,得到训练结束的小样本子模型,并确定训练结束的小样本子模型对应的第一识别范围,第一识别范围包括小样本子模型可识别的对话意图,基于各样本训练数据训练主分类子模型,得到训练结束的主分类子模型,并确定训练结束的主分类子模型对应的第二识别范围,第二识别范围包括主分类子模型可识别的对话意图,最终可得到具有明确可识别对话意图范围的小样本子模型和主分类子模型,基于具有明确可识别对话意图范围的小样本子模型和主分类子模型和对话意图匹配表分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
114.请参见图7,为本说明书实施例提供的一种对话意图识别装置的结构示意图。如图7所示,该对话意图识别装置1可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分。根据一些实施例,该对话意图识别装置1包括对话数据采集模块11、对话意图识别模块12、对话意图确定模块13,具体包括:
115.对话数据采集模块11,用于实时采集用户输入的对话数据;
116.对话意图识别模块12,用于基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;
117.对话意图确定模块13,用于基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。
118.可选的,请参见图8,为本说明书实施例提供的一种对话意图识别装置的结构示意图。如图8所示,所述对话意图识别装置,还包括对话意图匹配模块14,用于在所述小样本子模型不存在第一识别范围且所述主分类子模型不存在第二识别范围时,基于所述对话意图匹配表对所述对话数据进行对话意图匹配,确定所述对话数据对应的对话意图。
119.可选的,所述对话意图确定模块13,具体用于:
120.若所述对话意图匹配表对应的对话意图识别结果为确定的对话意图,则将所述对话意图匹配表对应的对话意图识别结果作为所述对话数据对应的对话意图;
121.若所述对话意图匹配表对应的对话意图识别结果指示所述对话意图匹配表无法识别所述对话数据,则基于所述第一识别范围以及所述第二识别范围从所述小样本子模型、所述主分类子模型分别对应的对话意图识别结果中确定所述对话数据对应的对话意图。
122.可选的,所述对话意图确定模块在执行所述基于所述第一识别范围以及所述第二识别范围从所述小样本子模型、所述主分类子模型分别对应的对话意图识别结果中确定所述对话数据对应的对话意图时,具体用于:
123.若所述小样本子模型对应的对话意图识别结果存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果不存在于所述第二识别范围中,则将所述小样本子模型对应的对话意图识别结果作为所述对话数据对应的对话意图;
124.若所述小样本子模型对应的对话意图识别结果存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果存在于所述第二识别范围中,则将所述主分类子模型对应的对话意图识别结果作为所述对话数据对应的对话意图;
125.若所述小样本子模型对应的对话意图识别结果不存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果存在于所述第二识别范围中,则将所述主分类子模型对应的对话意图识别结果作为所述对话数据对应的对话意图。
126.在本说明书实施例中,首先实时采集用户输入的对话数据,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果,然后基于对话意图匹配表、小样本子模型对应的第一识别范围以及主分类子模型对应的第二识别范围从各对话意图识别结果中确定对话数据对应的对话意图,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
127.需要说明的是,上述实施例提供的对话意图识别装置在执行对话意图识别方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的对话意图识别装置与对话意图识别方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
128.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
129.请参见图9,为本说明书实施例提供的一种对话意图识别模型训练装置的结构示意图。如图9所示,该对话意图识别模型训练装置2可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分。根据一些实施例,该对话意图识别模型训练装置2包括对话数据提取模块21、训练数据生成模块22、第一模型训练模块23、第二模型训练模块24,具体包括:
130.对话数据提取模块21,用于当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;
131.训练数据生成模块22,用于基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;
132.第一模型训练模块23,用于基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;
133.第二模型训练模块24,用于基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。
134.可选的,所述第一模型训练模块23,具体用于:
135.将各所述样本训练数据按照对话意图进行分类,得到各对话意图分别对应的样本训练数据集合;
136.将各所述样本训练数据集合分别输入至所述小样本子模型中进行训练,并确定训练结束的小样本子模型对各所述对话意图的识别性能指标;
137.将所述识别性能指标大于预设性能指标的对话意图作为所述小样本子模型可识别的对话意图。
138.可选的,所述第一模型训练模块23在执行所述将各所述样本训练数据集合分别输入至所述小样本子模型中进行训练,并确定训练结束的小样本子模型对各所述对话意图的识别性能指标时,具体用于:
139.将所述样本训练数据集合中的各样本训练数据划分为训练数据和验证数据,得到训练数据子集合和验证数据子集合;
140.将各所述训练数据子集合输入至所述小样本子模型中进行训练,得到训练结束的小样本子模型;
141.将各所述验证数据子集合输入至所述小样本子模型中进行验证,得到训练结束的所述小样本子模型对各所述对话意图的识别性能指标。
142.可选的,所述第二模型训练模块24,具体用于:
143.将各所述样本训练数据按照对话意图进行分类,得到各对话意图分别对应的样本训练数据集合;
144.将各所述样本训练数据集合分别输入至所述主分类子模型进行训练,并确定训练结束的主分类子模型对各所述对话意图的识别性能指标;
145.将所述识别性能指标大于预设性能指标的对话意图作为所述主分类子模型可识别的对话意图。
146.可选的,所述第二模型训练模块24在执行所述将各所述样本训练数据集合分别输入至所述小样本子模型中进行训练,并确定训练结束的小样本子模型对各所述对话意图的识别性能指标时,具体用于:
147.将所述样本训练数据集合中的各样本训练数据划分为训练数据和验证数据,得到训练数据子集合和验证数据子集合;
148.将各所述训练数据子集合输入至所述主分类子模型中进行训练,得到训练结束的主分类子模型;
149.将各所述验证数据子集合输入至所述主分类子模型中进行验证,得到训练结束的所述主分类子模型对各所述对话意图的识别性能指标。
150.在本说明书实施例中,当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取预设数量的对话数据以及各对话数据分别对应的对话意图,基于对话数据以及对话数据分别对应的对话意图生成样本训练数据,基于各样本训练数据训练小样本子模型,得到训练结束的小样本子模型,并确定训练结束的小样本子模型对应的第一识别范围,
第一识别范围包括小样本子模型可识别的对话意图,基于各样本训练数据训练主分类子模型,得到训练结束的主分类子模型,并确定训练结束的主分类子模型对应的第二识别范围,第二识别范围包括主分类子模型可识别的对话意图,最终可得到具有明确可识别对话意图范围的小样本子模型和主分类子模型,基于具有明确可识别对话意图范围的小样本子模型和主分类子模型和对话意图匹配表分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
151.需要说明的是,上述实施例提供的对话意图识别模型训练装置在执行对话意图识别模型训练方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的对话意图识别模型训练装置与对话意图识别模型训练方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
152.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
153.本说明书实施例还提供的一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1~图6所示实施例的所述对话意图识别方法,具体执行过程可以参见图1~图6所示实施例的具体说明,在此不进行赘述。
154.本说明书还提供的一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如上述图1~图6所示实施例的所述对话意图识别方法,具体执行过程可以参见图1~图6所示实施例的具体说明,在此不进行赘述。
155.请参考图10,为本说明书实施例提供的一种电子设备的结构方框图。本说明书中的电子设备可以包括一个或多个如下部件:处理器110、存储器120、输入装置130、输出装置140和总线150。处理器110、存储器120、输入装置130和输出装置140之间可以通过总线150连接。
156.处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个终端内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行终端100的各种功能和处理数据。可选地,处理器110可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器110可集成中心处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块通信芯片进行实现。
157.存储器120可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory,rom)。可选地,该存储器120包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器120可用于存储指令、程序、代码、代码集或指令集。
158.其中,输入装置130用于接收输入的指令或数据,输入装置130包括但不限于键盘、
鼠标、摄像头、麦克风或触控设备。输出装置140用于输出指令或数据,输出装置140包括但不限于显示设备和扬声器等。在本说明书实施例中,输入装置130可以为温度传感器,用于获取终端的运行温度。输出装置140可以为扬声器,用于输出音频信号。
159.除此之外,本领域技术人员可以理解,上述附图所示出的终端的结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端中还包括射频电路、输入单元、传感器、音频电路、无线保真(wireless fidelity,wifi)模块、电源、蓝牙模块等部件,在此不再赘述。
160.在本说明书实施例中,各步骤的执行主体可以是上文介绍的终端。可选地,各步骤的执行主体为终端的操作系统。操作系统可以是安卓系统,也可以是ios系统,或者其它操作系统,本说明书实施例对此不作限定。
161.在图10的电子设备中,处理器110可以用于调用存储器120中存储的对话意图识别程序,并执行以实现如本说明书各个方法实施例所述的对话意图识别方法。
162.在本说明书实施例中,首先实时采集用户输入的对话数据,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果,然后基于对话意图匹配表、小样本子模型对应的第一识别范围以及主分类子模型对应的第二识别范围从各对话意图识别结果中确定对话数据对应的对话意图,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
163.本领域的技术人员可以清楚地了解到本说明书的技术方案可借助软件和/或硬件来实现。本说明书中的“单元”和“模块”是指能够独立完成或与其他部件配合完成特定功能的软件和/或硬件,其中硬件例如可以是现场可编程门阵列(field-programmable gate array,fpga)、集成电路(integrated circuit,ic)等。
164.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书并不受所描述的动作顺序的限制,因为依据本说明书,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本说明书所必须的。
165.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
166.在本说明书所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
167.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个
网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
168.另外,在本说明书各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
169.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通进程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
170.以上所述者,仅为本说明书的示例性实施例,不能以此限定本说明书的范围。即但凡依本说明书教导所作的等效变化与修饰,皆仍属本说明书涵盖的范围内。本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的范围和精神由权利要求限定。