数据处理方法、装置、设备及介质与流程-j9九游会真人

文档序号:35696957发布日期:2023-10-11 19:55阅读:来源:国知局

技术特征:
1.一种数据处理方法,其特征在于,所述数据处理方法应用于初始网络模型,所述初始网络模型包括初始第一网络模型和初始第二网络模型,所述初始第二网络模型包括大语言模型,所述方法包括:将原始训练数据输入所述初始网络模型的初始第一网络模型中进行运算,以得到第一输出结果;根据所述第一输出结果确定第一对比损失;将所述第一输出结果输入所述初始第二网络模型进行运算,以得到第二输出结果;根据所述第二输出结果确定第二对比损失;根据所述第一对比损失和所述第二对比损失对所述初始网络模型进行联合训练,以得到目标网络模型。2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述第一输出结果确定第一对比损失,包括:可以通过如下公式所示的方法根据所述第一输出结果确定第一对比损失:其中,为最小化的第一对比损失,l(m)为初始第一网络模型的第一损失函数,d是初始第一网络模型的训练数据集,p(y|x;m)是初始第一网络模型的输出概率分布,y为第一输出结果,x为原始训练数据,|.|为绝对值运算,log为对数运算,m表征初始第一网络模型。3.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述第二输出结果确定第二对比损失,包括:获取所述初始第二网络模型的类型信息;根据所述类型信息确定与所述初始第二网络模型对应的第二分布函数;通过第二分布函数确定所述第二输出结果对应的第二概率分布;获取所述第二概率分布的第二概率标签和第二损失函数;根据所述第二概率分布、所述第二概率标签和所述第二损失函数确定所述第二对比损失。4.根据权利要求3所述的数据处理方法,其特征在于,所述根据所述第一对比损失和所述第二对比损失对所述初始网络模型进行联合训练,以得到目标网络模型,包括:获取联合训练的平衡系数;根据所述平衡系数、所述初始第一网络模型的第一损失函数和所述初始第二网络模型第二损失函数构建第一联合损失函数;根据所述第一对比损失、所述第二对比损失和所述第一联合损失函数确定所述初始网络模型的联合对比损失;根据所述初始网络模型的第一训练数据和所述联合对比损失对所述初始网络模型中的初始第一网络模型和初始第二网络模型的权值参数进行调整,在所述联合对比损失收敛后以得到所述目标网络模型。5.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述平衡系数、所述初
始第一网络模型的第一损失函数和所述初始第二网络模型第二损失函数构建第一联合损失函数,包括:通过如下公式所示的方法根据所述平衡系数、所述初始第一网络模型的第一损失函数和所述初始第二网络模型第二损失函数构建第一联合损失函数:其中,h为第一联合损失函数,l(m)为第一损失函数,l(l)为第二损失函数,α为平衡系数,为最小值运算。6.根据权利要求1-5任一项所述的数据处理方法,其特征在于,在所述根据所述第一对比损失和所述第二对比损失对所述初始网络模型进行联合训练,以得到目标网络模型之后,所述方法还包括:接收目标用户的病症信息;将所述病症信息输入所述目标网络模型中进行运算,以得到与所述病症信息对应的医疗报告信息。7.根据权利要求6所述的数据处理方法,其特征在于,在所述将所述病症信息输入所述目标网络模型中进行运算,以得到与所述病症信息对应的医疗报告之后,所述方法还包括:对所述医疗报告信息进行关键字提取,以得到第一关键字集合;对第一关键字集合中的每个第一关键字进行语义分析,以得到与每个第一关键字对应的第一语义信息;根据每个第一关键字对应的第一语义信息确定与所述目标用户对应的风险类型指示数值;若所述风险类型指示数值高于预设风险类型指示数值,则确定风险告警信息;展示所述风险告警信息。8.一种数据处理装置,其特征在于,所述数据处理装置应用于初始网络模型,所述初始网络模型包括初始第一网络模型和初始第二网络模型,所述初始第二网络模型包括大语言模型,所述数据处理装置包括:数据输入单元,用于将原始训练数据输入所述初始网络模型的初始第一网络模型中进行运算,以得到第一输出结果;第一确定单元,用于根据所述第一输出结果确定第一对比损失;运算单元,用于将所述第一输出结果输入所述初始第二网络模型进行运算,以得到第二输出结果;第二确定单元,用于根据所述第二输出结果确定第二对比损失;训练单元,用于根据所述第一对比损失和所述第二对比损失对所述初始网络模型进行联合训练,以得到目标网络模型。9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述数据处理方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述数据处理方法的步骤。

技术总结
本发明涉及人工智能技术、自然语言处理、医疗健康技术领域,公开一种数据处理方法、装置、设备及介质,其中,该方法包括如下步骤:将原始训练数据输入所述初始网络模型的初始第一网络模型中进行运算,以得到第一输出结果;根据所述第一输出结果确定第一对比损失;将所述第一输出结果输入所述初始第二网络模型进行运算,以得到第二输出结果;根据所述第二输出结果确定第二对比损失;根据所述第一对比损失和所述第二对比损失对所述初始网络模型进行联合训练,以得到目标网络模型。提升了大语言模型的生成效果和准确性。言模型的生成效果和准确性。言模型的生成效果和准确性。


技术研发人员:王俊 侯昶宇
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2023.06.30
技术公布日:2023/10/10
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图