1.本公开涉及数据分析技术领域,尤其涉及一种诉讼成功率预测方法、装置、设备及存储介质。
背景技术:
2.日常生活中,人们对于一些基础的法律条款不熟悉,当自身的权益受到侵害,想要通过法律途径维权时,借助相关资料或互联网查阅法规法条,并不能让维权者针对纠纷相关的法律有深刻的认识,而咨询律师所需的费用较高,对于无法负担该部分费用的维权者,很难在提起诉讼前推断出胜诉的概率,提高了民众的维权门槛。因此,如何通过技术手段提前对诉讼的成功率进行预测是需要解决的技术问题。
技术实现要素:
3.为了解决上述技术问题,本公开提供了一种诉讼成功率预测方法、装置、设备及存储介质。
4.本公开实施例的第一方面提供了一种诉讼成功率预测方法,该方法包括:
5.获取待预测的目标案件的描述信息和已有证据;
6.将所述待预测的目标案件的描述信息和已有证据输入预训练的案件分析模型,对所述目标案件胜诉的概率进行预测,得到预测结果,其中,所述案件分析模型是通过包括法律条文、历史案件的法律事实、案件经过、相关证据和裁判文书在内的训练样本数据对分类模型框架进行训练得到的;
7.对所述预测结果进行显示。
8.本公开实施例的第二方面提供了一种诉讼成功率预测装置,该装置包括:
9.获取模块,用于获取待预测的目标案件的描述信息和已有证据;
10.预测模块,用于将所述待预测的目标案件的描述信息和已有证据输入预训练的案件分析模型,对所述目标案件胜诉的概率进行预测,得到预测结果,其中,所述预测结果包括所述目标案件胜诉的概率,所述案件分析模型是通过包括法律条文、历史案件的法律事实、案件经过、相关证据和裁判文书在内的训练样本数据对分类模型框架进行训练得到的;
11.结果显示模块,用于对所述预测结果进行显示。
12.本公开实施例的第三方面提供了一种计算机设备,包括存储器和处理器,以及计算机程序,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的诉讼成功率预测方法。
13.本公开实施例的第四方面提供了一种计算机可读存储介质,存储介质中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的诉讼成功率预测方法。
14.本公开实施例提供的技术方案与现有技术相比具有如下优点:
15.在本公开实施例提供的诉讼成功率预测方法、装置、设备及存储介质中,通过获取待预测的目标案件的描述信息和已有证据,将所述待预测的目标案件的描述信息和已有证
据输入预训练的案件分析模型,对所述目标案件胜诉的概率进行预测,得到预测结果,其中,所述案件分析模型是通过包括法律条文、历史案件的法律事实、案件经过、相关证据和裁判文书在内的训练样本数据对分类模型框架进行训练得到的,对所述预测结果进行显示,能够基于描述信息和用户提供的证据,提前预测出案件胜诉的概率,以使用户在提起诉讼前对诉讼结果有初步的心理预期,辅助用户进行决策,用户无需花费大量金钱和时间用于查阅资料和咨询律师,就能够维护自身权益,降低了民众的维权门槛。
附图说明
16.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
17.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
18.图1是本公开实施例提供的一种诉讼成功率预测方法的流程图;
19.图2是本公开实施例提供的一种训练案件分析模型的方法的流程图;
20.图3是本公开实施例提供的一种进行数据标注的方法的流程图;
21.图4是本公开实施例提供的一种获取案件信息的方法的流程图;
22.图5是本公开实施例提供的一种提醒用户的方法的流程图;
23.图6是本公开实施例提供的一种诉讼成功率预测装置的结构示意图;
24.图7是本公开实施例提供的一种计算机设备的结构示意图。
具体实施方式
25.为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
26.在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
27.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
28.图1是本公开实施例提供的一种诉讼成功率预测方法的流程图,该方法可以由一种诉讼成功率预测装置执行。如图1所示,本实施例提供的诉讼成功率预测方法包括如下步骤:
29.s101、获取待预测的目标案件的描述信息和已有证据。
30.本公开实施例中的描述信息可以理解为用于描述案件经过和维权诉求的信息,示例的,用户可以通过多种方式上传描述信息,比如文本输入、语音录入、图像采集等,在此不做限定。
31.本公开实施例中的已有证据可以包括用户当前掌握的多种形式的证据,比如文本
形式、图片形式、音频形式或视频形式的证据,在此不做限定。
32.本公开实施例中,诉讼成功率预测装置可以获取用户上传的待预测的目标案件的描述信息和已有证据。
33.在本公开实施例的一种示例性的实施方式中,诉讼成功率预测装置可以为用户提供多种形式的描述信息和已有证据的上传接口,并在接收到音频形式的描述信息和已有证据时,将其转换为文本信息,在接收到图片形式或视频形式的描述信息和已有证据时,从中识别出包含的文本信息,并基于转换或识别得到的文本信息进行进一步处理。
34.s102、将所述待预测的目标案件的描述信息和已有证据输入预训练的案件分析模型,对所述目标案件胜诉的概率进行预测,得到预测结果,其中,所述案件分析模型是通过包括法律条文、历史案件的法律事实、案件经过、相关证据和裁判文书在内的训练样本数据对分类模型框架进行训练得到的。
35.本公开实施例中的分类模型框架可以理解为用于确定输入数据所属的类别的模型框架,具体可以是基于自然语言处理的分类模型框架,比如bert(bidirectional encoder representation from transformers)模型框架、xlnet模型框架、robert(robustly optimized bidirectional encoder representation from transformers)模型框架、albert(a lite bidirectional encoder representation from transformers)模型框架等,在此不做限定。
36.本公开实施例中,诉讼成功率预测装置可以在得到目标案件的描述信息和已有证据后,将描述信息和已有证据输入预训练完成的案件分析模型中,由案件分析模型对目标案件胜诉的概率进行预测,并输出包含胜诉概率的预测结果。其中,对案件分析模型进行训练时的所采用的训练样本数据包括法律条文以及历史案件的法律事实、案件经过、相关证据和裁判文书。
37.s103、对所述预测结果进行显示。
38.本公开实施例中,诉讼成功率预测装置可以在得到对目标案件的胜诉概率进行预测的预测结果后,通过输出显示设备对该预测结果进行显示。
39.在本公开实施例的一种示例性的实施方式中,诉讼成功率预测装置可以在得到预测结果后,根据显示设备的类型,比如手机、平板、电脑、机器人等,确定与设备类型相适应的界面显示方式,进而基于该界面显示方式对预测结果进行显示。
40.本公开实施例通过获取待预测的目标案件的描述信息和已有证据,将所述待预测的目标案件的描述信息和已有证据输入预训练的案件分析模型,对所述目标案件胜诉的概率进行预测,得到预测结果,其中,所述案件分析模型是通过包括法律条文、历史案件的法律事实、案件经过、相关证据和裁判文书在内的训练样本数据对分类模型框架进行训练得到的,对所述预测结果进行显示,能够基于描述信息和用户提供的证据,提前预测出案件胜诉的概率,以使用户在提起诉讼前对诉讼结果有初步的心理预期,辅助用户进行决策,用户无需花费大量金钱和时间用于查阅资料和咨询律师,就能够维护自身权益,降低了民众的维权门槛。
41.在本公开一些实施例中,所述预测结果还包括与所述目标案件相关的法律条文。
42.具体地,诉讼成功率预测装置可以在将目标案件的描述信息和已有证据输入案件分析模型后,获得模型输出的包括胜诉概率和相关的法律条文在内的预测结果,其中,案件
分析模型在输出与目标案件相关的法律条文时,可以仅输出相关的法律条文的条款编号,也可以在输出条款编号的同时输出具体内容,从而在告知用户胜诉概率的同时,也告知用户与目标案件相关的法律条款,方便用户基于该法律条款加深对案件的理解,同时提高预测结果中的胜诉概率的可信度。
43.图2是本公开实施例提供的一种训练案件分析模型的方法的流程图,如图2所示,在上述实施例的基础上,可以通过如下方法训练案件分析模型。
44.s201、对预先获取的训练样本数据进行数据标注处理,得到标注数据。
45.本公开实施例中的数据标注处理可以包括命名实体标注、情感标注、关系标注、意图标注、语义标注等处理方式,在此不做限定。
46.本公开实施例中的标注数据可以理解为对训练样本数据进行标注后,包含标注信息的训练样本数据。
47.本公开实施例中,诉讼成功率预测装置可以在对案件分析模型进行训练时,对预先获取的训练样本数据进行标注处理,得到包含标注信息的标注数据。
48.在本公开实施例的一种示例性的实施方式中,诉讼成功率预测装置可以基于预设的关键词库对训练样本数据进行关键词匹配,确定训练样本数据中包含的关键词,并对这些关键词进行标注,得到标注数据。
49.在本公开实施例的另一种示例性的实施方式中,诉讼成功率预测装置可以通过预训练的数据标注模型对训练样本数据进行标注,具体可以从训练样本数据中识别出不同的命名实体,并提取得到命名实体之间的关系,以及训练样本数据中包含的情感信息、意图信息和语义信息,将识别和提取到的信息添加到训练样本数据中,得到标注数据。
50.s202、基于所述标注数据,确定所述历史案件的标签信息和特征信息,所述标签信息包括所述历史案件是否胜诉,以及所述历史案件的法律依据,所述特征信息包括案件类型、时间、地点、证据来源、证据质量中的至少一种。
51.本公开实施例中的标签信息可以理解为训练样本数据中样本的标记,标签信息可以作为检测输出结果是否正确的标准参考信息,特征信息可以理解为样本在某属性上的具体表现。
52.本公开实施例中,诉讼成功率预测装置可以在得到包含标注信息的标注数据后,基于该标注数据确定各个历史案件的标签信息,即各个历史案件是否胜诉、各个历史案件进行裁决的法律依据,还可以根据该标注数据确定各个历史案件的特征信息,即各个历史案件的案件类型、时间、地点、证据来源、证据质量。
53.在本公开实施例的一种示例性的实施方式中,诉讼成功率预测装置可以从裁判文书对应的标注数据中提取标签信息,从法律事实、案件经过对应的标注数据中提取案件类型、时间、地点的特征信息,从相关证据对应的标注数据中提取证据来源和证据质量的特征信息。
54.s203、将所述标注数据、标签信息和特征信息输入所述分类模型框架进行监督学习,得到训练好的案件分析模型。
55.本公开实施例中,诉讼成功率预测装置可以在得到标注数据、标签信息和特征信息后,将其输入预先获取的分类模型框架进行监督学习,基于输出结果和标签信息计算损失函数,并对模型的参数进行调整以使损失值收敛,得到训练好的案件分析模型。
56.本公开实施例通过对预先获取的训练样本数据进行数据标注处理,得到标注数据,基于所述标注数据,确定所述历史案件的标签信息和特征信息,所述标签信息包括所述历史案件是否胜诉,以及所述历史案件的法律依据,所述特征信息包括案件类型、时间、地点、证据来源、证据质量中的至少一种,将所述标注数据、标签信息和特征信息输入所述分类模型框架进行监督学习,得到训练好的案件分析模型,能够训练出具有对预测胜诉概率的能力和确定相关法律的能力的案件分析模型,从而在基于该模型对目标案件的胜诉概率进行预测时,得到准确的预测结果。
57.图3是本公开实施例提供的一种进行数据标注的方法的流程图,如图3所示,在上述实施例的基础上,可以通过如下方法进行数据标注。
58.s301、对所述训练样本数据进行分词处理,得到分词结果。
59.本公开实施例中,诉讼成功率预测装置可以在获得训练样本数据后,对训练样本数据进行分词处理,具体的,可以通过基于字符串匹配的分词方式,将训练样本数据与预设词典中存储的字符串进行匹配以实现分词,也可以通过基于理解的分词方式,对训练样本数据进行句法、语义的理解以实现分词,还可以通过基于统计的分词方式,采用统计模型实现分词,得到分词结果。
60.s302、对所述分词结果进行词性标注处理,得到词性标注结果。
61.本公开实施例中的词性可以理解为词汇基本的语法属性,可以包括名词、动词、形容词或者其他词性。
62.本公开实施例中,诉讼成功率预测装置可以在得到分词结果后,对分词结果中的每个单词标注一个词性,具体地,可以通过基于字符串匹配的方式,或基于统计的方式确定词性,得到词性标注结果。
63.s303、基于所述词性标注结果进行命名实体识别处理,得到所述标注数据。
64.本公开实施例中,诉讼成功率预测装置可以在得到训练样本数据对应的词性标注结果后,基于该词性标注结果进行命名实体识别处理,具体地,可以基于规则和词典完成命名实体识别,也可以基于统计的方法完成命名实体识别,得到包含识别结果的标注数据。
65.本公开实施例通过对所述训练样本数据进行分词处理,得到分词结果,对所述分词结果进行词性标注处理,得到词性标注结果,基于所述词性标注结果进行命名实体识别处理,得到所述标注数据,能够实现对训练样本数据的数据标注,进而基于该标注结果完成对案件分析模型的训练。
66.图4是本公开实施例提供的一种获取案件信息的方法的流程图。如图4所示,在上述实施例的基础上,可以通过如下方法获取案件信息。
67.s401、显示预设的信息收集模板。
68.本公开实施例中,诉讼成功率预测装置可以在需要获取待预测的目标案件的描述信息和已有证据时,显示预设的信息收集模板,示例的,信息收集模板中可以包括多条引导信息,用于告知用户需要录入哪些内容,示例的,引导信息可以引导用户录入案件类型、发生时间、发生地点、事件起因、事件经过、事件结果、与当事人的聊天记录、鉴定报告等,在此不做限定,各条引导信息可以对应至少一个数据录入接口。
69.s402、获取用户基于所述信息收集模板输入的待预测的目标案件的描述信息和已有证据。
70.本公开实施例中,诉讼成功率预测装置可以在显示信息收集模板后,获取用户基于该信息收集模板输入的待预测的目标案件的描述信息和已有证据。
71.本公开实施例通过显示预设的信息收集模板,获取用户基于所述信息收集模板输入的待预测的目标案件的描述信息和已有证据,能够通过信息收集模板告知用户需要填写哪些信息,在面对缺乏专业知识的用户时,收集到的信息也能够支撑案件分析模型得到准确的预测结果,进一步降低了民众的维权门槛。
72.在本公开另一些实施例中,所述已有证据包括诉讼双方的已有证据,所述训练样本数据中的相关证据包括在所述历史案件中诉讼双方提供的证据,所述预测结果还包括诉讼双方的模拟辩论信息。
73.具体地,诉讼成功率预测装置可以在收集训练样本数据时,将历史案件中诉讼双方提供的证据确定为相关证据,在对案件分析模型进行训练时,基于双方的证据模拟出辩论过程,得到训练好的案件分析模型,并在收集目标案件的已有证据时,获取用户输入的诉讼双方的已有证据,进而得到案件分析模型输出的包含诉讼双方的模拟辩论信息,能够在用户掌握了双方的已有证据时,通过模拟辩论信息展示诉讼过程中可能出现的辩论情况,为用户或专业人士提供参考。
74.图5是本公开实施例提供的一种提醒用户的方法的流程图,如图5所示,在上述实施例的基础上,可以通过如下方法提醒用户。
75.s501、将所述目标案件胜诉的概率与预设概率进行比较。
76.本公开实施例中的预设概率可以理解为预先设定的概率阈值,具体取值可以根据实际需要进行设定。
77.本公开实施例中,诉讼成功率预测装置可以在获得目标案件胜诉的概率后,可以将胜诉的概率与预设概率进行比较,如果胜诉的概率大于或等于预设概率,则确定目标案件胜诉的概率较大,如果胜诉的概率小于预设概率,则确定目标案件胜诉的概率较小。
78.s502、响应于所述目标案件胜诉的概率小于所述预设概率,则对提醒信息进行显示,所述提醒信息用于提醒用户所述目标案件的胜诉概率较小。
79.本公开实施例中,诉讼成功率预测装置可以在确定目标案件胜诉的概率小于预设概率时,显示提醒信息,通过该提醒信息提醒用户目标案件的胜诉概率较小,不建议在未收集更多有力证据的情况下提起诉讼。
80.本公开实施例通过将所述目标案件胜诉的概率与预设概率进行比较,响应于所述目标案件胜诉的概率小于所述预设概率,则对提醒信息进行显示,所述提醒信息用于提醒用户所述目标案件的胜诉概率较小,能够在案件胜诉的概率较小时,对用户进行提醒,避免用户盲目的投入过多的时间和精力,无法获得回报。
81.图6是本公开实施例提供的一种诉讼成功率预测装置的结构示意图。如图6所示,该诉讼成功率预测装置600包括:获取模块610,用于获取待预测的目标案件的描述信息和已有证据;预测模块620,用于将所述待预测的目标案件的描述信息和已有证据输入预训练的案件分析模型,对所述目标案件胜诉的概率进行预测,得到预测结果,其中,所述预测结果包括所述目标案件胜诉的概率,所述案件分析模型是通过包括法律条文、历史案件的法律事实、案件经过、相关证据和裁判文书在内的训练样本数据对分类模型框架进行训练得到的;结果显示模块630,用于对所述预测结果进行显示。
82.可选的,所述预测结果还包括与所述目标案件相关的法律条文。
83.可选的,所述诉讼成功率预测装置600还包括训练模块,所述训练模块包括:标注单元,用于对预先获取的训练样本数据进行数据标注处理,得到标注数据;信息确定单元,用于基于所述标注数据,确定所述历史案件的标签信息和特征信息,所述标签信息包括所述历史案件是否胜诉,以及所述历史案件的法律依据,所述特征信息包括案件类型、时间、地点、证据来源、证据质量中的至少一种;训练单元,用于将所述标注数据、标签信息和特征信息输入所述分类模型框架进行监督学习,得到训练好的案件分析模型。
84.可选的,所述标注单元,包括:分词子单元,用于对所述训练样本数据进行分词处理,得到分词结果;标注子单元,用于对所述分词结果进行词性标注处理,得到词性标注结果;识别子单元,用于基于所述词性标注结果进行命名实体识别处理,得到所述标注数据。
85.可选的,所述诉讼成功率预测装置600还包括:模板显示模块,用于显示预设的信息收集模板;所述获取模块610,具体用于:获取用户基于所述信息收集模板输入的待预测的目标案件的描述信息和已有证据。
86.可选的,所述已有证据包括诉讼双方的已有证据,所述训练样本数据中的相关证据包括在所述历史案件中诉讼双方提供的证据,所述预测结果还包括诉讼双方的模拟辩论信息。
87.可选的,所述诉讼成功率预测装置600还包括:比较模块,用于将所述目标案件胜诉的概率与预设概率进行比较;提醒模块,用于响应于所述目标案件胜诉的概率小于所述预设概率,则对提醒信息进行显示,所述提醒信息用于提醒用户所述目标案件的胜诉概率较小。
88.本实施例提供的诉讼成功率预测装置能够执行上述任一实施例所述的方法,其执行方式和有益效果类似,在这里不再赘述。
89.图7是本公开实施例提供的一种计算机设备的结构示意图。
90.如图7所示,该计算机设备可以包括处理器710以及存储有计算机程序指令的存储器720。
91.具体地,上述处理器710可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
92.存储器720可以包括用于信息或指令的大容量存储器。举例来说而非限制,存储器720可以包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个及其以上这些的组合。在合适的情况下,存储器720可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器720可在综合网关设备的内部或外部。在特定实施例中,存储器720是非易失性固态存储器。在特定实施例中,存储器720包括只读存储器(read-only memory,rom)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(programmable rom,prom)、可擦除prom(electrical programmable rom,eprom)、电可擦除prom(electrically erasable programmable rom,eeprom)、电可改写rom(electrically alterable rom,earom)或闪存,或者两个或及其以上这些的组合。
93.处理器710通过读取并执行存储器720中存储的计算机程序指令,以执行本公开实
施例所提供的诉讼成功率预测方法的步骤。
94.在一个示例中,该计算机设备还可包括收发器730和总线740。其中,如图7所示,处理器710、存储器720和收发器730通过总线740连接并完成相互间的通信。
95.总线740包括硬件、软件或两者。举例来说而非限制,总线可包括加速图形端口(accelerated graphics port,agp)或其他图形总线、增强工业标准架构(extended industry standard architecture,eisa)总线、前端总线(front side bus,fsb)、超传输(hyper transport,ht)互连、工业标准架构(industrial standard architecture,isa)总线、无限带宽互连、低引脚数(low pin count,lpc)总线、存储器总线、微信道架构(micro channel architecture,mca)总线、外围控件互连(peripheral component interconnect,pci)总线、pci-express(pci-x)总线、串行高级技术附件(serial advanced technology attachment,sata)总线、视频电子标准协会局部(video electronics standards association local bus,vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线740可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
96.本公开实施例还提供了一种计算机可读存储介质,该存储介质可以存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现本公开实施例所提供的诉讼成功率预测方法。
97.上述的存储介质可以例如包括计算机程序指令的存储器720,上述指令可由诉讼成功率预测设备的处理器710执行以完成本公开实施例所提供的诉讼成功率预测方法。可选的,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是rom、随机存取存储器(random access memory,ram)、光盘只读存储器(compact disc rom,cd-rom)、磁带、软盘和光数据存储设备等。上述计算机程序可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c 等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
98.需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
99.以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。