原标题:保险销售可回溯的时代,AI质检让违规无处可逃
近几年,为保护消费者权益,政府监管部门对于保险销售过程的规范化提出了明确要求:2017年,保监会发布《保险销售行为可回溯管理暂行办法》,要求保险公司、保险中介机构通过录音录像等技术手段记录和保存保险销售过程关键环节。2020年,互联网保险业务快速增长,银保监会进一步发布了《关于规范互联网保险销售行为可回溯管理的通知》,要求互联网保险销售行为可回溯,记录和保存销售页面以及销售过程。
对于保险公司和保险中介机构而言,除了记录和保存保险销售过程的数据,还需要不断探索更有效的质检方式,及时发现和纠正销售沟通过程的不规范之处,降低企业被投诉带来的合规风险。
保险销售的过程,往往离不开销售员与客户的沟通过程。根据渠道和销售场景不同,保险线上销售场景产生的沟通记录,主要包括电话录音、在线IM文本和企业微信会话等;线下销售场景则包括代理人、经纪人以及银行网点代理销售保险的录音和录像等。
从“关键词”到“一段话语义”
企业最基础的质检方式是人工抽检,质检员选取很少一部分的电话录音、文本会话等文件进行检查。但人工抽检的效率很低,无法完成全量覆盖。因此,保险企业部署了初代的机器质检系统,通过将录音和微信语音转写成“文本”,然后借助“关键词和正则表达式”查找其中可能涉及违规的会话。
不过,保险企业很快又发现,仅仅依靠“关键词和正则表达式”进行穷举的方式,应付不了“人与人沟通时个性化的、复杂多样的表达以及难以捉摸的对话逻辑”。例如,在质检项“夸大陈述”中,保司发现销售员夸大重疾险保障范围的方式是穷举不完的。
于是,新一代的AI机器质检应运而生。通过“喂”给机器足够多的违规实例和不违规实例(即经人工判断属于某项违规或不属于某项违规的对话语句,这个过程在AI领域被称为“人工标注”),训练机器算法去学违规对话的隐含特征,然后用“训练”出的模型识别更多句子和段落的语义,看看是否命中这条违规项。
不过,对于保险业务而言。很多时候,关键质检项的定义和违规判断非常依赖专业知识和行业经验。这就意味着:1)保险企业和提供AI质检解决方案的公司,要花很多精力来对齐质检项的定义;2)在生产AI质检项过程中的人工标注环节,需要保险企业的人员参与进来,与AI质检供应商内部的保险行业专家合作进行生产,以提升模型的准确性。
这也是循环智能(Recurrent AI)在服务多家头部保司的质检项目时,学到的前两条经验。
保险销售过程的合规质检,至少包含了两种基本的情况:第一种,发现销售员“说错话”的情况,例如“夸大陈述”这样的质检项,通常只包含单个AI语义标签(AI语义点、AI语义画像),只要说了就算违规;第二种,发现销售员不严谨或不规范的地方,例如“意外医疗的保障范围未介绍完整”这样的质检项,通常会涉及多个标签(AI语义点或正则语义点),因为先要判断当前对话的场景是否涉及“意外医疗”,然后再判断是否讲到了所有保障范围。
事实上,第二种情况还可能涉及到多种复杂场景,有时候需要引入企业的自定义字段,有时候需要判断对话内容质检的逻辑规则,才能判断对话是否存在不严谨或不规范的地方。例如:有些话只在特定的场景才算违规(比如同样的话,用在介绍A产品时不违规,但介绍B产品时违规),场景判断的前置条件,需要引入企业的自定义字段——这通对话是在介绍A产品还是B产品;逻辑规则“与或非”:很多关键违规项是由多个语义点的逻辑关系组成的,有时候A和B都说了算违规,有时候A或B只说了一个就算违规;先后顺序:先说A再说B算违规,先说B再说A就算违规;次数:说一次两次不算违规,说三次就算违规。
循环智能(Recurrent AI)的智能质检系统,支持企业自定义字段,以及复杂多样的质检项场景逻辑设置,对于复杂逻辑质检项的支持更加完善。
引入AI秘密武器“违规值”评分
在服务保险企业的过程中,循环智能(Recurrent AI)团队发现,尽管使用了AI语义点,也使用了逻辑关系判断功能,但有一些质检项过于复杂(例如:混淆新老保单),AI语义点加上逻辑关系判断也难一网打尽。
面对这种棘手的情况,循环智能(Recurrent AI)创造了一种新的“违规值”质检方式。这种新方法,并不关心具体哪句话违规了,而是专注计算整个会话违规的可能性。通过把整个对话(甚至同一个保单对应的多个对话)当成一个整体进行机器学:在训练阶段,将“违规”的整体对话和“没违规”的整体对话输入算法模型,学“违规”对话的隐藏特征;在执行阶段,将新的对话输入算法模型,然后计算该对话违规的概率。
根据企业的实际需求,违规值计算又包括两种场景:整个会话命中单个质检项的违规值;整个会话命中多个质检项的违规值(例如命中S级所有质检项组合中的任意一个算违规)。
在需要100%人工复检的保险成功单质检场景,循环智能(Recurrent AI)的“违规值”排序功能,如果在算法建模阶段经过了充足的数据训练,那么基本上可以在违规值前60%的会话中找到绝大部分违规对话,最高节省40%的成功单质检工作量。
保险质检的AI三级火箭
在服务保险客户的过程中,循环智能形成的保险质检的“三级火箭”解决方案:第一级:从字和词级别的关键词+正则方式,到引入句子和段落级别的AI语义点方式;第二级:引入企业自定义字段和逻辑规则判断,实现多个语义点之间复杂的场景、逻辑判断;第三级:计算整通会话违规的可能性高低,通过违规值排序,帮助人工复检员节省工作量。
为什么会需要“三级火箭”?首先,因为保险销售过程,往往离不开沟通释疑的过程。而人与人的沟通的过程,用语非常灵活,每个人都有自己的特色,肯定不会像书面用语一样规范。所以关键词方式在很多情况下已经不够用,需要引入句子和段落级别的AI语义点模型。
其次,因为保险销售员对保险产品的介绍和权益的解答,需要更加严谨,但是判断讲解是否到位,需要结合具体的产品,也需要结合逻辑和场景(有时候违规是因为漏说了该说的东西,而不是因为说错了)。
最后,因为保险的质检项中存在一些“疑难杂项”,引入违规值排序这种全新的方式,可以进一步减少漏网之鱼的数量。
通过引入和部署经过考验的AI质检技术,保险企业在质检工作中的效率可以得到数倍提升。循环智能(Recurrent AI)在银行保险领域服务了招商银行、人保财险、招商信诺、众安保险、水滴公司和轻松筹等标杆企业,除了新一代合规质检(Compliance)解决方案,这家公司在保险领域还提供意向名单优选(Target)解决方案以及人员产能提升(Expert)解决方案。
2021年4月,循环智能与HUAWEI云联合发布了首个千亿中文语言大模型“盘古”,刷新中文语言评测榜单CLUE三项记录,并入选CB Insights 年度“AI 100全球榜单”。2019~2020年,循环智能连续两年入选《机器之心》年度“最具产业价值”榜单。