我们非常重视您的个人隐私,当您访问我们的网站时,请同意使用的所有cookie。有关个人数据处理的更多信息可访问《隐私政策》

400-090-9889

得助智能保险知识图谱,助力永安保险实现智能化知识管理

公司动态
2022-12-15

在人工智能的时代,传统的数据处理方法已不能满足人类对于信息整合和知识获取的要求。而人工智能的重要基础之一——知识图谱技术,因具有强大的语义信息处理能力以及支持知识推理和分析的能力,近年来获得了广泛关注。保险行业一向重视在传统商业模式之中融入创新思维,因此知识图谱这项极具潜力的技术已成为保险业的热门话题。


保险行业,具有领域知识专业性强、业务复杂、涉及面广、产品更新快等特点。实际应用中客服侧需要从大量保险条款文档中查询领域知识,在无针对性的工具情况下查询效率低、费力度高,通过接入智能客服(图谱应答能力)后可实现对保险文档知识的智能抽取,入图融合形成知识图谱能力,由机器人通过实时问答的方式,自动决策,解决用户遇到的实际问题,从而帮助保险机构降低人力成本、提升用户咨询体验、提高理赔时效。


得助智能保险知识图谱的构建包含如下步骤:知识建模(schema)→知识抽取→知识补全→知识存储→知识应用。

1、知识建模

知识建模即根据领域知识的特征,构建一个适用于该领域的知识结构。这个过程需要我们从数据(有什么)和需求(需要做什么)两个方向出发,确定图谱中应该包含哪些实体和概念,以及实体与实体、概念与概念之间存在何种关系,这是知识图谱构建的基础。


知识图谱建模需要遵循三个原则:

稳定性

复用性

可扩展性




在确定了保险知识图谱的概念体系后,不断增加新的行业知识,形成schema的1.0版本(如下图),然后我们又回到构建的开始,从需求出发,不断校验我们的schema是不是覆盖了我们需要支持的业务知识,不断迭代,直到能够稳定支持当前的业务需要。
图片2、知识抽取
在永安保险项目中,公司内存在大量历史保险条款文档1000+,格式多样docx、pdf、excel均涵盖,通过得助知识抽取工具能够自动识别、理解、筛选、格式化,把条款文档中的各个知识点抽取出来,以一定形式存入知识库中。并且在永安保险业务场景中支持“保险、通讯录”知识抽取,抽取后形成保险知识点应用于业务场景中(如:机器人问答等)。知识抽取能够有效解决企业长期存在的非结构化文档管理审阅难题,实现企业内部文档由存储到智能化应用的数据资产流通。
图片

以非结构化文本保险条款的抽取为例,条款抽取的数据包含:

实体抽取:通过实体名称抽取具体的实体,如保险责任实体类型,”恶性肿瘤医疗保险金“、”质子重离子医疗保险金“等;

属性抽取:通过schema定义的属性字段抽取关键字段信息,如"赔付期限":"60天";

关系抽取:根据包含、从属等关键字段或者schema定义的关系类型,抽取实体之间的关系。



而为了提升结构化数据的抽取效率,我们开发了自动标注工具(如下图所示),按照上述三种维度进行数据自动标注,标注的数据按照三元组的方式存储,人工进行校验后,进入中间库进行知识融合。
图片图片3、知识补全
知识补全(知识推理),从知识库中已有的实体关系数据出发、经计算机推理,建立实体间的新关联,从而拓展和丰富知识网络,通过知识推理能发现新的知识,简而言之通过各种方法获取新的知识或者结论。
图片4、知识存储
知识存储,将知识图谱转化为RDF三元组数据进行存储,即将知识图谱的关系分解为一个个<Subject主,Predicate谓,Object宾>的三元组形式,并映射至关系表,存储于图数据库中(常用图数据库为Neo4j)。
图片

因为涉及到多个来源的数据,所以需要先将数据存储到中间库,进行处理后再导入neo4j图数据库中。这个过程围绕预先定义好的知识模型,采用流水线的方式来进行。


数据采集,通过不同的合法数据渠道去采集我们所需要的数据。数据采集完成之后,会放到MongoDB中间库进行存储,每天会有定时任务对上游数据进行数据清洗和数据融合。融合后的知识,最终是以图数据的格式存储到Neo4j图数据库中。

5、知识应用

知识图谱发布后,图谱数据就可以通过可视化平台进行浏览、查询、分析,同时也可以通过接口的方式对外提供服务,与其他业务系统对接。以上就是保险知识图谱构建的全过程。


保险知识图谱可通过知识图谱可视化平台展示,以下为保险搜索引擎服务可视化界面。

图片
永安保险知识问答系统
在永安保险智能客服场景中,我们搭建了一套基于图谱的、高可靠、易落地、易维护、面向低资源场景的智能问答系统。在实际业务应用中,我们通过知识图谱技术、自然语言生成技术生成线上模拟数据100多万条,并基于语义理解技术开发匹配模型,实现语义匹配模型平均精度达90%,语义匹配模型平均召回超95%。进一步,我们通过高可靠DM技术来管理对话,实现应答召回率超95%。在部署方面,我们利用底层加速docker镜像,实现8c8g限制下的请求响应QPS超14。该智能问答系统上线以来,永安保险在客户咨询业务场景中,智能客服转人工率降低至15.85%,日均处理会话量超2000,人工客服平均响应时间降低至20s。
图片
知识图谱的内涵更加丰富,是知识的另一种表现形式,中关村科金打造的得助知识图谱可为企业提供多源异构数据知识整合服务,已广泛应用于金融、保险、制造、医美等领域积累了10+行业知识,KBQA知识问答准确率超过90%,实现百万级图计算秒级响应。

方案咨询