行业新闻

侦探技术探索:异常数据挖掘与反保险欺诈

2022-07-23 阅读次数:

数据挖掘在反保险欺诈方面的应用,是通过对异常数据挖掘来实现的。在数据分析过程,一些数据对象可能因与一般行为模型不一致,而视为噪声或异常而丢弃,但是,在保险欺诈、信用卡欺诈等异常行为识别上,专门针对异常数 据的挖掘具有更为重要的价值,因为保险欺诈行为作为一种非正常行为,它的数据特征、模型正是隐含在这些异常数据中的。
虽然传统数据分析发现一些表面特征,如重复投保、高额投保、频繁投保等,可能是影响欺诈概率、欺诈金额的关键因素,但是由于传统的分析方法并不具备足 够的能力进行更深入地分析,隐含的数据间更本质的特征很难被识别和加以利用,而且,传统数据分析通常从很多预设的假设条件出发,试图寻找保险欺诈的特征, 这种做法显然会缩小分析范围,遗漏有价值的信息,降低分析的科学性和效果。
数据挖掘较好地克服了这两方面的问题,首先,数据挖掘借助强大的分析工具,能深入地挖掘隐含的数据间关系并加以模型化,其次,数据挖掘是在没有明确假 设的前提下去挖掘信息,真实地、全面地反映数据间的客观存在的关系,这是其与传统数据分析的本质区别,也是其独特优势的体现。数据挖掘有助于识别出那些不 能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识。在反保险欺诈方面,这些不能靠直觉发现或违背直觉的知识可能更具有应用价值,使我们对保险欺诈特 征的认识更加深入、更加客观。  对于异常数据的挖掘主要是使用偏差检测,在数学意义上,偏差是指分类中的反常实例、不满足规则的特例,或者观测结果与模型预测值不一致并随时间的变化 的值等等。偏差检测的基本目标是寻找观测结果与参照值之间有意义的差别,主要的偏差技术有六西格玛检测、聚类、序列异常、最近邻居法、多维数据分析等。除 了识别异常数据外,异常数据挖掘还致力于寻找异常数据间隐含模型,用于智能化的分析预测。   通过异常数据的检测和建模分析,可以发现保险欺诈行为特征,这些特征既包括保险欺诈的一些表面特征,也包括一些不能通过直觉发现的特征。识别出这些特 征,能为保险公司的经营决策提供支持。针对不同险种、不同地域、不同客户群进行专门的数据挖掘,发现更具体化的欺诈特征,以制定出具有针对性的措施,提高 反欺诈的效果。识别保险欺诈行为特征是开展数据挖掘在反保险欺诈其它方面应用的基础。