近日,在中国信息通信研究院联合中国通信标准化协会召开的2022大数据产业峰会上,中国信息通信研究院正式发布了2022年大数据十大关键词,图计算平台成为今年大数据十大关键词之一。
Gartner预计到2025年,图数据技术将用于80%的数据和分析创新,比2021年的10%有大幅提高,从而促进整个企业的快速决策。
IDC预计,到2024年,55%的中国500强企业将部署图数据库,认识到这项技术适用于越来越多的应用场景,涉及关系、影响、路径和模式分析。
此外,根据数据库统计网站 DB-Engines的统计,图数据库连续多年处于高速发展中,远超其他类型数据库的关注,成为流行度增长最快的数据库类型。
图数据库这项新兴技术,与传统关系型数据相比,图数据库在处理海量数据关联关系时具有非常高的性能优势,能够快速找到实体间的深度关联关系,并且数据模型非常灵活,可以轻松实现添加或删除顶点、边,扩充或者缩小图模型。此外,图数据库模型非常敏捷直观,降低数据挖掘和业务开发门槛,提供生产开发效率。
图数据库是怎样一种数据库,和传统关系数据库的主要区别在哪里?
在金融领域,图数据库通过利用多维交叉关联信息可以深度刻画交易行为,可以有效识别规模化、隐蔽性的欺诈网络,结合机器学习、聚类分析、风险传播等相关算法,可以实时计算用户的风险评分,在风险行为发生前预先识别,有效帮助金融机构提升效率、降低风险。
TranswarpStellarDB是星环科技自主研发的分布式图数据库,兼容openCypher查询语言,提供海量图数据的存储和分析能力,支持原生图存储结构,支持万亿边PB级数据存储。同时,StellarDB具备毫秒级点边查询能力,10+层的深度链路分析能力,提供近40种的图分析算法,具备数据2D和3D展示能力。星环科技StellarDB在金融、政府和社交网络等领域应用,并且在某地电信关系图谱场景实现了万亿边规模的存储和稳定运行,真正意义上将万亿级图数据库能力应用落地。
此外,中国信息通信研究院近日公布了第十四批“可信大数据”产品能力评测结果,星环科技分布式图数据库StellarDB通过了中国信通院图计算平台基础能力测试。
本文将围绕信用卡使用环节来探讨星环分布式图数据库StellarDB在金融领域信用卡反欺诈场景中的应用。
基于行内信用卡相关数据对点和边进行定义,包括用户、商户、账户、银行卡、公司、地址等实体,并将这些实体以其关联关系定义为边,构建图数据蓝图。从而可以快速、便捷的查看信用卡用户的消费情况,包括消费金额、消费的商户,商户的消费情况,并与用户的居住地址、办公地址等进行关联分析。例如对用户与店铺的交易情况、用户常消费的地理位置、消费金额等因素关联分析,从而识别异常行为。
更多Demo可查阅:
信用卡套现是指持卡人不是通过正常合法手续(ATM或柜台)提取现金,而通过其他手段将卡中信用额度内进行套取,同时又不支付银行提现费用的行为。信用卡套现人员通常会和商户私下合作,通过多次刷POS机或刷多家POS机来套取额度,或转账给第三方中转,或者多次转账来掩盖套现行为。
商业银行的交易流水量庞大,传统关系型数据库方案无法有效的从海量交易数据中快速识别出套现异常行为。不同交易渠道之间的数据也存在孤岛,无法将多种交易渠道进行关联分析,导致套现行为难以侦测。
筛选出信用卡账单周期内使用额度比较大的用户,将账户、消费商户地址、居住地址、办公地址等信息在同一张图中集中展示,可以高效识别用户和商户之间发生的交易行为。也可以通过StellarDB社群探索算法将相同的地址在同一画布上展示,发现用户消费商户地址与居住地址、办公地址不在同一地方的情况,从而对此类异类消费行为进行快速识别。
举例:
通过对账单周期内使用额度比较大的用户进行筛选,识别出用户A、B和C存在大额信用卡消费行为。
用户A信用卡额度为12000元,在账单周期内只发现了一笔交易,在商户2消费了11500元,同时发现该商户有向用户A的借记卡进行转账的行为,转账金额为21200元;用户C也在该店铺进行了大额消费,消费金额为10000元。基于社群探索算法发现用户A和用户C属于同一家公司,属于同事关系;用户C在该店铺的消费金额与用户A消费金额相加和商户2给用户A转账金额接近。因此,怀疑用户A和用户C与商户2之间存在信用卡套现行为。
信用卡黑名单指的是长时间逾期、屡次催款不还、非法套现等被相关银行列入拒绝信贷的用户。基于传统方式识别出的已知黑名单实体数量有限,无法形成识别链,并且黑名单用户和商户之间关系错综复杂,如何基于已知黑名单实体信息挖掘出潜在的黑名单实体成为商业银行非常棘手的问题。
通过StellarDB定向分析,可识别黑名单之间是否存在关联关系,和传播链路上的实体;通过社群探索算法可识别黑名单实体和邻近实体之间是否有紧密来往关系。
举例:
基于已知黑名单实体A和B,通过StellarDB路径发现功能,发现A和B之间存在传播路径,路径上有用户C和D。
针对传播路径上的可疑用户,可以查询其工作、居住地址信息以及全部的社交关系。通过社交关系,发现传播路径上的可疑用户C和用户E属于同一家公司,而路径上的另一个可疑用户D认识用户E,因此将用户E纳入为可疑用户进一步分析。
同时,可以通过StellarDB多跳分析算法对单个黑名单实体多跳以内的人际关系信息进行查询分析,并与所有已知黑名单实体进行关联分析,通过社区分类查看是否有在同一区域的客户和商户。由图可知可疑用户A、3跳关系用户和已知黑名单商户实际居住在同一个地方,2跳用户和已知黑名单用户居住在同一地方。
此外,结合用户与商户的交易情况和12个月内账户的欠款情况(账户实体上账龄历史和违约次数可以参考),从而挖掘出潜在的黑名单实体。
团伙套现一般是通过申请多张信用卡或者大量盗用他人的信用卡和商户之间有预谋的批量进行套现。团伙套现通常可能会将套现资金用于非法用途,大规模的套现行为还会影响银行信贷系统,严重的会产生金融风险。
团伙套现行为一般会和社区内的正常用户交易会产生隔离。通过StellarDB的图算法可快速划分社区,将与社区内交易的独立交易识别出来,同时结合上述两个场景中的用户与商户之间的关联发现,用户与用户之间的关联发现等,从而有效地发现团伙套现行为。
举例:
基于卡片和商户的交易情况,通过StellarDB的PageRank算法可以快速识别商户与其他节点的关联度,将关联度低的卡片和商户识别出来。
通过StellarDB实体查询可将关联度比较低的实体用户和商户的交易情况进行分析,并且将交易金额异常的实体做进一步分析。
将异常实体所在区域内的全部商户及消费用户的信息进行展示,通过识别用户和商户之间的关联分析,结合其近期的消费等情况,从而有效识别异常行为。如图商户1仅和用户A一个用户产生交易,且金额较大,行为比较异常。
基于上述的场景1套现行为识别和场景2潜在黑名单实体挖掘,可对套现团伙做进一步分析,从而有效挖掘出套现团伙。
近日,在中国信息通信研究院联合中国通信标准化协会召开的2022大数据产业峰会上,中国信息通信研究院正式发布了2022年大数据十大关键词,图计算平台成为今年大数据十大关键词之一。
Gartner预计到2025年,图数据技术将用于80%的数据和分析创新,比2021年的10%有大幅提高,从而促进整个企业的快速决策。
IDC预计,到2024年,55%的中国500强企业将部署图数据库,认识到这项技术适用于越来越多的应用场景,涉及关系、影响、路径和模式分析。
此外,根据数据库统计网站 DB-Engines的统计,图数据库连续多年处于高速发展中,远超其他类型数据库的关注,成为流行度增长最快的数据库类型。
图数据库这项新兴技术,与传统关系型数据相比,图数据库在处理海量数据关联关系时具有非常高的性能优势,能够快速找到实体间的深度关联关系,并且数据模型非常灵活,可以轻松实现添加或删除顶点、边,扩充或者缩小图模型。此外,图数据库模型非常敏捷直观,降低数据挖掘和业务开发门槛,提供生产开发效率。
图数据库是怎样一种数据库,和传统关系数据库的主要区别在哪里?
在金融领域,图数据库通过利用多维交叉关联信息可以深度刻画交易行为,可以有效识别规模化、隐蔽性的欺诈网络,结合机器学习、聚类分析、风险传播等相关算法,可以实时计算用户的风险评分,在风险行为发生前预先识别,有效帮助金融机构提升效率、降低风险。
TranswarpStellarDB是星环科技自主研发的分布式图数据库,兼容openCypher查询语言,提供海量图数据的存储和分析能力,支持原生图存储结构,支持万亿边PB级数据存储。同时,StellarDB具备毫秒级点边查询能力,10+层的深度链路分析能力,提供近40种的图分析算法,具备数据2D和3D展示能力。星环科技StellarDB在金融、政府和社交网络等领域应用,并且在某地电信关系图谱场景实现了万亿边规模的存储和稳定运行,真正意义上将万亿级图数据库能力应用落地。
此外,中国信息通信研究院近日公布了第十四批“可信大数据”产品能力评测结果,星环科技分布式图数据库StellarDB通过了中国信通院图计算平台基础能力测试。
本文将围绕信用卡使用环节来探讨星环分布式图数据库StellarDB在金融领域信用卡反欺诈场景中的应用。
基于行内信用卡相关数据对点和边进行定义,包括用户、商户、账户、银行卡、公司、地址等实体,并将这些实体以其关联关系定义为边,构建图数据蓝图。从而可以快速、便捷的查看信用卡用户的消费情况,包括消费金额、消费的商户,商户的消费情况,并与用户的居住地址、办公地址等进行关联分析。例如对用户与店铺的交易情况、用户常消费的地理位置、消费金额等因素关联分析,从而识别异常行为。
更多Demo可查阅:
信用卡套现是指持卡人不是通过正常合法手续(ATM或柜台)提取现金,而通过其他手段将卡中信用额度内进行套取,同时又不支付银行提现费用的行为。信用卡套现人员通常会和商户私下合作,通过多次刷POS机或刷多家POS机来套取额度,或转账给第三方中转,或者多次转账来掩盖套现行为。
商业银行的交易流水量庞大,传统关系型数据库方案无法有效的从海量交易数据中快速识别出套现异常行为。不同交易渠道之间的数据也存在孤岛,无法将多种交易渠道进行关联分析,导致套现行为难以侦测。
筛选出信用卡账单周期内使用额度比较大的用户,将账户、消费商户地址、居住地址、办公地址等信息在同一张图中集中展示,可以高效识别用户和商户之间发生的交易行为。也可以通过StellarDB社群探索算法将相同的地址在同一画布上展示,发现用户消费商户地址与居住地址、办公地址不在同一地方的情况,从而对此类异类消费行为进行快速识别。
举例:
通过对账单周期内使用额度比较大的用户进行筛选,识别出用户A、B和C存在大额信用卡消费行为。
用户A信用卡额度为12000元,在账单周期内只发现了一笔交易,在商户2消费了11500元,同时发现该商户有向用户A的借记卡进行转账的行为,转账金额为21200元;用户C也在该店铺进行了大额消费,消费金额为10000元。基于社群探索算法发现用户A和用户C属于同一家公司,属于同事关系;用户C在该店铺的消费金额与用户A消费金额相加和商户2给用户A转账金额接近。因此,怀疑用户A和用户C与商户2之间存在信用卡套现行为。
信用卡黑名单指的是长时间逾期、屡次催款不还、非法套现等被相关银行列入拒绝信贷的用户。基于传统方式识别出的已知黑名单实体数量有限,无法形成识别链,并且黑名单用户和商户之间关系错综复杂,如何基于已知黑名单实体信息挖掘出潜在的黑名单实体成为商业银行非常棘手的问题。
通过StellarDB定向分析,可识别黑名单之间是否存在关联关系,和传播链路上的实体;通过社群探索算法可识别黑名单实体和邻近实体之间是否有紧密来往关系。
举例:
基于已知黑名单实体A和B,通过StellarDB路径发现功能,发现A和B之间存在传播路径,路径上有用户C和D。
针对传播路径上的可疑用户,可以查询其工作、居住地址信息以及全部的社交关系。通过社交关系,发现传播路径上的可疑用户C和用户E属于同一家公司,而路径上的另一个可疑用户D认识用户E,因此将用户E纳入为可疑用户进一步分析。
同时,可以通过StellarDB多跳分析算法对单个黑名单实体多跳以内的人际关系信息进行查询分析,并与所有已知黑名单实体进行关联分析,通过社区分类查看是否有在同一区域的客户和商户。由图可知可疑用户A、3跳关系用户和已知黑名单商户实际居住在同一个地方,2跳用户和已知黑名单用户居住在同一地方。
此外,结合用户与商户的交易情况和12个月内账户的欠款情况(账户实体上账龄历史和违约次数可以参考),从而挖掘出潜在的黑名单实体。
团伙套现一般是通过申请多张信用卡或者大量盗用他人的信用卡和商户之间有预谋的批量进行套现。团伙套现通常可能会将套现资金用于非法用途,大规模的套现行为还会影响银行信贷系统,严重的会产生金融风险。
团伙套现行为一般会和社区内的正常用户交易会产生隔离。通过StellarDB的图算法可快速划分社区,将与社区内交易的独立交易识别出来,同时结合上述两个场景中的用户与商户之间的关联发现,用户与用户之间的关联发现等,从而有效地发现团伙套现行为。
举例:
基于卡片和商户的交易情况,通过StellarDB的PageRank算法可以快速识别商户与其他节点的关联度,将关联度低的卡片和商户识别出来。
通过StellarDB实体查询可将关联度比较低的实体用户和商户的交易情况进行分析,并且将交易金额异常的实体做进一步分析。
将异常实体所在区域内的全部商户及消费用户的信息进行展示,通过识别用户和商户之间的关联分析,结合其近期的消费等情况,从而有效识别异常行为。如图商户1仅和用户A一个用户产生交易,且金额较大,行为比较异常。
基于上述的场景1套现行为识别和场景2潜在黑名单实体挖掘,可对套现团伙做进一步分析,从而有效挖掘出套现团伙。