一、项目背景
2019年2月,习近平总书记在中共中央政治局第十三次集体学习时强调:金融机构应当积极灵活地运用大数据、云计算、人工智能等技术,优化传统业务流程,在提升信息获取效率的同时降低成本,将成本、收益和风险更好地精确匹配,形成相对合理的社会融资成本结构,为实体经济发展提供更高质量、更有效率的金融服务。目前,大数据-人工智能-云计算-创新应用的整体解决方案已成为行业发展共识。
随着券商主营业务收入结构逐步走向多元,金融大数据已步入成熟期,人工智能所需算力基础已经完备,搭建企业级人工智能平台成为必然趋势。
二、应用场景
1. 企业信用评级及预警模型
1)业务需求
结合业务人员已有的业务模型,实现AI对于企业信用评级及预警业务赋能增效:降低风控,合规风险。
2)业务痛点
现有评级系统基于业务人员对于关键词句进行抽取,加以人工分析后定性判断评级结果,维护成本高,模型寿命短,具有应用人工智能的替代空间。
现有评级模型对于非结构化文本转换难度高,从复杂文本中抽取影响信用主体关键词比较难。
3)解决方案
利用计算机视觉进行OCR文本识别 + NLP关键词抽取:针对大量文本识别,通过文本OCR技术,识别精度达到98%,将财务效率提高原有5倍。对于公司公告、信批、研报进行关键词抽取,将有效的非结构化数据转化为结构化数据,从而用于模型深度训练。
利用结构化标签数据进行信用舆情分析:星环科技依托自身丰富语料库,帮助银河证券构建信用评级分词主题库,并对主题分词库进行强弱划分,后期构建分词对模型,对于多个重复出现分词进行交叉强弱对比。
利用机器学习多分类模型进行企业信用评级及预警:Transwarp Sophon支持代码形式的Notebook直接模型迁移,或是基于拖拉拽形式的算子迁移方式。通过机器学习方法深入挖掘用于信用评级及预警使用的指标,并利用机器学习多分类模型对企业信用进行评级及预警。
4)实施效果
智能自主优化模型:在机器学习平台进行实现现有模型的迁移、验证,通过机器学习方法深入挖掘用于信用评级及预警使用的指标,便于业务人员快速使用成熟机器学习模型进行自主优化。
智能提取目标信息:应用图像识别及自然语言处理技术,对于散落于研报等文件中的对企业信用评级有价值的目标信息进行自动提取,将更多非结构化数据信息转化为模型可以应用的参数,扩展了模型判别使用的维度。
智能追踪信用主体:对于一二级市场潜在项目、存续项目主体进行追踪,投资银行部门能够跟踪项目资源池中公司主体内外部情况,并结合对应标的定期自动化生成报告,且更加容易结合机器学习模型进行预测分析。
2. 财经舆情预警
·业务需求
采用NLP舆情技术实现对不同的新闻的正负向打分,并且分析出新闻中出现关联性较强的主体(企业或债券)。
·解决方案
在不同数据库中挖掘近一年的新闻数据。利用分词与自定义词典的方式进行分词以及评分系统筛选出关联性强的主体。然后利用NLP技术,如word2vec+传统机器学习方法,以及Deep Learning的方式进行有监督学习。每天运行一次全部模型,向业务部门输出与感兴趣的主体相关的新闻,并按情感倾向输出新闻的严重性,实现财经新闻的舆情分析。
3. 证券反洗钱
国内外洗钱形势严峻,手段日渐高明,当前的反洗钱系统普遍难以高效准确捕获洗钱行为;为了维护金融市场稳定,配合监管机构打击犯罪,亟需升级反洗钱方*及手段。
1)业务需求
提取可疑交易规则;覆盖全量用户;重点关注可疑用户。
2)业务痛点
用户信息真实性、规范性无法保障。基于规则的反洗钱系统识别效率低。不具备人工智能和机器学习能力,人工核实筛查难度大。金融机构之间数据割裂,数据形成孤岛,难以获取完整的资金链路。
3)解决方案
Step1:有监督模型针对规则引擎筛选后的可疑客户,搭建评分卡模型,识别已知洗钱模式并提供可疑识别规则。
Step2:有监督模型输出重要特征,对全量客户无监督建模,输出无监督异常得分,覆盖全量用户并捕获未知模式。
Step3:基于同一时间段内有第三方托管转账行为、同一电话、同一设备等为关系构建拓扑图,基于已有的标签构建半监督模型,有效识别洗钱团伙。
基于星环图数据库+知识图谱组件,并依托Sophon KG辅助分析,构建基于交易网络,IP网络,设备网络等多种复杂网络结构的形式建立机器学习和深度学习模型,发现交易网络中的异常行为(趋同交易,资金接力等)。
4)实施效果
实时监测掌管洗钱线索,及时、全面、准确、快捷地为执法机关提供协查和扩展资金链分析。
机器学习模型的风险行为的发现率比单纯专家经验排序模型最高提升数倍,同时为风险行为的细分模型提供了40多个特征。
通过构建反洗钱模型,大大提升原有反洗钱靠人工经验挖掘可疑账户的效率,反洗钱效率提升90%。
4. AI智能选股
1)业务需求
当前市场中的AI选股自由度偏低,固化程度很高,模型易用性不强。且选股逻辑无法结合有效的市场环境和业务基础进行判断,无法给到投资者需要的股票池,无法解决普通散户在选股环节“最后一公里”的痛点。
基于企业级人工智能平台,实现APP端客户的散户AI选股推荐:激活存量交易,促进投资在APP端的交易活跃度,进而提升经纪类业务创收和效益,并树立APP品牌口碑。
2)业务痛点
传统财务因子选股仅适合超长周期投资,并不适合资金小交易频繁散户投资者,客群缺乏针对性挖掘及营销。
结合市场反身性理论与行为金融学观点,投资者跟随热点在联动,迭代时效性难以保证。
专家经验维护的模型成本过高。
3)解决方案
星环独有针对证券行业智能推荐模型,并对证券行业客户画像,个股多因子有深入积累。
首先,对投资者画像,结合客户静态特征、客户行为数据(浏览行为数据,交易行为数据,银证转账数据,埋点数据等)及高维衍生特征(行业偏好特征,交易偏好特征,持有周期偏好特征,风险承受特征等)构建投资者标签体系。
其次,基于CPAM资产定价、Fama-french model五因子模型等理论,通过财务估值因子保证AI选股的股票质地之上,结合技术面因子和消息面因子,构建多因子体系,构建适合中短线投资者AI选股模型,让模型跟随市场热点不断迭代学习。
再次,结合个股静态标签(所属行业,所属热点,所属概念,市值)与个股动态标签(搜索量人气,累积交易额,多日上涨比率,多日涨停板个数,5日换手率),构建个股标签体系。
最后,星环结合市场热点,构建投资日历,把握个股较佳交易或建仓时机,给投资者提供安全边际较高的选股策略。
模型环境:基于CDH平台执行SQL脚本;通过Transwarp Sophon平台,对模型进行训练及预测;使用TDH组件Workflow工作流引擎,发布与管理定时跑批任务。
4)实施效果
利用机器学习平台实现数据分析、建模、生产化部署,同时实现了实时模型消费,为客户提供实时的智能选股参考。后续结合回流数据,进行模型的自修正学习,形成机器学习整个过程的闭环。
用户画像对客群合理分类,输出90多个用户画像特征,实现针对性营销,提高转化率。输出90多个股票画像特征,股票推荐提升客户的活跃度,增加了交易量。智能投顾合理降低客户投资风险,获得更好收益。
三、总结
银河证券平台支持松耦合架构,整体部署一个开发测试集群、两个生产集群,实现了一个打通大数据平台、容器云平台、人工智能平台的全链路开发、应用、运维和AI模型全生命周期管理工程化企业及软件平台。