基于中银智能风控平台的应用探索

引 言

业界普遍认为,大模型概念正式提出起源于预训练模型应用,从2017年Transformer算法被提出,到2022年ChatGPT的出现,历经了模型参数量快速提升、学习数据量大量积累,再到引入基于人类反馈的强化学习等阶段,未来仍将会快速迭代与发展。

中银金融科技有限公司 总裁 唐啸

随着AI技术的发展,银行智能风控系统也在不断发展和演变。面对海量复杂的数据,如何建立智能、精准、合规的风险评估和预警机制,是银行风控体系建设需要解决的关键问题。基于“大数据+大算力+强算法”相结合的大模型技术,为构建新一代智能风控系统提供了新的有效手段。

本文重点讨论大模型技术在银行业的应用价值与挑战,对于当下大模型在银行业的应用路径进行了分析。以风控领域为例,数据层和应用层是目前大模型在风控领域较为可行的应用场景,大模型的应用对于风险报告质量提升、风险预警监控的加强及风险图谱的分析优化都具有显著作用。本文也建议在应用场景选择、技术应用及配套建设等几个方面做出重点考量,以推动大模型技术在银行业的落地应用。

大模型技术在银行业的

应用价值和场景选择

近一年来,大模型相关话题热度在全球持续走高,并以惊人的技术迭代和应用演进速度带动了各行业企业的竞相布局。而作为最早应用大模型技术的领域之一,金融业也正积极试水大模型在行业内各领域和场景下的应用。今年3月,彭博针对金融业推出大型语言模型BloombergGPT,引发市场对金融领域大模型的关注。在国内,5月百度度小满开源国内首个千亿参数金融大模型“轩辕”,6月恒生电子发布金融行业大模型LightGPT,并宣布将于9月底正式开放试用接口。然而,虽然银行业应用场景丰富,从基础大模型走向银行核心业务场景的规模化应用仍面临重大挑战。

1.银行业应用场景丰富

大模型在银行业的应用,从价值创造逻辑上可分为两大类。

一是代替人执行重复性任务。生成式AI可以替代人开展大量重复性较高、简单基础的任务,如处理文本的要素提取、识别异常项、生成基础数据分析等。这能够释放运营类人力资源或缺乏流程操作经验的初级序列人员,实现降本增效。

二是协助人提高复杂决策的效率。利用大模型的创造能力,AI可以成为助手,有效放大关键岗位员工的产能,尤其是投资顾问、产品经理、开发人员、信贷审批经理等角色。在关键的业务流程中,大模型可以有效整合关键信息及素材,助力相关专业岗位的人员,更快做出精准有效的判断,更快速地产出高质量代码或文案等交付物。

2.商业化落地存在风险和挑战

当前,银行业大模型的商业化落地面临着诸多挑战。

一是数据安全和泄露风险。大模型的研发和应用过程中可能存在数据泄露和安全风险,尤其是当银行机构依赖于对第三方底层大模型公网API的调用时,数据安全问题更为突出。如何保证在利用大数据的同时,确保数据的安全,是银行业应用大模型必须考虑的问题。

二是数据时效性问题。金融大模型的训练依赖于已有的数据,这种依赖性会导致模型训练和预测存在明显的滞后性。这种滞后性可能使大模型无法及时反映外部环境的动态变化,影响决策的稳定性和准确性。

三是决策稳定性问题。即使有了高质量的训练数据,因为模型结构、解码算法、暴露偏差等原因,大模型仍可能出现幻觉现象,无法做到每一份决策都稳定、精确。这一问题与银行业场景强调安全和审慎的特点产生了冲突。

四是个人隐私保护问题。在金融领域,大模型的训练和应用需要用到大量的个人信息。然而,目前尚无法律明确个人信息使用边界,这就导致使用包含个人信息的数据训练金融大模型存在合规风险。

五是计算模型的缺陷。大模型缺乏透明度、可解释性和一致性。大语言模型的复杂结构使得模型难以解释和说明其是如何作出决策的。虽然模型能为其决策提供高质量的事后解释,但仍然难以利用这类解释来验证模型作出决定的过程,这就导致我们无法识别模型中存在的偏见和错误。目前,大模型缺少检验生成内容与训练数据是否一致或自洽的方法,因而导致其缺乏一致性。

3.场景落地需审慎分步进行

在应用探索初期,各家银行通常优选少量场景先行试水、循序渐进。在选择场景时,要平衡考量收益潜力、风险、实施难度。同时,最早落地的试点场景,还需考虑其能否在组织准备度诊断、方法构建、信心构建等角度形成示范效应。以下几个问题,是场景定位时通常需要面对的权衡选择。

一是大模型的角色定位。即使是同一个业务场景,取决于AI的角色定位不同,其收益潜力和实施难度也不尽相同。目前来看,虽然大模型有潜力出色完成决策类场景的任务,但这并不意味着就是当下优先级最高的场景。机器往往难以对目前银行业复杂的决策场景进行稳定的、透明的、可解释的输出,即存在决策稳定性问题和计算模型缺陷问题。相反对于基础性、重复性的工作,例如只对事实性信息进行自动抓取和归纳,或判断某一信息的好坏类型,大模型的价值释放潜力短期来看可能更为显著。

二是对客还是对内。在对成本收益进行考虑时,不仅要考虑直接的运营人力节约的收益,还要考虑因数据泄露、隐私保护等潜在问题可能导致的额外间接成本。由于银行业在开展对个人客户的销售时,往往较其他行业面对更严格的行为监管和内控要求,直接对客的场景首先试水大模型应用,实际挑战更大。

三是是否要替代目前已在应用的传统AI。研究表明,传统AI模型在不少场景仍具有很强的能力,其与大模型在相当长一段时间内会共存。从单一任务来看,传统机器学习模型较为擅长的是需要较强解释性、需要进行量化预测结果的任务。而大模型擅长的是产出业务内容、答疑解惑式场景的任务。因此未来,大模型和传统的单任务模型之间,更可能是强强结合、同时使用的关系。

因此从一般的智能风控系统架构(数据源、数据平台、执行层、计算层、应用层)来看,结合大模型在银行业的价值和风险,数据层和应用层更适合作为大模型在风控领域的先行场景。在数据层利用大模型的NLP、图像语义识别等能力,进行非结构化数据要素提取、风险指标提炼和基础数据分析等低难度、重复性、基础性工作,体现其“替代人”的作用。在应用层利用大模型的信息挖掘、文本生成等能力,生成信贷调查基础版报告,协助信贷审批人员进行贷款审查,体现其“辅助人”的作用。

大模型技术在银行智能风控领域的

应用初探

为了矢志践行服务国家发展大局之路,坚持科技创新,中银金融科技有限公司作为中国银行的金融科技子公司,已启动大模型在银行业及智能风控领域的研究和探索。

中银智能风控平台承载了中国银行数十载信贷风险管理经验与成果积累,平台在产品构建、数据处理、技术运用方面均为自主创新设计。平台由“万象”风险360全景视图、“天网”风险图谱多维分析、“洞鉴”风险预警监控平台、“神策”风险决策引擎、“妙算”风险模型工厂、“运筹”机构全面风险管理大盘6大应用产品组成,并通过多年建设积累,形成中行特色的企业级风险知识库及风险模型成品库。贯穿信贷全流程,覆盖科技金融、绿色金融、普惠金融等多个金融业务场景,为提前识别风险、处置风险提供有力支撑。大模型技术将为中银智能风控进一步的数字化升级和创新提供新的有效手段。

当前三种较为可行的应用场景包括如下。

1.风险报告生成

中银智能风控平台目前可实现贷前调查报告及授信审查报告自动化。在授信流程中智能化自动生成贷前调查报告及授信审查报告,减轻一线人员信息收集及撰写报告工作量,减少因人员能力差异或数据收集困难造成的客户风险未识别、低估问题。同时平台每日可生成用户关注客户的风险扫描日报,并通过移动端推送日报结果,快速高效知晓最新风险动态。

利用大模型技术与RPA技术相结合,通过嵌入外部信息模块,学习客户历史数据及文本数据,分析财务数据及风险数据,可实现关键要素提取、资料自动化审核、风险点提示等风控领域的业务操作,自动生成标准化贷前调查报告和信贷授信发起报表。信贷人员仅需要在此基础上作少量修改,就能形成一份完整准确的报告,有利于降低审核的风险,提升审核的效率和质量。

2.风险预警监控

在数据层面,中银智能风控平台已整合了内部信贷、会计、资产负债表、审计等系统数据,实现行内数据的全面调用和挖掘,打通内部数据孤岛,外部引入工商、司法、互联网舆情、投融资、宏观等数据信息,实现外部数据汇总。同时平台已建立了全面的风险预警监控体系,可依托智能风控体系提供各类分析应用和风险预警。利用大模型技术,可以进一步挖掘风险特征和信息,提高风险预警的准确性和及时性。

大模型对于风险预警监控的优化可以体现在两方面。一是结构化信息提取能力的提升。大模型的应用可以大幅加强文本信息中的结构化数据提取。例如,相比常规深度模型,大模型从文本中识别出包括公司、政府、社会组织等在内的机构名称的准确率和召回率更为理想,有助于风控系统进一步挖掘机构的风险信息,提升风险预警的准确性。二是舆情风险识别能力的加强。例如对于从新闻资讯等非结构化数据中进行风险分类的任务,人工识别的做法效率较低,使用常规深度模型进行识别的准确率较低,而使用大模型能使准确率和效率获得较大幅度的提升。

3.风险图谱分析

中银智能风控平台风险图谱分析产品,提供了包括单一客户维度的综合图谱、股权图谱,以及客户群维度的集团关系等的图谱可视化展现、实体间路径探查、分析及深层次隐性关联关系挖掘服务。基于大模型的语言理解能力,风险图谱的关系识别与风险推理能力可以得到进一步的增强。

知识图谱是一种表示和组织领域知识的结构化数据模型,它由实体、属性和关系组成。知识图谱技术当前面临语料数据标注效率低、知识抽取质量难以保证、语义理解和自然语言处理难度大等瓶颈,而通过借助大模型的结构化信息提取能力,知识图谱面临的这些瓶颈可以得到改善和补足。例如,从风险舆情非结构化文本中进行因果关系的三元组提取、事件论元抽取,都可以通过大模型,辅以LangChain等LLM交互工具进行实现。此外,基于大模型,还可以从图结构信息、节点属性和模型特征中提取关键信息,生成智能风险报告,并通过基于特征的联动图谱可视化展示,使得风险分析更加智能化和直观化。

银行业大模型应用落地的建议

虽然大模型在银行业的落地应用具有多重挑战,但我们仍对银行业推进大模型应用落地充满信心。一方面,银行业具有丰富的应用场景,另一方面,银行业更具备了由点及面推进大模型应用的三大条件,即扎实的数字化基础、完备的技术能力和多元丰富的数据。总结来看,在推进技术落地过程中有三点需予以重点关注。

1.应用场景需由点及面

在探索初期需平衡收益和风险,优先选择非直接对客场景。例如将大模型应用限制在问题域相对明确的场景,或将大模型作为生产率提升的工具助手,通过有效的人机协同,提升逻辑可解释性。同时需建立严格的并行验证测试机制,强化决策行动的人工审核把关。银行业务场景不同于ChatGPT等商用对话类大模型提供的消费级对话场景,一旦大模型出现推理错误和产生幻觉,轻则影响客户体验,重则影响金融系统安全,需要采取审慎态度。

2.技术层面需多管齐下

以强化学习和持续学习技术、鲁棒性决策、组合式AI系统技术等关键技术为抓手,让AI生成的内容更专业、实事求是。大量研究表明,通过调整预训练任务、使用强化和持续学习等方式,可以对原始的大规模预训练模型做进一步优化,达到更好的效果;鲁棒性决策则是实现关键决策的持续稳定和合规可信的核心环节;组合式AI系统技术可以有效结合各种垂直领域的判别式模型的可用性和专业性,助其真正发挥大模型的泛化能力优势。

3.配套建设需全面升级

规模化应用需关注技术之外的整体IT能力提升和组织及业务的转型。大模型在银行核心业务的规模化应用是一个体系性工程。除了模型和算力的部署,当大量运用AI时,需要有操作行为规范,引导员工进行合适的信息输入并对机器输出进行合理的判断和使用。围绕质量管理、风险监控、责任认定等,也需构建匹配的管理机制。银行还要构建负责任AI体系,在精调和应用开发时,尽力确保公平性、可靠性、透明度或可解释性、隐私安全、可问责等目标。

请使用浏览器的分享功能分享到微信等