狮桥蒋宏:基于图谱的物流和商用车金融风控实践

2023-07-05 03:16:36

 

分享嘉宾:蒋宏 狮桥集团

编辑整理:毛佳豪 杭州电子科技大学

出品平台:DataFunTalk

导读:随着小微企业贷款融资需求不断增长,物流和商用车金融领域的金融渗透率越来越高,传统物流产业链中的金融风控面临巨大挑战。随着物流数字化的进步,人工智能技术的发展,智能风控体系的建设成为了行业发展的必然趋势。本次分享题目为物流和商用车金融风控算法应用体系,主要介绍:

小微企业和智能风控搭建算法应用体系搭建特征画像体系行业图谱的风控应用

--

01 小微市场和智能风控

1. 小微市场——物流和商用车金融

① 小微企业发展情况

下图反映了2016-2025中国实有各类市场主体及小微企业占比的情况发展:

可以发现,小微市场是现在国家主要希望去推动、去发展的一个力量,因为小微市场在整个中国的市场主体当中占有的比例达到了95%以上,是比较高的一个比例。

② 小微企业贷款融资需求

再来看看2016-2025中国小微企业贷款余额规模发展趋势图:

从图中可以发现,小微企业的贷款融资需求也在持续增长,从2016年到2020年,年均复合增长率在12.2%。预计未来2021年到2025年这个数字将会提高到18%,说明小微企业的融资需求远没有被满足。

③ 狮桥为商用车而生,专注服务小微企业市场

每一台商用车背后都是一个物流运输行业的小微企业经营单元,狮桥基于市场优势,深入到商用车以及商用车相关的物流行业中,为行业中的小微企业和企业个人提供全方位的服务。

狮桥主要围绕着商用车的“买、用、养、转”四个环节来开展服务。

买——购车融资

通过高度下沉的零售金融网络、领先的线上业务平台和完善的风控体系,为需要购买商用车设备的司机车主提供融资支持。

用——物流货运

通过先进的智能车辆管理技术、业财管理系统、智慧路由调度定价体系,为物流货主提供性价比更优的公路货运综合运输服务。

养——油路保胎

通过自主研发的APP及深耕多年的卡车司机社群,为司机车主提供油路保胎、运营资金、车体广告、生命周期管理等智慧车后服务。

转——置换交易

通过中国领先的商用车车型库打造集检测、估值、交易、金融等为一体的二手商用车线上综合交易服务平台,为车主和车商提供专业化、精细化的一站式服务解决方案。

④ 金融在商用车领域具有高渗透率

整个市场中,商用车购车环节的金融渗透率已经高达了80%,主流方式是融资租赁模式。主要有两种模式:

直接租赁模式

在这种模式下,融资租赁公司了解到车主的购车意向之后,直接从车辆的供应方购买车辆,再给购车人提供车辆的使用权,按期收纳租金。

标准售后回租模式

标准的售后回租模式下,购车人从车辆供应方中购买交易车辆,再将车辆转售给汽车融资租赁公司,使其获得车辆所以权,而自己则拥有车辆使用权,并且购车人需按期向融资租赁公司缴纳车辆租金。

⑤ 金融在物流供应链中是“血脉”

商用车的使用环节实际上是嵌入到整个供应链中的,从供应链上游将货物给到核心企业,再从核心企业将货物运送到下游企业,在货物流向当中,商用车发挥了巨大的价值。

但是在这个流转过程当中,司机或者车主都有融资的需要,因为他们的费用如油费、路费都是实时发生的,但是他们的运费是在后结算,这就存在资金占用的问题,因此该环节会有实际的运营资金需要。同样的,在供应链的上中下游,存在应收账款、存货以及预付账款环节,这些环节实际上都会对相应企业带来资金的占用压力。所以,狮桥就可以在诸多环节中为需求方提供相应的金融服务,如解决司机端先发生油费、路费支出后收到运费带来的资金压力以及上中下游各企业资金即时需求与收入滞后的问题。

⑥ 传统物流产业链中金融风控面临的挑战与机遇

传统物流和商用车金融风控面临诸多挑战,包括:

线下人工环节重:信息采集难、信息获取时效性低、未被数字化单笔金额大:样本量偏少,风险容忍度低业务欠规范:数据欠规范、流程欠规范数据获取难:数据分散在诸多外部机构、数据标准化程度低

但随着行业数字化和智能化的发展,金融风控也产生了新的机遇,包括:

数字化转型升级:内部数据更加标准、健全数据生态逐步发展:可用的三方数据更加丰富行业增长及集中度提高:总样本提高、单个机构样本也增加,管理日趋规范量化风控技术的发展:增加了风控的新手段、提高了风险识别的精度

2. 智能风控

① 智能风控体系的建设是行业发展的必然趋势

在行业发展的新机遇下,智能风控体系建设已经成为物流和商用车领域的必然趋势。

上图是狮桥的风控框架,框架具有多层结构,其中底层是技术架构的实现;中层左侧是智能风控相应的方法论,涉及到模型的搭建、数据的挖掘等等,右侧是智能算法,包括机器学习算法、深度学习算法以及关系网络的挖掘算法等;上层是应用体系,包括贷前贷中贷后各环节风控的应用。整体目标上,我们希望智能风控能够帮助提高风控的精度、速度。

② 智能决策与人工专家的关系

在智能化转型的过程中,智能风控体系与传统的人工风控专家具有什么样的关系呢?

如图所示,在商用车或者物流领域中,很难一步到位做到完全地量化决策,则其中就会涉及到智能决策和人工专家的关系。

以一个例子进行说明:人工专家相当于人工驾驶员,而智能风控相当于自动驾驶,两者结合,智能风控实际上起到是辅助驾驶的作用。随着技术的不断发展,自动驾驶的比重会逐渐增大,使用范围会变得更加广泛,而人工专家实际上需要往专精方向发展。对于常规的审核,会逐渐纳入到左侧的智能风控体系中,通过对于量化方式无法保证数据准确性的案例,就需要精锐的风控专家去实现。

--

02 算法应用体系

算法模型以及对算法模型的应用是智能风控的核心,实践中我们通过算法模型的应用来实现自动的风控决策。

1. 风控模型简介

① 模型理解:

风控信贷领域所指的模型可用从以下三个方面来理解:

模型是基于各种数据、统计或者人工智能方法结合对应数据所构建出来的实例此实例的存在方式则是以数据公示或者函数的形式所表达的(例如f(x) = ax + b)此实例的构建过程就是通过数据寻找最优a和b的过程

② 模型介绍:

如下图所示,常见模型分为有监督模型、无监督模型两类,在风控算法当中用的较多的是有监督模型。基于逻辑回归的评分卡模型是传统金融机构用得最多的,因为它的解释是最好的。再往下则是决策树、基于决策树的集成学习算法如Xgboost,之后还有贝叶斯、支持向量机、神经网络/深度学习这一类模型,那么这些模型都可以在风控当中进行应用。无监督算法典型的就是聚类算法,比如在进行客群分层或者客群分类的时候,会用到聚类算法。

③ 模型选择:

如何选择模型呢?根据两个维度进行选择:模型的可解释性、模型的准确性。以上面介绍的模型为例:对于有监督模型,从上到下的模型,准确性是逐渐升高,而可解释性逐渐降低的。

在风控当中,很多时候要求模型具有解释性,因为用数据做决策的前提或假设是:

数据准确可靠+历史会在未来重演

但是事实上,这些前提假设在业务当中并不是百分百都能满足的。所以我们需要在解释性上做一个判断。人的优势是对于未来的判断,而数据或者量化模型,更多是基于历史数据说话,所以在解释性上,需要做一些权衡的取舍。

⑤ 模型搭建:

在了解了风控模型后,再来看看搭建一个风控模型的概要流程,可分为9个过程,如下图所示:

2. 风控决策

风控模型当中,典型的是风险评估,流程是基于模型给出一个用户或者一个主体对象的违约概率,并基于这个违约概率来做风险决策。如下图,我们基于用户做了评分模型之后生成了一个评分分布和逾期率分布图。不同的分数段代表了违约概率的高低,柱状图的高度代表客户的分布,曲线图是在每个评分段中的违约率即坏客户的比例。

从分布图中可以看出:评分越高,违约率越低。基于该数据,我们就可以进行风险决策。比较常见的决策是准入决策,即对于客户的需求,产生通过或者拒绝的动作。对于超出了我们能够容忍的风险水平的客户,我们就会拒绝,通过的那部分人,我们就基于分数的分层,给它设定不同的费率和不同的额度。

3. 算法应用

再来介绍一下,风控模型能够应用的环节:

① 应用对象:

按不同颗粒度,风控的对象分为渠道、用户、项目、支用等,如下图的业务场景:

首先判断渠道的风险,再判断渠道中个人的风险,而更细的粒度是判断每笔订单的风险,甚至还要去预测每笔订单中还款情况。所以,算法实际上会应用到不同颗粒度的对象,从而在业务中全方位地建立应用体系。

② 应用环节:

风控主要分为贷前、贷中、贷后三个环节。

贷前:典型的是在信贷审核当中,判断欺诈可以用欺诈相应的模型;对于判断信用风险,可以建立信用风险的评估模型,进行准入和定价的差异化。

贷中:可以对用户的额度进行提额或降额,也可以做一些贷中的营销,判断哪些用户的风险比较低,并对其进行二次营销。

贷后:主要是还款意向,对于已经逾期的用户,哪些用户是比较容易追回来的,哪些用户是比较困难的,可以通过模型的方式来做这种预估。

--

03 特征画像体系

风控模型应用体系的成功与否,有一个非常关键的因素——特征画像体系的搭建。数据和特征决定了这个机器学习的上限,模型和算法只是逼近这个上限而已。在目前实际的业务当中,算法模型的选择不是最重要的,特征画像体系搭建才是最关键的环节。

1. 特征画像介绍

什么是特征画像?以基本的概念讲,从多个维度的用户量化数据去刻画用户或者主体对象。

我们常常在业务场景中听到对于风险的描述,但它是一个概念,无法直接应用到量化模型当中,所以我们必须把概念化的事物进行数据化。如下图,可以看到用户有不同的维度,有基本信息、行为数据、消费数据、社交数据等,比如他最近的高风险行为,又或者借款偏多这类概念性的对象,就需进行量化。

比如借款偏多,可以通过特征进行描述:最近三年借款的总金额是多少?最近一年借款的总金额是多少?最近三个月电商消费是多少?或者说最近一个月比最近三个月这个比值又是多少?通过量化的数据去描述概念化的对象。我们通过提取用户身上的信息,加工成相应的特征,特征越丰富,在量化风控模型当中,就能够越好地去判断用户的风险情况。这些特征中有部分是直接从数据中采集得到的,比如年龄、性别。另一部分需要通过汇总加工,比如借款金额、逾期次数、消费金额、投资的公司数量等。

2. 特征画像构建方法

原始数据:数据是从何而来,时效性如何,质量如何?

数据清洗:重复数据、异常数据、缺失的数据较多,需要进行清洗。清洗过程中,对于异常数据,需要结合业务,结合产生的来源做判断,做相应的处理,而不是直接去除或者填充。

构建中间数据集:中间数据集有结构化数据、文本数据、关系网络数据,不同数据采取的清洗方法也是不同的。

特征设计:最简单的是基于业务逻辑的方法,然后是基于自动化的这种RFM的方法,还有直接基于算法维度去做提取特征。

特征评估:特征评估中需要查看特征覆盖度、特征离散度、特征预测效果以及特征的稳定性。

经过一个完整的工序,才能够挑选出有用的特征用于风控模型当中。

3. 特征画像的应用

① 构建不同主体的特征画像

基于完整的特征提取体系,就可以对不同的主体进行刻画。在业务场景当中,典型的就是第一承租人即借款人,他的特征一般有年龄、性别、负债情况、收入情况等等。第二个是对项目进行刻画,即承租人在我司开展了不同的项目,每一个项目当中涉及到的金额、车辆以及关联的公司情况。其次是车辆特征的刻画,具体包括车辆的价值、车龄、品牌、吨位。最后还有挂靠公司或经销商这些相关公司的主体。尤其是挂靠公司这一类,在业务场景当中,风险比单纯的单个项目的风险要更高一些,比如说一个挂公司,它名下可能会挂靠多个车辆并涉及到多个承租人,那么该公司逾期变化的涉及面就很广,有可能就不是一笔借款的问题,而是10笔20笔的问题。

② 构建不同环节的特征画像

基于特征画像的方法不仅会应用到不同的主体当中,也会在各个风控环节当中起到作用。因为即使是同一个主体,在不同环节获取到的信息也是不同的,所有在不同环节就有不同的特征画像。

贷前有识别信用风险和反欺诈的特征画像,并且我们会根据金融产品的整个流程当中的获取的信息来去不断地在丰富特征画像。贷中更多的是用户与金融公司交互的过程中产生数据为基础,进行特征画像的刻画,包括贷中的行为特征以及贷后的催收过程。

所以通过不同环节的画像建构以及不同主体的画像构建,就能够搭建起一套完整的画像体系,然后配合算法的应用体系,则自动化智能风控基本上就有一个比较好的雏形了。

--

04 行业图谱的风控应用

在商用车金融行业中,有一类数据是难以捕捉到的——关联关系,即涉及到人、项目、车相应的公司。传统的特征挖掘方法难以识别关联关系,所以基于不同的关系数据,我们构建了图谱,基于图谱来做风控的应用。

1. 图谱介绍

首先,什么是图谱?简单来说——由一组节点和边构成的关系网络。节点和边都可以有不同属性,比如打上不同标签的节点,就代表不同身份的对象。

如下图所示的例子,左侧的这个例子是只包含一种类型的节点和边的网络图,比如节点代表人,边就代表人与人之间的关系;中间是相对复杂一点的图,它的节点是不同的,比如该场景中有人的节点,也有公司的节点;右侧的图展现了节点相应的属性,代表了节点所对应对象的特征。

在实际业务当中,对象关系会变得非常复杂,所以我们通常会借助图数据库和图算法来对数据进行处理。

2. 图谱搭建

下图是在业务场景中比较典型的图谱网络:承租人与两个公司具有员工关系,同时承租人在我司有一个项目,所以他跟项目节点存在一个客户关系。该项目中涉及到一台车,这台车是某一个车商卖给该承租人的,并且该车又挂靠到某一个挂靠公司,而这个挂靠公司又与其他几个公司存在关联的关系。

可以看到,这个简单的关系网络图囊括了业务环节中各个不同的主体,由此我们就可以通过图去构建一个识别风险的网络。比如,我们发现与某一个挂靠公司相关联的项目风险比较高,那么该挂靠公司新增的其他项目,就会被纳入到我司的风险监控名单,让其无法轻易通过我司的风险审核。

3. 图谱应用

① 基于图谱进行特征和规则挖掘

图谱的一个典型应用方式是通过图谱进行特征和规则的挖掘。下图左侧是基于不同主体构建的关联网络图谱。通过这个图谱,我们就可以提取到一些欺诈的规则,比如某一个节点是不是属于某个高风险的聚类,再比如某个节点的二度关系当中的逾期项目比例是多少,如果比较高,我们可以从中提取出一个欺诈规则,当然还可以挖掘出这些风险的特征。

比如,二度关联公司的借款次数是多少,二度关联项目的平均借款额度是多少,二度关系人的平均多头数目是多少,某些节点的pagerank值是多少,这些量化数据都是对这个节点的描述,可以作为模型的特征输入,甚至作为规则的特征输入。

右侧是一个典型的例子,是基于图谱定的规则,比如它的一度联系人或者二度联系人的逾期率大于某个阈值后,就可以把它定义成一个规则。这个例子当中,命中这个规则的比例是1.5%,但是命中的坏客数比平均的坏客数高17.5倍。

② 基于图谱的社区挖掘和动态风险识别

除了进行规则和特征挖掘之外,还可以对图谱进行深度挖掘如基于社区的挖掘或者基于动态的挖掘,并对图谱中的关系进行动态的监控,一旦发现关系发生变化,我们就可以通过贷中的分析师分析其中的风险点,查验是否存在风险。如果有风险,可以及时实施贷中的额度管控,或者新增项目管控进行风险管控。

③ 基于图谱的风险传导监控

当然还可以基于图谱进行风险的传导监控,比如在业务当中,从货源承运人到司机,整个链条是关联起来的,一旦在货源端某个公司出现了较大的逾期风险,我们就很容易通过图谱去找到相应的司机,对司机的风险进行提前的介入关注。

4. 图谱应用方法汇总

图谱的应用有很多方法,比如统计方法、传统算法、图的表示算法等,可见下图分类:

5. 搭建图谱应用架构

基于图可以搭建起一套完整的图谱的应用体系,底层数据囊括了贷前审批、催收以及三方数据,再用图关系储存各类数据,并利用图加工算法以及特征加工方法处理各类数据,最后搭建成一个完整的体系。

以上就是今天分享的内容,如果有兴趣的话,欢迎与我们继续交流。

今天的分享就到这里,谢谢大家。

阅读更多技术干货文章,请关注微信公众号“DataFunTalk”。

分享嘉宾:

活动推荐:

DataFunSummit2022:多维分析架构峰会

时间:6月11日地点:DataFunTalk公众号直播间报名:点击添加小助手,免费观看直播

诚邀各位粉丝朋友们参加本次直播峰会!峰会结束后我们会在公众号【DataFun】更新所有讲师的PPT资料,届时可回复关键字【20220611】免费下载!

以下是本次【多维分析架构峰会整体】信息:

关于我们:

DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章700+,百万+阅读,14万+精准粉丝。

欢迎转载分享评论,转载请私信。


以上就是关于《狮桥蒋宏:基于图谱的物流和商用车金融风控实践》的全部内容,本文网址:https://www.7ca.cn/baike/50018.shtml,如对您有帮助可以分享给好友,谢谢。
标签:
声明

排行榜