评分模型的演进：阶段2-数据检查和项目参数（2）

选自《credit risk scorecards》第四章，翻译：吴国平

细分

在某些情况下，相对于一种记分卡应用于所有人，使用多种记分卡组合能够更好地提供风险区分作用。这种情况通常是，人口由差异的亚群组成，一种记分卡并不有效地适用所有人（如我们假设不同的特征要能揭示不同亚群的风险）。识别这些亚群的过程就叫做细分。有两种主要方式能使用于细分：

1.基于经验和行业知识形成细分思想，然后通过分析来验证这些思想

2.通过统计方法形成独特的单元，如集群和决策树

任何情况下，任何被选细分的样本量都应该足够大，使得为单独记分卡发展而做的抽样有意义。表示不同风险表现的细分能够通过不同的标准和战略需要而被区别开来，除了没有足够样本量的情况外。

在风险记分卡的发展中应该指出，一个“差异的”人口的认定不仅仅依赖于定义的特征（如人口统计），也取决于它的行为。目的就是定义基于风险行为的细分，而不是仅仅风险的简单描述。

探测不同行为并不是细分的充分条件。这些差异需转化成在商业上可量化的结果（如更低的损失，更高的等级）。有关怎样量化的例子在本章的“比较性改善”中介绍。

不论细分是通过经验方法还是统计方法而得到的，思想上都要有长远的计划。许多分析和经验都是基于过去的，但记分卡需要在未来被运用于未来申请人的细分。有一个办法能够达到这个目的，如根据系统性关注的目标市场来调整细分。传统上，细分是为了找出一个设定细分的{zy}解，这暗示着要找到一个组织所要求{zy}表现的细分，如目标市场。这个步骤强调达到{zy}表现的重要性，这从商业角度来看是最需要的；同时，这个步骤也确保记分卡发展过程{zd0}化其商业价值。这是一个市场营销人员能够增加价值和有关记分卡发展项目的领域。

新巴塞尔协议采取注重实效的观点，把细分定义为“同质风险池”，允许世界各地的个人银行拥有确定各自细分的选择权，并没有做出硬性的规定。

基于经验（启发式）的细分

基于经验的细分的思想来自于商业知识、经验、运营策略、行业实践。这些来源的例子有：

l???????? 营销/风险管理部门探测特定细分市场中不同申请者的概况

l???????? 相同记分卡组合虽时点相同，但部分表现出明显不同的行为（如较高的不良率）

l???????? 发展新的次要产品

l???????? 需要友善地对待事先定义的组群（如黄金客户）

l???????? 未来营销的发展方向

典型的细分在行业中的运用基于以下内容：

l???????? 基础信息。区域（省份/国家，内部定义，城市/农村，邮政代码，邻居），年龄，生活方式代码，工作年限，在银行任职

l???????? 产品类型。黄金/白金卡，按揭的期限，保险类型，担保/无担保，新车租赁/旧车租赁，xx规模

l???????? 业务来源（渠道）。柜台，传单，网点，互联网，经销商，中间人

l???????? 可用数据。薄/厚（薄的字段表示目前没有交易），在工作方面的清白/不良记录（不良记录表示存在一些负面表现），循环产品的转换方/交易方，SMS/语音用户

l???????? 申请人类别。现有/新客户，首次置业/改善按揭，专业人士交易组别（如工程师，医生等）

l???????? 产品归属。按揭持有人在同一银行申请信用卡。

细分的思想一旦形成，就需要开展更深入的研究，原因有两个。首先，这些思想需要至少与一些经验迹象相符，使得具有一定水平的说服力。第二，研究有助于更好地定义细分（如薄/厚字段，邮政代码组别，年轻/年老），这通过建议合适的区分点（如它们能够被用来问“什么是薄字段”或“什么是一个年轻的申请者”）来实现。

有一个简单的方法能够认可细分思想和建立细分的必要性，即分析事先定义的不同细分中是否具有相同特征的风险行为。如果单个细分中的相同特征（如“租赁人”）明显有别于其他细分，这或许能作为细分记分卡的一个例子。然而，如果特征在不同的细分中代表相同的风险，则不需要额外的记分卡，因为这没有区别。

图表4.8反映了有关住房状态和信贷交易次数的实测不良率，以30岁为界分类。未分类的实测不良率也列在表格的最右边。

图表4.8? 基于年龄划分的不良率

在这个例子中，租房和与父母同住的不良率，大于 30岁和小于30岁的都是不同的。这个相同的信息（如属性为“租房”和“与父母同住”）说明了年轻和年老的申请者具有明显的差异。这说明以年龄为依据的细分是一个好的主意。请注意，如果一个记分卡被运用，例子中的所有租房者将得到相同的分数。但通过细分，30岁以上和以下的租房者将获得不同的分数，以此有助于更好的风险排列。

申请者为“0次”和“4次以上”交易的也符合这一现象，即相同信息揭示着30岁以上和以下具有明显的差异。这些例子都是来自北美的数据，且具有解释性。超过30岁且依然与父母同住的人趋于更高的风险，超过30岁且没有信贷交易的人（如他们持有没有被记录的信贷产品）也是如此。越年轻的人越有可能被认可，但在北美，30岁被认为拥有（事实也证明如此）多个信贷产品满意的偿债表现，所以，在这个年龄而交易空白被认为是高风险。

另一个认可原始细分思想和确定单个细分的方法是，观察不同被选人口亚群的实测不良率。这个方法包括分析在所选特征中不同属性的不良率，然后根据显著不同的表现确定恰当的细分。

图表4.9给出了此分析的一个例子。此表表现为依据年龄、业务来源和申请者类型细分的典型例子。在“年龄”例子中，可以很清晰在看到，“小于30岁”的表现显著差于其他两个大于30岁的细分。在这个例子中，依据“大于30岁”/“小于30岁”来划分将显得有意义。假如有必要产生较两个更多的细分，更多有关年龄的更好定义组别也可以替代例子中的大体定义组别。

图表4.9? 事先定义细分的不良率

在“业务来源”例子中，四个属性都有不同的不良率，或许因此划分单个细分。然而，“网络”来源的情况可能出现在早期阶段，且此渠道占总组合非常小的比例。在这个例子中，将“网络”和“电话”细分合并，并在网络业务汇聚足够的数量来调整分类的时候才重新分类记分卡，这将显得有意义。当这个分析方法被运用于解释细分时，也能每季度依此来辨认关注犯罪的潜在领域。

以上所述的方法操作起来相当简单，也能提供一些依据经验和恰当的直觉选取细分的帮助措施。它们也有助于选择正确的细分点，如图表4.8所示的年龄——作为细分基础的特征。

基于统计的细分

1.集群? 集群是一个广泛用于辨认输入变量彼此相似的组别的技术。集群能被用于细分数据库，添加样本，或是就数据所建议的“群体”。同个群体中的样本在某种意义上倾向于同质，不同群体中的样本倾向于异质。用来形成集群的两个方法是K-均值（K-means）集群法、自组织映射（SOMs）。

集群能够在欧氏距离的基础上运用，以及被用来计算一个或多个量化的变量。观测值被分离为集群，以达到每个观测值最多属于一个集群。

SOM是受被映射到大脑里的人体感官印象变量的启发，这样，输入刺激物之间的空间关系相当于神经元之间的空间关系（如集群）。

图表4.10说明基于两个变量的集群。它显示数据点形成三种不同的集群，或组别。另外，有一个异常出现在右下角的角落。

图表4.10? 集群

图表4.11列举使用这种技术输出一个集群的例子，Y轴表示正常化的意思。

图表4.11? 集群的细节

这个集群显示以下特征：

l???????? 低于平均年龄

l???????? 高于过去六个月的平均查询

l???????? 倾向于居住在区域A

l???????? 区域B没有居民

l???????? 不太可能拥有自己的住宅

l???????? 在过去六个月里更有可能有拖欠

其他集群能够通过使用相同的图表来分析它们的定义特征。包括每个集群内的分布特点在内的深入分析也可以进行，以获得定义每个{wy}组别的一组规则。如图表4.11的例子，集群能够被定义为：

l???????? 年轻业主在区域A

l???????? 年轻房客在区域A

l???????? 年老业主在区域A

l???????? 年老房客在区域A

另外，集群可以基于其他任何特征，此特征提供了各个集群间{zh0}区分。

值得注意的是，集群定义具有类似特征（不是表现）的组别。那么，集群可能看起来是不同的，但也可能拥有类似的风险表现。所以，应该更深入地分析集群，例如通过不良率分析，以确保产生的细分是具有不同风险表现的组别。

2.决策树?? 另一项用来统计分类的技术是决策树的使用。决策树依据性能标准分离细分（如区分“好”和“坏”）。它们也容易理解和解释。辨认细分特征外，决策树也辨认每个特征的{zj0}分裂点——因此，决策树作为有效的和实用的细分方法。图表4.12中的例子显示基于两个层面的细分。

结果表明这个组合有四个可能细分，这是基于现有/新客户、保有期的长度和年龄来分。

图表4.12? 使用决策树的细分

比较性改善

基于经验和统计的分析方法都将产生潜在细分的思想，且可以证实有充分的理由细分——但它们没有量化细分的好处。有十分简单的方法可评估细分后的改善是否值得追求。

{dy}步是通过细分来测量改善的预测能力。这能通过使用大量的统计来完成，如柯尔莫诺夫-斯米尔诺夫（KS）、C—统计（c-statistic）等等。图表4.13列出一个使用C统计的分析例子（C统计的细节在后面的章节说明，第六章）。

图表4.13? 通过细分的比较性改善

这个图表显示一个未细分的记分卡和以各种方式细分的六个记分卡的C—统计量计算。“总的C统计值”指未细分记分卡基础上分类的C统计值。“细分的C统计值”指使用专门为细分而建立的记分卡下分类的C统计值。在这些例子中，使用细分记分卡较使用整体记分卡获得更好的预测能力。白金/黄金卡的细分不能获得显著的改善——或许是因为授信方在它的历史黄金和白金卡客户之间未足够区分。{zh0}的细分可能看起来是依据保有期的分类，这可能是因为使用现有的客户能获得更有效的表现数据。这种分析是基于单个层面上细分；使用者需要决定哪个改善程度是足够显著的，据此保证额外的开发和实施努力。

通过业务（非统计或措施），这个问题能得到{zh0}的回答。业务不会{zd0}限度化C统计值或KS值——它们依据如批准率、利润、损失率等业绩指标来运作。因此，这将有助于改善的预测能力转化为预期的组合表现，就如图表4.14所示的例子。

图表4.14? 衡量细分的商业利益

图表比较两个共同的业绩衡量，即每个细分记分卡的批准率和预期不良率。图表也列出每个细分的大致大小。使用这样的模板，决策者能够决定细分大小和业绩改善之间的联合是否充分解释额外记分卡的执行情况。批准率和不良率应该是根据一些预期业绩数字来作比较；例如，假设未来需要的批准率为70%，那么不良率值应该是在这个数字的基础上形成。在先前的例子中，依据保有期作出的细分提供了改善，小于2年的细分不良率由5.7%下降到4.2%，大于2年的细分不良率由2.9%下降到2.1%。通过这些改善，一些减少损失（以美元标记）的想法可以被估算。

选择细分

但是，为什么还有人不实施所有记分卡的建立，哪怕是预测能力或业绩有小幅的改善？

记分卡的实施要考虑许多事实，包括如下：

l???????? 开发的成本。这包括涉及国内外开发记分卡的全部文献的努力

l???????? 实施的成本。系统资源实施记分卡的额外成本，特别是非标准化的情况，或者需要编写复杂的代码。

l???????? 流程。有额外的流程成本与更多的记分卡相联系。

l???????? 开发和监测的战略。每个记分卡需要有相关的战略、政策规定和监测报告。创建、管理和维护它们所需的资源，在很多记分卡被开发和使用的情况下，可能需要招聘。

在较大组合的例子中，相对于现有资源和储蓄，这些成本和努力可能是微不足道的。然而，在较小的组合和组织中，这些分析可能视业绩的改善是否足够明显而定，以致保证额外的努力、复杂性和所需的成本。

方法化

有多种数学方法能够建立风险揭示记分卡——如logistic回归、神经网络、决策树等等。最适当的方法取决于以下的问题：

l???????? 现有数据的质量。决策树可能更适合有显著遗漏数据或特征和目标之间关系为非线性的例子。

l???????? 目标结果的类型，即二进制的（好/坏）或持续性的（以美元标记的利润/亏损）。

l???????? 可获样本的大小。

l???????? 实现平台（如应用系统能否执行特定类型的记分卡）。如神经网络模型可能是思想上的，而非实用的，假设应用系统无法实现它。

l???????? 结果的可解释性，如记分卡能够获得回归点的基础上的利率下降。

l???????? 方法的合规性，通常为当地监管部门所要求的透明性和可理解性。

l???????? 跟踪和诊断记分卡绩效的能力。

在此点上，记分卡的缩放比例和结构也能够被讨论（如潜在记分卡的范围，点的两重可能性，假设记分卡本身代表预期不良率，等等）。记分卡的技术和格式化文件应该被风险经理和IT经理相沟通，以保证数据和划分技术的理论问题是被理解的——这样，记分卡发展任务的结果将能够被正确理解，记分卡开发完毕后也能被实施。

执行计划的回顾

这一阶段所获得的额外信息可能需要改变最初的执行计划和项目进度。尤其，假如细分分析后较预期需要明显增加记分卡的数量，被建议的方法论需要更多的消化时间或改变实现平台，或所需的数据被扩大，项目将需要更多的时间。为保证真实的期望，测试和执行计划在此刻需要被回顾。对于在不同领域有开发、测试、执行和跟踪记分卡责任的公司来说，这是至关重要的。项目经理要确保变化是被理解的，以及它们对最初项目计划的冲击可量化，据此，项目的每个阶段通向无缝联接。

在此阶段的{zh1}，所需的所有数据和项目计划文件要完整，以及有关数据库建设的工作能够开始。

当前位置: > > 文章正文

欢迎您发表评论：