查看原文
其他

指标的悖论

法嘉LAWPLUS 2022-04-11

The following article is from 坚持装深刻 Author 周伯通


2020/5/1

我们无时无刻不生活在指标之中。国力强不强看看GDP,学校好不好看看排名,企业好不好看利润,员工业绩高不高看KPI。指标系统真是人类的伟大发明!它简洁明了,客观公正,目标导向。然而,真是这样吗?


根据2019年最高人民法院的工作报告,2018年各级法院共宣判无罪819人,无罪判决率仅为万分之五点七,由检察院提起的公诉案件的无罪判决率更低,仅为万分之三。而在2001年,全国法院无罪判决人数达到6597人,无罪判决率为万分之八十八。同口径美国法院的无罪判决率高达25%。



在国内做过刑事案件的律师都知道要做无罪辩护非常困难。无罪判决率是考核检察院工作的重要指标,一旦法院做出无罪判决,公安、检察机关都要承担国家赔偿责任,检察官也会受到“错案责任追究”。所以,即使法院秉持疑案从无的理念,但想到日夜打交道的检察官兄弟的绩效,也只能在量刑上从轻,而轻易不愿意判无罪。 


这可不是中国独有的现象。万维钢讲过这样一个podcast上爆料例子,说纽约警长们会使用各种办法,人为地减小自己辖区的犯罪率。一个常见做法,是把案件给“降级(downgrade)”。辖区里发生了针对妓女的强奸案,警长反复询问这位女性案发的各种细节。然后从受害女性供词中挑了几个“漏洞”,把案件定性为“服务偷盗”,也就是接受了别人的服务没给钱的意思。重罪一下子变成了轻罪,本辖区犯罪率就不会受影响,警长的考核指标就不会变难看。 


这是圈内人都知道的潜规则。一年结束统计数据,错案率或者重罪率明显下降。下一级的司法机关把数字报给上一级司法机关再报给市长,大家都政绩斐然。即使新换上来的领导,也只能按照既定规则行事,睁一只眼闭一只眼,继续美化数据。 


这不是偶然现象。对官员的考核主要看GDP,东北和山东的GDP都被爆出造假。所以总理提出“克强指数”,用铁路货运量、用电量和银行已放贷款量三项指标衡量经济,被广泛赞誉,认为这个指数很难造假。其实并不是很难造假,而是克强指数目前在大多数情况下只是一项参考指标,官员造假动力不足。



一旦成为考核指标,照样有造假的。中国正在积极推进企业的复工复产。因担心企业会配合当地政府说谎,中央检查组以街道用电量来考核复工率。财新网引述浙江省杭州市某街道办事处工作人员称,因为指标变了,部分工业企业有被复工现象,被要求通过开空调、电脑等方式营造企业的用电量数据,以达到当地的复工目标。 


经济学界早已有了一条著名的古德哈特定律(Goodhart'slaw)来说明这个现象:当一个措施本身成为目标时,它就不再是一个好的措施——这是经济学界的测不准原理。 


就是这位老爷子


宏观管理情况复杂,但在微观经济也存在这种为了完成指标而忘记初心和使命的现象。上周我给手机换电池,换完电池小哥让我在朋友圈转发好评截图他好拿奖金,看我面露难色,他说这条好评在你的朋友圈不会存在超过三秒钟,然后他三下五除二帮我操作完毕并删除,的确不超过三秒。 


有的网站追求网页的打开率,那编辑就会用那些耸人听闻的标题,结果文不对题,用户满意度下降了;有的投资人追求互联网公司GMV指标,就会有O2O疯狂的补贴大战;有的公司把销售收入放在首位,经理人就有动力去做皮包生意,不赚钱还加大了资金风险;还有的公司利润为王,以此发放奖金,那经理人不管客户质量、收款风险,先卖出去再说…… 


日常生活中也会碰到指标的悖论。监督小孩学习,如果定的是时间指标,比如说连续学习一个小时后可以去玩,那一个小时他兴高采烈地玩去了,你悄悄翻开他的作业,会发现这一个小时内的几乎没有什么进度;如果定的是计件指标,比如昨晚数学作业再去玩,那他会飞快地完成,但第二天订正所需要花费的时间更多!你以为他一直在进步,可是他就是原地打转! 



古德哈特定律也普遍存在于用单一指标的排名系统。怎样评价一所美国大学的好坏?看排行榜。其中,最最受关注的是一家来自没有任何政府背景的US News机构的的排名,这份排名成为组织和支配大学竞争的指引机制。不光学生这么干,政府也这么干。考什么学校、什么专业?看看这份排名;大学校长和老师发多少奖金?看看这份排名;科研项目拿多少经费?看看这份排名。 


一份非官方的排名能决定很多资源的流向,必然就有人去琢磨。最著名的例子便是东北大学(Northeastern University),该校在1996排名162位,当时新上任的校长认为排名靠前对学校益处多多,然后开始琢磨怎样迎合榜单后的数据算法,然后通过降低师生比、提高国际生比例用、等多种有效举措提升排名。2020年最新的榜单,东北大学排名第40位。 


学生对国内的大学评价相对公开透明,每所高校、每个院系都有最低分数线,评价建立在过往学生用分数投票的基础上的。但学校的经费资源却和学校能不能进985、211、双一流名单强相关。 


怎么在短时间内针对中国的排名算法提高排名?合并!2000年前后,中国高校掀起了一股合并热,如吉林大学、郑州大学、四川大学、浙江大学、山东大学、武汉大学、华中科技大学、中南大学等,经常是五六个学校并在一起成为一个巨无霸。又如西北农林科技大学是由几家名不见经传的学校并起来,一举成为985的。合并之后,可以迅速提升师生规模,最要紧的是提高了学校的综合能力。单一学科在短期内很难高产高质量的学术文章,但合并之后总是能东方不亮西方亮,保持稳定的产出。 


而且,我们看到合并的院校里,总会有医科学院,北京的协和、北医分别并入清华、北大,上海的一医、二医分别并入了复旦和交大,最不济的同济还合并了带着铁道医学院的铁道大学。为啥医学院是香饽饽?因为医学的学术论文最容易发表,医生把临床研究总结一下就是一篇论文。一般院系也就是硕士博士有发表任务,而医学院附属医院的医生的晋升与发表文章强相关,所以医学院最高产,合并医学院最容易提高排名!

 

更有甚者,很多情况制定指标的结果不是测不准,而且实际起到了反作用。这就是古德哈特定律的升级版——眼镜蛇效应。 



在英国殖民印度时期,眼镜蛇大量繁殖于德里城区。英国人决定悬赏捕杀眼镜蛇。政策效果很明显,一开始眼镜蛇数量开始减少。人们越来越难以通过捕杀眼镜蛇领到赏金了,但丰厚的赏金实在太诱人,于是人们开始在自己的家里繁育眼镜蛇,然后再通过杀死这些“家蛇”来获取赏金。英国人一看自己被糊弄了,赶紧取消了政策。那养殖的眼镜蛇怎么办呢?印度人把它们直接放生了。这就是著名的眼镜蛇效应,制定了一个指标,最后结果却适得其反。 


另一个经典案例发生在德国。德国政府为了避免官僚主义和低效率,将大量福利救助工作外包给私营机构,福利按照人数发放。而私营机构为了自身经济利益的最大化,甚至通过鼓动人们主动放弃工作,来培育自己的顾客。救助产业于是就像滚雪球般不断变大,最终成为德国最大的产业——从业人员 200 万。而一个名叫明爱会的天主教救助组织成了德国最大的组织,比我们熟悉的大众、宝马等公司大多了,旗下雇员总数超过 50 万人。一旦形成这个规模,那就尾大不掉了。德国政府背上了更严重的财政负担,而且失业率也反而被抬高了。 


还有一个经常发生的指标起反作用的情况。公司股东以绩效考核管理层,如果今年业绩特别好超过了预算,管理层的最优选择是通过延迟订单、提取额外的风险准备金等方式转移业绩。因为管理层知道今年的业绩如果都入账,就是明年的评价基准。所以,管理层有意降低绩效,以降低股东的预期是最理性的选择。



怎样破除指标的悖论? 


首先,要端正心态。世界是一个复杂系统,其复杂度难以把握,可人们希望用最简单的逻辑衡量得失——指标应运而生。我们不可能脱离指标,但要相信没有一招鲜的指标,只能做到小心翼翼地用指标来评价,不断通过反馈修正指标。 


其次,用市场能解决的别靠指标。一家上市公司做得怎样,不用看它的规模、利润、收入等指标,只要信息披露充分,只要看市值就够了。当然你可以说市值也是一个指标,但这个指标是市场评价出来的。还有个朋友告诉我,他从不给属下的员工打分,而是让比较熟悉的员工之间互相匿名评分,评出来的结果更能服众——这也算是用市场解决指标悖论的一个思路。 


再次,在没有市场的地方,指标是多维度的,要有系统思维。现在的有些企业家,特别愿意说这样的话,他对采购员说:“我不管别的,只看降本率!”对销售员说:“我不管别的,只看销售业绩!”对质量员说:“我不管别的,只看退货率!”对财务说:“我不管别的,只看利润!”殊不知,对于一个系统,这些指标互相之间存在竞争关系。采购的原材料便宜了,质量就没法保证,销售员采取薄利多销政策,利润就会降低。要把一个组织捏合在一起,指标之间不能打架。因此,以企业实现战略目标为目的OKR或者平衡记分卡的系统的效果优于简单业绩指标KPI的管理方法,指标也要根据时期运营情况不断动态调整。 


还有,要承认有指标无法衡量的因素。著名的管理大师、英特尔公司的前任 CEO 安迪·格鲁夫,对于企业的评价就搞过一个“双轨制”:一方面看数据指标,另一方面是让管理人员亲自下去考察。瑞幸造假被浑水曝光,那也是在门店观察观察,感觉something is wrong。现在做PE投资的衡量一个公司的好坏除了看指标,必须到现场走一走,找公司的关键人聊一聊。公司氛围如何,员工士气怎样,管理层是否团结,老板是否可靠,这些因素无法用量化指标衡量,而一个经验丰富的人的直觉却能一眼看出来。 


总之,尽信指标不如无指标。但无指标又怎么管理?世界就是那么的复杂而充满悖论,这也是它有趣之处,值得我们专门来一趟。



作者介绍

周伯通,国内A股市场最大的汽车上市公司的总法。在日常繁忙的工作之余,他会坚持写一些“装作”深刻的东西,他说,装着装着,就说不定真的深刻了。他的目标是成为一个 “有好看皮囊的有趣灵魂”。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存