量化反腐研究的一项新成果 作者:Benren2 瞎掰 20180214
最近两天,本人利用业余时间,进行腐败证据量化统计建模,获得了一项新的反腐败科研成果。特此首发简介。 本研究主要利用中纪委公布的腐败官员证据,细加整理量化,并充分利用最新公布的资料,进行建模和模型优化。比如下面两个新案例,就使模型的预测精度提高了62.95%. 案例 1: 新华社2018年2月13日报道,十八届中央政治局委员孙政才涉嫌受贿案已侦查终结,交天津市第一中级法院起诉。检察院起诉指控,孙政才在整个仕途中都在不间断受贿。《重庆日报》同日披露,孙政才"十个必须条条触犯,七个有之样样皆占”。 案例 2: 同日,中纪委监察部网站宣布,原中宣部副部长、原中央网信办主任鲁炜被双开。中纪委监察部的公告称,鲁炜身为高级干部, “四个意识 ”个个皆无, “六大纪律” 项项违反。 上述两例显示,中纪委查处腐败分子的科学手段已经上了一个大台阶,开始量化了。任何社会问题,如果能够量化,建立统计模式,从根本上精准解决该问题,就是指日可待了。清除腐败官员,防止带病提拔,最经济有效的办法是早期识别,比如在提拔重用之前把他们筛选出来、清理出去 。 详细地讲,此项科研就是本人结合此前公布的省、部、军级以上官员腐败查处大数据,利用统计学中的Discriminant Analysis建模, 得出了早期识别腐败官员的算法。本人在此郑重提供国内有关部门参考,也算是没有辜负祖国养育之恩。 下面是本人的研究成果,精华部分就是一条公式,简单易用,一个手机计算器就能搞倒腐败分子。
腐败概率 = 0.18 × 十个必须触犯% + 0.17 × 七个有之% + 0.15 × 四个意识缺失% + 0.14 × 六大纪律违反% + 0.13 × 金钱欲望指数 + 0.12 × 性欲指数 + 0.11
这条公式是通过把中纪委公布的证据量化后作为训练样本,经由大型机高速运算而来。更重要的是,本人又把同批数据当作待测数值,代入公式验证,得出了99.8%的命中率。也就是说,当计算出来的腐败概率超过60%,随机查处一万人,最多冤枉两个。利用上面公式计算,孙、鲁两人的腐败概率分别是99.999%和99.998%,统计证据铁板钉钉,直接打脸企图替这两人喊冤的海外别有用心之人。 不在官场的一般平民对什么是十个必须、七个有之、四个意识和六大纪律可能一头雾水,根据公式,他们在这四项的得分可能是零,因此36%是普通人正常赚钱欲望和性欲这两项,代入公式计算,最高能达到的腐败分数。就算是六根清净的出家人,也有基础腐败分数11%,正应了人生来就带着原罪的说法。这也在统计学上说明了,世界上不存在绝对纯净不腐败的人。挑选廉洁官员有多难,由此可见一斑。 Discriminant Analysis建模的第一个大优点是能够提取出主因子,排除无关或弱因子,简化数据项目收集。本模型就剔除了撒谎指数(狡辩也没有用了!)、职业(不要告诉我有什么高危职业!)、性别(男女一视同仁!)、年龄、颜值、肥胖指数、个子高矮、主食偏好、烟酒消费量、手机使用率、民族、地域、学历等等124项次要和无关因素,因为它们对最终腐败概率计算的影响微小或者为零,有的甚至干扰、降低了预测精确度(比如学历)。根据本精准模型,现在查处新腐败案件,只需关注上面公式中提到的6个最重要指标,大量节省调查取证的人力、物力和时间。 Discriminant Analysis建模的第二个大优点是预测精度能够自我进化提高,具有机器学习的强大能力,只需经过几轮优化,就能获得惊人的预测正确率。具体而言,就是把新的查处数据不断添加到训练样本,程序自动重新计算并优化公式(主要是权重系数调整)。 祖国人民反腐倡廉不停不歇,充分体现了祖国人民与腐败分子斗争到底的坚强决心。本人乐意提供更多的统计分析支持,报效祖国。
|