设万维读者为首页 万维读者网 -- 全球华人的精神家园 广告服务 联系我们 关于万维
 
首  页 新  闻 视  频 博  客 论  坛 分类广告 购  物
搜索>> 发表日志 控制面板 个人相册 给我留言
帮助 退出
 
0+1  
有感而发, 可多可少  
网络日志正文
华尔街的数学(17) 橘子和苹果 2010-02-26 16:09:30

            写了这么多篇,可以吸引点眼球的题目都已经用完了,这篇也是讲比较,取名就偷点懒了。上一篇比较两个大小不一样,基本特征分布不一样的样本空间,但两个都认为是大样本,A的总人口能放大就是基于这一点,将B的总人口按比例缩小也是一样的。这次我们需要将一个小样本与大样本比较。

 

        我们要研究一个局部地区的死亡率并建立模型,白手起家比较辛苦,所以想和一个大样本加以比较。一般来说,这个地区和别人总是不太一样,否则就没有必要单独研究了。因为和别人不一样,所以特征分布会相当不同,就是说不能直接比较。如果我们硬套上一篇比较两个大样本的方法,裁剪下来,大样本可能没什么,但小样本是放大过得的,绝对人口会所剩无几。这个大样本一般非常大,比如是整个国家,我们完全可以假定不管人口加倍还是减半,都不会影响其总体死亡率。而这个小样本又是如此之小,所以我们要尽量保留,别说20%,我们连5%,甚至1%都不想损失。一般来说,小样本的人口增减会对它的统计性质产生影响,象死亡率这种小概率事件,小样本测量值往往会偏低。

 

            在我们公司的实际情况,大样本可以是好几百万的所谓标准房贷,而小样本一般是数量为几万或十几万的新产品。对于大样本,不说了如指掌,但至少是相当熟悉。因为小样本是新产品,大家对模型根本没有底,只好参考标准房贷的老模型,但要参考就要对两者行为都有所了解。如果只是定量差别,我们往往使用同一模型,只是把模型系数修改一下。如果有定性差别,那就要另起炉灶,但两者的差别对新模型也会有很大帮助。现在问题就是怎么比较,不严格的比较很可能会误导你,比如《第三者的模型》中的房贷金额因素。

 

            现在回到人口模型,比较两个人口数量相差悬殊的样本的死亡率。上面说过,这个“大”样本非常大。我们可以进一步假定,其实是必须假定,不但整个样本人口按比例改变不会改变行为,连其中的每个组都如此之大,按比例改变人口也不会改变这个组的行为。这就暗示我们把大样本各组人口比例裁剪的和小样本一模一样, “没有条件创造条件也要比”。即使小样本只有一个人,我们也把大样本相应的组按比例保留下来。经过这番裁剪,我们可以把苹果和苹果相比了。你如果喜欢橘子,说橘子比橘子也无所谓。

 

            在很多情况下,小样本本身很自然地是大样本的一部分,这时候你必须把小样本本身刨去。自己和自己比差别当然是0,但这个0和其他的0是不一样的。一般来说,大样本在每个组的人口都是很多,但偶尔也会有几个组,大样本人口很少,在实际操作时,我们还是照样保留裁剪,这就是在学校和在公司搞研究的差别。食品和药物人命关天,这样做可能食品药物管理局(FDA)那儿过不了关。对于房贷研究,我们不必担心这么多,更何况平均是带权重的,这些组的影响一定非常小。一旦大样本相应人口为0,我们还是只好割爱,造一个数据毕竟还是不允许的。一般来说,这样裁剪之后,“割爱”的百分比不会超过1%。如此比较之后,如果两者还有统计意义上的差别,那就是说,两个样本确实不一样。

 

            对于房贷的Prepayment来说,我么可以采取更简洁的分组方法。这Prepayment,最重要的因素是(房贷)年龄和利率,第10张支票就表示房贷年龄是10个月。我们先讨论分组的一般原则。组分的越细,比较就越是准确,但是数据就很容易变得支离破碎,这样会带来两方面的问题。一是每组人口太少,会影响统计可靠性。第二是分的很细以后,割爱的百分比可能会增加。所以这这如何分组,完全凭经验,根据数据的具体情况,以及研究目的来决定。对于以年龄分组的,一般以季度为单位,对于一些极特殊的房贷产品,比如商业房贷,以年为单位也是有的。行内人士一致认为,正负差一个月对研究Prepayment不会有本质影响。但如果分组的目的是大小样本间的比较,以月为单位会带来意想不到的好处。房贷利率在一个月内的变化一般不会很大,所以或许就根本不用分组了。问题是大小样本的的中位数或平均值一般是不一样的。根据经验,利率差别在正负0.25%以内,房贷的行为不会有显著差别。现在假定小样本平均值是6%,大样本是5.5%。因为大样本是如此之大,我们只要把大样本在6±0.25%区间内的房贷和小样本比就可以了。或许这只采用了40%的房贷,但由于是大样本,这已经是个很大的数字了。如此一来,尽管组分的不算很多,但对于这两个因素的比较却已经十分精确。如果两者存在差别,那就需要考察两个方面。首先,两个样本对于这两个最重要因素的依赖关系完全可能不一样,就象以前所说女的平均寿命就是比男的长。其次,其他因素可能有影响,比如信用评估,贷款房价比值,贷款数额等等。这种很严格的比较就能帮助你把这两个因素分离出来,否则的话,连这两个基本要素的分布都不一样,看出有差别你又能怎么样。一旦分离出来,这进一步的分析就需要很专门的知识和技术,已经远远超出本短文范围。

 

            16篇在网上贴出后,有读者问,研究死亡率用寿命表(Life Table)不就可以了吗,干吗这么麻烦比来比去的。首先,我的问题是从房贷中来的,这房贷牵涉到人类的行为,比死亡率要复杂的多。如《前言》中所说,人口模型和房贷高度类似,比较容易描写,而且不必涉及公司业务细节。所谓寿命表,只是一种平均,是保险公司的参照体系而已。寿命表只考虑了年龄一项因素(有时会男女分开列表),其他因素只考虑了平均效应,真正的保费需要在这基础上加加减减得出。加减多少,就是要通过种种比较,可能也包括这两篇所陈述的方法。假定文革后中国恢复人寿保险业务,但一开始百废待兴,并没有在所有地区同时开始。后来他们决定把业务扩展到青海,青海的人口死亡率很可能和其他地区不一样,你必须通过科学的比较才能知道有无差别,差别是多少,这基本上就是这一篇中大小样本的比较。假定又过了几年,他们又决定把业务扩展到西藏,他们可以把西藏的死亡率和已经有些经验的青海相比。人们因为有理由期望西藏青海的死亡率比较相像,所以西藏的保费在青海的基础上作微调就比较容易和准确,直接根据中国人口的“平均”寿命表作调整会比较不容易。青海和西藏比就类似于上一篇中的两个“大”样本比较。其中的青海在与中国“平均”寿命相比时是“小”样本,但和西藏相比时就成了 “大”样本。青海作为小样本时是全部保留,不做裁剪的。但和西藏相比时,就必须对两者同时进行裁剪,使他们同时成为苹果或橘子。

浏览(1726) (0) 评论(0)
发表评论
我的名片
0+1
注册日期: 2009-08-01
访问总量: 781,339 次
点击查看我的个人资料
Calendar
最新发布
· 你想不到的义工
· Made in China
· 活该!
· 古埃及 – 科学和伪科学之集大成
· 伪科学比没有科学更可怕
· 埃及导游贾宝玉
· 真真假假的阿部辛贝勒神庙
分类目录
【埃及-约旦】
· Made in China
· 古埃及 – 科学和伪科学之集大成
· 伪科学比没有科学更可怕
· 埃及导游贾宝玉
· 真真假假的阿部辛贝勒神庙
· 为什么阿斯旺的酒店都在尼罗河东
【美国政治】
· 活该!
· 都不是好东西!
· 大厦将倾,独木能支
· 封口费造假帐合算吗?
· Hogan 州长
· “好东西”?
· 另类的清廉
· 另类的贪腐
· 都不是好东西
【2024奥运】
· 妄议奥运(二)
· 妄议奥运(一)
· 她又来了!
· 小国的奥运金牌
· 这个冠军不孤独
· 既生瑜,何生亮
· 我看着他打破世界记录
· 祝贺美国终于“第一名”
· 二比二
· 全红婵和周洋
【难题】
· “难题”(3)-- 意外的惊喜(解答
· “难题”(3)-- 意外的惊喜
· “难题”(2) -- 鸡还是蛋 (解答
· “难题”(2)-- 鸡还是蛋
· “难题”(1)-- “简单”的极限题(
· “难题”(1)-- “简单”的极限题
【奇葩总统】
· 奇葩总统(1)- 股票总统
【最强大脑】
· 最强大脑 -- 色块迷踪(续)
· 最强大脑 -- 色块迷踪
· 最强大脑 -- 复活
· 最强大脑 -- 迷走点线
· 最强大脑 -- 珍稀足迹
· 最强大脑 -- 龟文古迹
· 最强大脑 -- 知己不知彼
· 最强大脑 -- 数字谜盘
· 最强大脑 -- 入场式
【书摘】
· 《华尔街数学》书摘 -- 暗示的力
· 《华尔街数学》书摘 -- 饮水不忘
· 《华尔街数学》书摘 -- 书缘
· 华尔街数学 -- 我的数学人生
【桥牌“外交”】
· 桥牌“外交”-- H先生
· 桥牌“外交”-- C先生
· 桥牌“外交”-- R先生
· 桥牌“外交”-- 引子
【脑筋不用急转弯 -- 续二】
· 24史
· 科学家的思考
· 朝四暮三
· 纸上谈兵?
· 为什么床铺死都不公布税表
· 质疑测量金字塔高度
· 如何用数学手段消除循环赛假球
· 如何尽快在大学新生中找出乙肝患
【我的大学 -- 续一】
· 太太太感谢您了!
· 饮水不忘掘井人
· 我的复旦梦
· 世界读书日
· 暗示的力量(2)
· 苏步青大师
· 久有凌云志,重翻几何书
· 人名不译
· 生成函数 -- 杀牛的鸡刀
· 欧拉定理的证明
【人间 -- 续二】
· 我自认为相当理智和客观
· 一叶知秋
· 锦上添花和雪中送炭
· 异曲同工(三则)
· 社区的地球日
· 淡泊天涯
· 源于生活,高于生活
· 得理不饶航空公司
· 我几乎撒谎 -- 与大家共勉
· "垃圾“市长
【脑筋不用急转弯 -- 续一】
· 从统计学看国人的冷漠
· 一波四折
· 考考大家的想象力 (附“答案”)
· 毒酒和老鼠 -- 据 KM 说是 GS 的
【往事越千年 -- 续一】
· 昆仑关大捷和《血染的风采》
· 歌剧演员和歌唱演员
· 我的超级记性
· We are doing the impossible
· 上海人的体育辉煌
· 大浪淘沙
· 我为革命下厨房
【Alaska 之旅】
· Alaska 之旅(3)--前人栽树,后
· Alaska 之旅(2)--一国两制害死
· Alaska 之旅(1)-- 终于露馅
【莫谈国是】
· 打死卞校长需要老毛圣旨吗?
· 蛮不讲理知“劲草”
· 重贴领导指示
· Hooter
· 我为“86万”叫好
· 领导指示。。。
· 重要的一年
· 随机抽查
· 三位知识分子的遗产
· 为公布100名红色通缉人员叫好
【(不是我的)童年 -- 续一】
· 小朋友的高见
· 这次不扣钱
· 女儿的“科研成果”
· 一家三口数学竞赛,我居然只拿了
· 活学活用
· Email from Santa
· “著名”泥塑艺术家
· 女儿的幽默
· 小狗不会告状
· 美国校车补遗
【脑筋不用急转弯】
· 气死数学家
· 好人坏人
· 抽水马桶史话 -- 山寨版
· 前几天,我打了一幅臭牌
· 911 能减少贸易赤字?
【人间 -- 续一】
· 桥牌中的运气(续)
· 向桃园机场致敬!
· 好记性不如烂笔头?
· 苦不能苦孩子,穷不能穷教育
· 酒文化
· 买车记
· 电影怀旧
· 烧菜“经验”点滴
· 一次难忘的音乐会
【无题】
· Waterpick
· 《蓝色天梦》点评
· Obama Care 的报税 – 寻求帮助
· 钢琴硕士和博士
· 赫鲁晓夫令人尊敬的一件往事
· 打桥牌和上厕所
· 聪明的车夫
· No School !
· 一段不错的绕口令
· Everyday is weekend
【(不是我的)童年 -- 续一】
【科普讲座 -- 续二】
· 统计样本的笑话
· 欧几里得21世纪的学生
· GDP和幸福指数
· 给电动车泼点冷水
· 信用卡的保护程序
· 自动驾驶
· “内行”的“外行”人之所见
· 精算师的风采
· 我说文理相通
· 人名不译
【科普讲座 -- 续一】
· 一次真正的忽悠 -- 双周房贷
· 论“房贷忽悠”之忽悠
【科普讲座】
· “不是数学家”的烦恼
· “永久”邮票
· 制度优势
· 又闻蝉鸣
· 独行侠张益唐 -- 转载自戴世强教
· 做一回事后诸葛亮
· 半路上杀出个程咬金
· 考试和做研究(4) 迟到创造了历
· 考试和做研究(3)桥牌博士论文
· 考试和做研究(2)
【华尔街的数学】
· 《华尔街数学》出版以后。。。
· 华尔街的数学(结束篇) 光辉的
· 华尔街的数学(19) 锻羽而归
· 华尔街的数学(18) 什锦拼盘
· 华尔街的数学(17) 橘子和苹果
· 华尔街的数学(16)苹果和橘子
· 华尔街的数学(15)“标准”手册
· 华尔街的数学(14)“涂改”数据
· 华尔街的数学(13)假“公”济私
· 华尔街的数学(12) 第三者的模
【街谈巷议】
· 拼死吃河豚
· 商人的智慧
· 在这儿,没有知遇之恩
· 部分大于整体
· 白草的战争逻辑
· 米饭里的沙子
· 吃力不讨好
· 丁惠民之问
· 贪官的智慧
· 最使我动容的一句话
【饮食文化】
· 小笼包史话
· 母亲的八宝辣酱
· 倚老卖老
· 搭便车
· 江浙点心和统一大业
· 糖藕 (非食谱)
· 蹄筋(非食谱)
【我的大学】
· 三强韩赵魏,九章勾股弦
· 惨烈的考试
· 重刑监狱犯人的数学难题
· 鱼骨头的故事
· 数学也有假冒伪劣
· 无名小卒和Nash大师的一段“交往”
· 别开生面的面试
· 我的第一次 0 + 1
· 大师的风采
· 桥牌博士
【人间】
· 你想不到的义工
· 丁惠民先生千古!
· 卡特总统生日快乐!
· 幽默的老板
· 买车记
· 个人自扫邻家雪
· 不说英语的留学生
· 多亏没有简体字
【(不是我的)童年】
· 女儿“学”元素周期表
· 一鸣惊人
· 布谷鸟又叫了
· 谁是老板?
· Potty 交响曲
· "重赏"之下, 必有&quo
【往事越千年】
· 瑪德琳饼干的故事
· 蒋经国的伟大
· 版权所有!!!
· 一身真伪有谁知
· 太湖美
· 人间自有真情在
· 蒋介石为胡适写的挽联
· 怀念胡耀邦
· 我家的“阿庆嫂”
· 我的英语老师
存档目录
2024-11-02 - 2024-11-13
2024-10-01 - 2024-10-31
2024-09-02 - 2024-09-26
2024-08-01 - 2024-08-31
2024-07-17 - 2024-07-29
2024-06-30 - 2024-06-30
2024-05-11 - 2024-05-30
2024-04-13 - 2024-04-17
2024-03-08 - 2024-03-08
2024-02-05 - 2024-02-11
2023-11-09 - 2023-11-09
2023-10-04 - 2023-10-18
2023-08-06 - 2023-08-06
2023-07-01 - 2023-07-28
2023-06-27 - 2023-06-27
2023-05-01 - 2023-05-21
2023-04-09 - 2023-04-23
2023-01-09 - 2023-01-22
2022-12-17 - 2022-12-17
2022-11-09 - 2022-11-19
2022-10-16 - 2022-10-21
2022-09-01 - 2022-09-10
2022-07-14 - 2022-07-25
2022-03-29 - 2022-03-29
2021-12-27 - 2021-12-27
2021-10-30 - 2021-10-30
2021-08-10 - 2021-08-10
2021-07-23 - 2021-07-23
2021-06-07 - 2021-06-28
2021-04-05 - 2021-04-05
2021-03-05 - 2021-03-10
2020-12-03 - 2020-12-30
2020-11-01 - 2020-11-26
2020-10-05 - 2020-10-24
2020-09-03 - 2020-09-20
2020-08-14 - 2020-08-31
2020-07-05 - 2020-07-24
2020-06-08 - 2020-06-08
2020-05-13 - 2020-05-27
2020-04-02 - 2020-04-30
2020-03-05 - 2020-03-26
2020-02-23 - 2020-02-23
2019-12-31 - 2019-12-31
2019-11-11 - 2019-11-24
2019-10-14 - 2019-10-18
2019-09-13 - 2019-09-24
2019-06-10 - 2019-06-10
2019-05-28 - 2019-05-28
2019-04-03 - 2019-04-28
2019-03-01 - 2019-03-14
2019-02-08 - 2019-02-23
2019-01-22 - 2019-01-28
2018-11-06 - 2018-11-08
2018-10-21 - 2018-10-21
2018-09-04 - 2018-09-28
2016-08-11 - 2016-08-11
2015-11-08 - 2015-11-22
2015-09-05 - 2015-09-27
2015-07-26 - 2015-07-27
2015-06-14 - 2015-06-14
2015-05-25 - 2015-05-30
2015-04-11 - 2015-04-11
2015-03-01 - 2015-03-02
2015-02-28 - 2015-02-28
2014-05-10 - 2014-05-10
2014-04-20 - 2014-04-20
2014-02-01 - 2014-02-22
2013-11-23 - 2013-11-23
2013-10-13 - 2013-10-19
2013-09-06 - 2013-09-14
2013-08-11 - 2013-08-31
2013-07-13 - 2013-07-23
2013-06-09 - 2013-06-09
2013-04-17 - 2013-04-21
2013-03-02 - 2013-03-02
2013-02-09 - 2013-02-23
2012-12-01 - 2012-12-29
2012-11-19 - 2012-11-28
2012-10-21 - 2012-10-21
2012-09-21 - 2012-09-21
2012-08-01 - 2012-08-03
2012-04-14 - 2012-04-14
2012-03-05 - 2012-03-05
2012-02-25 - 2012-02-26
2012-01-14 - 2012-01-28
2011-12-27 - 2011-12-27
2011-11-06 - 2011-11-20
2011-10-21 - 2011-10-29
2011-09-26 - 2011-09-26
2011-08-25 - 2011-08-27
2011-07-31 - 2011-07-31
2011-05-21 - 2011-05-21
2011-04-09 - 2011-04-21
2011-03-12 - 2011-03-12
2011-01-22 - 2011-01-31
2010-11-01 - 2010-11-10
2010-10-09 - 2010-10-12
2010-09-26 - 2010-09-30
2010-08-06 - 2010-08-28
2010-07-12 - 2010-07-25
2010-06-05 - 2010-06-19
2010-05-01 - 2010-05-30
2010-04-02 - 2010-04-24
2010-03-05 - 2010-03-26
2010-02-05 - 2010-02-26
2010-01-05 - 2010-01-27
2009-12-04 - 2009-12-29
2009-11-06 - 2009-11-27
2009-10-02 - 2009-10-30
2009-09-04 - 2009-09-25
2009-08-01 - 2009-08-30
 
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. Creaders.NET. All Rights Reserved.