主题:【原创】统计狂人 -- 淮夷
变量可以越添越多,但是解释作用会变得越来越脆弱,一个小的变量的波动,都可能导致整个模型的结果毫无意义。
人类是无法离开直觉的。很多东西也并不适用统计学。例如此书中提到根据信用卡刷卡数据可以预测一个人的离婚几率,我觉得纯属瞎闹。
garbage-in, garbage-out这样的诡计已经在统计学中出现很多了。本书作者对统计学的过度迷信是我对其存有质疑的所在。
吃牛排不难,可是如何量化感情的“痛苦点”是一个比较难的事情。
影响农作物质量的变量其实有很多个,比如土壤、水质、日照、肥料,等等。至于为何只选取这三个变量,书中没细谈。我的猜想是欧莱做过统计上的技术处理,比如backward selection或forward selection,把没有显著意义的变量剔除干净。线性回归解释历史数据确实可达成较高的拟合度(高R2值),但是用来预测未来也可以一直很准就真的是一个好的模型了。
广告:“痛经吃什么?”---似乎这个我用不到吧。
您的文章我拜读一下。
博彩行业是一个高智商行业,无疑地。
没想到楼主这么生气,打趣惹了个没趣,删了。
这十几年下来,别的Casino和连锁酒店做的就没他好,还是个理念问题。里边用到的软件哪,算法呀,都不高深,也有现成的产品和咨询公司。象一个全是角子机的赌场,在赌上根本不用算计什么,按照州政府批给你的赔率,把买来的角子机后面的设置弄好,然后就是非常稳定的统计表现了。关键是吸引客人,留住客人,关键是对钱的算计。一个客人在酒店赌掉多少钱,吃饭桑拿掉多少钱,购物掉多少钱,都要有数。您提到的对单个客人的卡的追踪,是一个方面。象大西洋城和有些印第安保留地的Hurrah,客户群有明显的时间性,周日下午3,4点钟纷纷撤离,这时候,就要对全体客人搞大抽奖,大赠送,等等。把钱从客人身上挤出来,真是个值得人琢磨的好问题。
我没有读过你和楼上所谓的什么同人博客。如果你“统计用词特点”,请你和你楼上的人,尽量说清楚。不要说这些含糊其辞、含沙射影的话。
这到底是好事,还是坏事?我们无从得知,只能期望多年后的我们,即使在精心构筑的水晶宫内安逸的生活,也不要忘记曾经的激情。
在我看来,人类大脑中那一点点仅存的非理性才是最珍贵的。
两位创始人都没说清楚什么是真正的自由。但是我们也知道机器的能力是有限的,我期待人类最后那一点非理性给我们带来惊喜。
您讲的印第安保留地的情况很有启发。
我上次和哈拉斯的那个老兄聊过之后的感觉是,哈拉斯的特长在于吸引回头客,发掘普通客人内心深处的”赌性“。这是一个需要很细致的心理分析并辅以统计数据支持和后勤配合的工作。说起来也算是一个细分市场。哈拉斯的营销成功靠的是琢磨那些小额交易的赌徒并把大众培育为热爱赌博事业的常客,而不是一门心思只琢磨那种一掷千金的豪赌客。
非理性对决策的影响很重要,也是可以善加利用的。关于这个话题我最近正在读一本书,有空了写下来和您请教。
统计也许能预测某年所有葡萄酒的平均品质,但不能给出不同酿造厂不同工艺品牌酒的品质。这些活只能由品酒师来干。品酒师的工作不是确定所有酒的平均品质。所以统计砸不了品酒师的饭碗。
同样,光凭数据也不能确定某个具体球员的实力,因为美国高中大学球员都是参加不同水平的联盟比赛,数据不能拿来直接比较。职业队选秀还是只能依靠球探。
现在用统计学做一个社科领域,总是遇到不理解甚至诋毁的声音。以后谁要和我辩,我就推荐他们看这篇文章!