主题:【原创】醉汉的漫步 -- 淮夷
共:💬56 🌺677
当多种因素混杂出现的时候事物的分布更容易呈现随机的状态,但仔细分析之后,往往存在个别变量是产生影响。这些年来数据挖掘就致力于发掘出相关的联系。
举个例子,曾经有个模型是模拟46个美国城市的死亡率和空气质量的关系,其中列出空气悬浮颗粒,硫的含量,老人数量,低收入人口比例,人口密度作为变量
统一的看,死亡率是正态分布的,而且测试是符合这个结论。但具体分析之后,得出的结论是硫和悬浮颗粒几乎没有影响,人口密度少量影响,老年人口比例影响较大,但低收入人口比例高反而死亡率低的结论。
这些变量的影响相对于模型方程前的常数项相比太小,所以容易被忽视,但又是真实存在的
- 相关回复 上下关系8
🙂【原创】醉汉的漫步 372 淮夷 字7575 2012-03-08 20:52:06
🙂这本书还提到美国司法系统的本质 2 深夜腌的萝卜丝 字251 2012-08-09 12:50:06
🙂是否是随机也得看分析
🙂文章写得很好 1 kevin80 字122 2012-03-15 16:49:53
🙂喜欢这样的小文章 1 月光光 字16 2012-03-13 14:41:41
🙂有个小错误。 3 xu514 字198 2012-03-13 14:29:38
🙂先生指教的是 谢谢 1 淮夷 字0 2012-03-19 02:28:02
🙂有关蝴蝶效应与战争的导火线 76 joyfm 字2175 2012-03-12 19:33:33