淘客熙熙

主题:【原创】基于西西河发帖时间戳的河友发帖习惯分析 -- 菜根谭

共:💬52 🌺415 🌵5
全看分页树展 · 主题 跟帖
家园 更多的反例和进一步的分析

点看全图

按照上文中的分析方法,可以看到:

大胖子vs菜根谭:R=0.82;

菜根谭vs达雅: R=0.79;

燕人:假日归客:R=0.86;

聪明的读者,发现问题了么?这三对难道互相都是马甲吗?

所以问题在哪儿呢?这种相关性到底在寻找什么?

合理方向正确

绿色蔬菜的这个解读是最准确的。

我们认为人都是随着日升日落起居作息的,所以只要时间足够长,每个人的作息时间实际是在时间轴的一个平移。

点看全图

用我对燕人的数据举例:

图1显示我们的数据没有相关性;

图2是固定燕人的数据,但是我的数据伴随着时间轴进行平移,并再次与燕人的数据进行Regress分析,由于Matlab的原因,Regress函数的R2会返回负值,这种情况下说明线性拟合不成立。我直接设置R=0;

从图2可以看出,当我的数据平移17个小时的时候,和燕人的数据出现最好的相关性;R接近0.8,如图3所示;

什么意思呢?也就是说:燕人和我的作息时间差7个小时。之前从我前一系列分析看到,,他在英国GST时区,我在北京时区。看起来我们作息差1个小时,这个解释合理吗?

只看图3,难道燕人是我的马甲吗?

下一步,让我们用一些已知老河友的数据验证下这个理论是否正确:

因为燕人所在时区是GST, 将作为后续分析时间轴基准:

点看全图

相对燕人:

翼德:+1; 翼得2022后注册,而燕人数据覆盖了之前10多年的数据;所以有偏差;

菜根谭:-7: 东8区,作息晚1小时;

大胖子: -8:东8区,作息时间类似;

达雅:-6:东8区,作息时间早1个小时;

假日归客:0,西1区,作息查一个小时;

夜如何其:7,西5区,作息晚2个小时;

以上数据证实时间分析是可行和准确的。

土鳖抗铁牛。

通宝推:千里不留行,落木千山,大胖子,起于青萍之末,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河