主题:【原创】基于西西河发帖时间戳的河友发帖习惯分析 -- 菜根谭
按照上文中的分析方法,可以看到:
大胖子vs菜根谭:R=0.82;
菜根谭vs达雅: R=0.79;
燕人:假日归客:R=0.86;
聪明的读者,发现问题了么?这三对难道互相都是马甲吗?
所以问题在哪儿呢?这种相关性到底在寻找什么?
绿色蔬菜的这个解读是最准确的。
我们认为人都是随着日升日落起居作息的,所以只要时间足够长,每个人的作息时间实际是在时间轴的一个平移。
用我对燕人的数据举例:
图1显示我们的数据没有相关性;
图2是固定燕人的数据,但是我的数据伴随着时间轴进行平移,并再次与燕人的数据进行Regress分析,由于Matlab的原因,Regress函数的R2会返回负值,这种情况下说明线性拟合不成立。我直接设置R=0;
从图2可以看出,当我的数据平移17个小时的时候,和燕人的数据出现最好的相关性;R接近0.8,如图3所示;
什么意思呢?也就是说:燕人和我的作息时间差7个小时。之前从我前一系列分析看到,,他在英国GST时区,我在北京时区。看起来我们作息差1个小时,这个解释合理吗?
只看图3,难道燕人是我的马甲吗?
下一步,让我们用一些已知老河友的数据验证下这个理论是否正确:
因为燕人所在时区是GST, 将作为后续分析时间轴基准:
相对燕人:
翼德:+1; 翼得2022后注册,而燕人数据覆盖了之前10多年的数据;所以有偏差;
菜根谭:-7: 东8区,作息晚1小时;
大胖子: -8:东8区,作息时间类似;
达雅:-6:东8区,作息时间早1个小时;
假日归客:0,西1区,作息查一个小时;
夜如何其:7,西5区,作息晚2个小时;
以上数据证实时间分析是可行和准确的。
土鳖抗铁牛。
- 相关回复 上下关系5
🙂中国王申是谁的马甲? 1 淡淡忧伤 字0 2024-04-17 10:32:42
🙂不知道,铁手没说 大胖子 字0 2024-04-17 18:33:23
🙂除了两个人名,这些id都很小资。 四四方方 字0 2024-04-13 08:33:15
🙂更多的反例和进一步的分析
🙂牛,很好的学术性帖子,关键分析的都是我们想看的 老用户 字0 2024-04-13 13:36:48