淘客熙熙

主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol

共:💬117 🌺1730
全看分页树展 · 主题 跟帖
家园 使用积分来作为门槛

是因为有现成的英雄榜-历次跳水者这个现成的列表。积分确实不能代表一切,声望好一些,但是如您所说,增长速度可能是更好的办法。但这个增速也会受到一些其他因素影响。比如,——我手里没有积分或者声望的历史数据,但是有花的数据,下一节也会简单分析一下。或许我们也可以通过累加获得时间-得花总数的一个经验函数。

但是其一,受到一些因素的影响,得花率本身和时间也是有关系的,下一节会提到;其二,某个河友和总体不一样,发帖并不是稳定的,向忙总那样高产,短时间大量发帖的河友非常少,能够长期稳定每个月发帖的河友也非常少,(同样会在下一节提到),这就导致有的月份声望增长很多,有的月份增长很少。所以具体某个人的得花-时间函数恐怕是很复杂难以用解析方法描述的函数,数值差分,很惭愧,分析知识已经基本上还给老师了,大致上印象好像是和微分差不多,离散的,不知道我的理解对不对,——在这样复杂的函数上的应用可能是比较困难的,数值方法,可能也因为分布的不均匀会遇到困难,毕竟大部分人要攒一篇好帖子,还是蛮困难的,什么时候攒出来,也基本是随机的。

从图中来看,超过40000积分的用户,声望在2000左右和以上的,还是比较多,特别是较高积分的河友,一般声望都不低。因此相比于存量积分,下两节我打算使用平均得花等一些简单的统计特征来侧面反映一些事情。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河