淘客熙熙

主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol

共:💬117 🌺1730
全看分页树展 · 主题 跟帖
家园 【原创】(三)对西西河吸引力的估计

Adol:(二)“墙”对西西河的影响

4 对西西河吸引力的估计

那么接下来,我们想看一看,100个月以来,这944个核心用户是什么时候注册的,西西河经历的各种事件和网站政策的调整,在吸引新的优秀网友加入方面,情况是怎么样的。

点看全图

外链图片需谨慎,可能会被源头改

上图横坐标是时间,以月份为单位,纵坐标是944名核心用户中,当月的新增用户人数。从这个图看起来,仍然是314事件使最多的核心用户注册了进来,包括我,虽然不是这里的一员,也是08年4月初注册的。但是总体看来,核心用户的注册,并没有一个特定的增长或者下降的趋势,最近的一年左右似有下降的趋势,但是这可能是因为许多近期注册的用户还没有达到40000积分的门槛所致。

注册用户的增加对于月发帖量的贡献,则是显而易见的:

点看全图

外链图片需谨慎,可能会被源头改

这是月发帖量和注册人数的关系,共有100个月,横坐标是944名用户中在当月的已注册人数,纵坐标是当月的发帖数。可以看到,月发帖量和注册人数之间,呈现非常明显的线性关系,至少在2010年7月以前是这样 (p<1.72e-51, t-test)。回归线的斜率是36.4,表明每增加一名核心用户,西西河的月发帖量约增加36.4帖。考虑到老河友的淡出,这个数字可能还要高一些。

这张图中有两个值得注意的时间点。一个当然还是314事件,另一个是去年被墙的7月。我们看到314事件以后论坛重心的转移,除了少数几个点,并没有使每个用户每个月发帖的数量更多,从侧面支持了之前关于论坛发帖量受到“热点(事件、好贴)驱动”影响的假设。此外,从08年3月到10年7月期间,点与回归线的距离较之前更远,反映了这期间月发帖数量变得更不稳定了。至于10年7月以后,同样可能是因为40000积分的门槛因素,注册用户的增量变得很少,而月发帖数量则有所下滑,所以这张图的尾部也是失真的,这种直线下降的趋势并不符合近一年我们的经验观察。

为了进一步调查这些注册用户受到河友认同的情况,我们得到了:

点看全图

外链图片需谨慎,可能会被源头改

这是944名河友的声望和注册时间的关系图,横坐标是注册时间,坐标单位是年份,纵坐标是声望。可以看到,10万声望俱乐部,也就是声望的top 5,第一当然是萨苏,然后是忙总,井底望天,葡萄和晨枫。这样的大牛河友是可遇不可求的,没什么统计的价值,所以又放大了左图中声望在10000以下的中小牛的情况:

点看全图

外链图片需谨慎,可能会被源头改

——仍然是没什么特定的趋势。这一方面反映了西西河在314事件后月发帖量显著上涨的同时,核心用户并没有随之显著上涨——这意味着水质的下降,另一方面反映了在水质有所下降的情况下,西西河仍然有吸引力使许多优秀网友注册进来,西西河仍然很有活力。

当然,和前面一样,40000积分的门槛仍然可能导致这个图末尾的失真。而这个图尾部的情况,反而是我们很关心的问题,即,从去年7-8月被墙,经过蜀生、媚如春两次事件,还有其他因素的冲击,西西河的吸引力是否有所下降?因为门槛的限制,我们没法对这个问题做出准确的回答,但是从前面同期注册者声望“高低有致”来看,近一年以来注册的优秀用户里面较上层的应该有暂露头角的了,可是从图中,我们没有看到。事实上,从去年被墙恢复(2010年9月)到现在,这段期间注册的用户中超过40000积分的只有7人,最近半年更是一个也没有,再加上后面要提到的近一年来鲜花的贬值因素,我的推测是,情况不容乐观。

Adol:【原创】(四)西西河通胀问题之研究

通宝推:妖猫drake,人在旅途,抱朴仙人,舞动人生,领班军机,

本帖一共被 3 帖 引用 (帖内工具实现)
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河