数据就是维基上的那些,给的链接里也有下载(100多M),想也知道很难区分撰写和维护这两者吧?最多能做的,就是武断地设置一个例如1000字节的门槛,然后勉强分析咯。
他们的数据不仅来自主条目空间,还用了用户页和用户讨论页的编辑历史。在人员选择上只包括了注册用户,还把机器人和管理员的数据排除了。
社群规模与贡献激励的关系
Re: 社群规模与贡献激励的关系
另外不好意思我错译了一个地方,unblock下意识写成了未被封禁,其实应该是未受GFW封锁影响。
他们判断未受封锁影响的标准,(1)封锁前加入,封锁期间至少编辑一次;(2)编辑者使用主要(超过50%)使用繁体中文编辑。
这两个标准其实都有问题,(1)一个可以用翻墙软件(比如Tor)极其困难地完成一次编辑的用户并不能算是未受影响,(2)忽略了新马用户和海外简体用户。
他们判断未受封锁影响的标准,(1)封锁前加入,封锁期间至少编辑一次;(2)编辑者使用主要(超过50%)使用繁体中文编辑。
这两个标准其实都有问题,(1)一个可以用翻墙软件(比如Tor)极其困难地完成一次编辑的用户并不能算是未受影响,(2)忽略了新马用户和海外简体用户。
我会耐心等待,等到这一天