HYWiki用户统计
外观
2024年2月29日,21159试图弄清楚HYWiki的用户分布情况,进行了一次用户统计。
本次统计主要面向三个维度:
- 届别:HYWiki的各届用户占比多少?
- 性别:HYWiki的男女用户占比多少?
- 班别:HYWiki中华育特色班与非特色班学生占比多少?
统计用户情况主要面临以下困难:
- 早期用户非实名
- 同一人注册多账号
- 共用账号和公共账号
因此,在届别统计中,21159主要使用两个易验证数据代替:学号词条数据和实名化之后的新用户注册数据。
学号词条中,最常见的是五位学号人物词条(如21159),而班号词条(如248)和以学号、班号冠名的事物词条(如22届7班音乐群)也计入学号词条。该指标衡量的是不同班级/届别在HYWiki的影响力大小。它能用于估计用户分布,建立在这一假设之上:不同群体学生的平均创建词条能力相近,且类似地聚焦于本群体内人物词条,因而群体用户数正比于群体相关词条数。然而,事实中有一些个体/群体的创建词条能力远超平均值(如227与248),这一统计相对放大了热情程度较高的用户群体占比。
新用户注册数据是指2023年11月26日HYWiki注册实名化后的用户登记。这一数据有助于研判HYWiki用户发展的未来趋势,但是反应早期用户群体能力有限。
性别、班别统计与届别统计口径略有不同。在使用学号词条数据时,这两种统计不计入班号词条和相关事物词条,仅使用正则表达式匹配学号进行统计。“性别”的操作性定义是五位学号模100的余数与50的大小关系,如果小于50则为“女”,大于50则为“男”,暂不考虑其他情况。236班计入特色班-科技班。