HYWiki用户统计:修订间差异
外观
创建页面,内容为“2024年2月29日,21159试图弄清楚HYWiki的用户分布情况,进行了一次用户统计。 本次统计主要面向三个维度: * 届别:HYWiki的各届用户占比多少? * 性别:HYWiki的男女用户占比多少? * 班别:HYWiki中华育特色班与非特色班学生占比多少? 统计用户情况主要面临以下困难: * 早期用户非实名 * 同一人注册多账号 * 共用账号和公共账号 因此,在届别统计…” |
无编辑摘要 |
||
第1行: | 第1行: | ||
2024年2月29日,21159试图弄清楚HYWiki的用户分布情况,进行了一次用户统计。 | 2024年2月29日,21159试图弄清楚HYWiki的用户分布情况,进行了一次用户统计。 | ||
== 目标 == | |||
本次统计主要面向三个维度: | 本次统计主要面向三个维度: | ||
第7行: | 第8行: | ||
* 班别:HYWiki中华育特色班与非特色班学生占比多少? | * 班别:HYWiki中华育特色班与非特色班学生占比多少? | ||
== 困难与解决方案 == | |||
统计用户情况主要面临以下困难: | 统计用户情况主要面临以下困难: | ||
第20行: | 第22行: | ||
性别、班别统计与届别统计口径略有不同。在使用学号词条数据时,这两种统计不计入班号词条和相关事物词条,仅使用正则表达式匹配学号进行统计。“性别”的操作性定义是五位学号模100的余数与50的大小关系,如果小于50则为“女”,大于50则为“男”,暂不考虑其他情况。236班计入特色班-科技班。 | 性别、班别统计与届别统计口径略有不同。在使用学号词条数据时,这两种统计不计入班号词条和相关事物词条,仅使用正则表达式匹配学号进行统计。“性别”的操作性定义是五位学号模100的余数与50的大小关系,如果小于50则为“女”,大于50则为“男”,暂不考虑其他情况。236班计入特色班-科技班。 | ||
== 图表 == | |||
[[文件:届别240229.png|居中|510x510像素]] | |||
[[文件:新用户240229.png|居中|11.16为笔误,应为11.26]] | |||
[[文件:比较240229.png|居中|即上两图的比对。]] | |||
[[文件:届条形240229.png|居中|485x485像素]] | |||
[[文件:性别比240229.png|居中|478x478像素]] | |||
[[文件:特色班比240229.png|居中]] | |||
[[分类:华育维基史]] | [[分类:华育维基史]] |
2024年2月29日 (四) 20:08的版本
2024年2月29日,21159试图弄清楚HYWiki的用户分布情况,进行了一次用户统计。
目标
本次统计主要面向三个维度:
- 届别:HYWiki的各届用户占比多少?
- 性别:HYWiki的男女用户占比多少?
- 班别:HYWiki中华育特色班与非特色班学生占比多少?
困难与解决方案
统计用户情况主要面临以下困难:
- 早期用户非实名
- 同一人注册多账号
- 共用账号和公共账号
因此,在届别统计中,21159主要使用两个易验证数据代替:学号词条数据和实名化之后的新用户注册数据。
学号词条中,最常见的是五位学号人物词条(如21159),而班号词条(如248)和以学号、班号冠名的事物词条(如22届7班音乐群)也计入学号词条。该指标衡量的是不同班级/届别在HYWiki的影响力大小。它能用于估计用户分布,建立在这一假设之上:不同群体学生的平均创建词条能力相近,且类似地聚焦于本群体内人物词条,因而群体用户数正比于群体相关词条数。然而,事实中有一些个体/群体的创建词条能力远超平均值(如227与248),这一统计相对放大了热情程度较高的用户群体占比。
新用户注册数据是指2023年11月26日HYWiki注册实名化后的用户登记。这一数据有助于研判HYWiki用户发展的未来趋势,但是反应早期用户群体能力有限。
性别、班别统计与届别统计口径略有不同。在使用学号词条数据时,这两种统计不计入班号词条和相关事物词条,仅使用正则表达式匹配学号进行统计。“性别”的操作性定义是五位学号模100的余数与50的大小关系,如果小于50则为“女”,大于50则为“男”,暂不考虑其他情况。236班计入特色班-科技班。
图表





