HYRiDRo
(重定向自HyRiDRo)

21159于2022年6月初使用QQ华育校友营、P社游戏直播群、里站三个群的聊天记录作为语料训练的GPT-2(一种OpenAI开发的生成式语言模型,类似ChatGPT但是更原始)聊天机器人。是华育数据宇宙的一部分。
详情
训练了30epoch,历时四个小时。
- 基本没有语境理解能力,绝大多数情况下都会答非所问,或者吐出莫名其妙的词句。
- 这些语句一般较短,很少超过十个字。
- 不会使用句号。
- 也没有什么谈话的连续性。
- 有时还会骂人。
- 但是,它习得了校群很多专有名词,比如蘑菇、李雪、佘山、wyd等,以及播中的“马穆鲁克”,“巴尔干”等地名,经常会运用这些词语,令人忍俊不禁。
2023年11月,159将模型发给25266,后者将其安装在自己的LemonQuBot中,开放给校群使用。21159、21361、22888、20851、24885等人积极诱导它说奇异搞笑的话,校群中充满了欢乐的气氛。
Bot画廊
后续
25266延续了21159用校群语料训练聊天机器人的技术路线,并在2023年11月到2024年6月依次完成了机器wyd,机器森岛和机器李雪的训练。对于这一技术,25266做出了众多创新,包括收集,清理和容纳微信语料,改用更强大的算法等。
详见LemonQuBot。