HYRiDRo:修订间差异
外观
无编辑摘要 |
无编辑摘要 |
||
(未显示同一用户的2个中间版本) | |||
第10行: | 第10行: | ||
* 也没有什么谈话的连续性。 | * 也没有什么谈话的连续性。 | ||
* 有时还会骂人。 | * 有时还会骂人。 | ||
* 但是,它习得了校群很多专有名词,比如[[蘑菇]]、[[李雪]]、佘山、[[wyd]] | * 但是,它习得了校群很多专有名词,比如[[蘑菇]]、[[李雪]]、佘山、[[wyd]]等,以及[[播文化|播]]中的“马穆鲁克”,“巴尔干”等地名,经常会运用这些词语,令人忍俊不禁。 | ||
2023年11月,159将模型发给[[25266]],后者将其安装在自己的[[LemonQuBot]]中,开放给校群使用。[[21159]]、[[21361]]、[[22888]]、[[20851]]、[[24885]]等人积极诱导它说奇异搞笑的话,校群中充满了欢乐的气氛。 | 2023年11月,159将模型发给[[25266]],后者将其安装在自己的[[LemonQuBot]]中,开放给校群使用。[[21159]]、[[21361]]、[[22888]]、[[20851]]、[[24885]]等人积极诱导它说奇异搞笑的话,校群中充满了欢乐的气氛。 | ||
第27行: | 第27行: | ||
文件:佘山落网.png | 文件:佘山落网.png | ||
</gallery> | </gallery> | ||
== 后续 == | |||
[[25266]]延续了21159用校群语料训练聊天机器人的技术路线,并在2023年11月到2024年6月依次完成了机器wyd,机器森岛和机器李雪的训练。对于这一技术,25266做出了众多创新,包括收集,清理和容纳微信语料,改用更强大的算法等。 | |||
详见[[LemonQuBot]]。 | |||
[[分类:企划]] | [[分类:企划]] | ||
[[分类:软件]] | [[分类:软件]] | ||
[[分类:校群史]] | |||
[[分类:梗]] |
2024年6月22日 (六) 12:17的最新版本

21159于2022年6月初使用QQ华育校友营、P社游戏直播群、里站三个群的聊天记录作为语料训练的GPT-2(一种OpenAI开发的生成式语言模型,类似ChatGPT但是更原始)聊天机器人。是华育数据宇宙的一部分。
详情
训练了30epoch,历时四个小时。
- 基本没有语境理解能力,绝大多数情况下都会答非所问,或者吐出莫名其妙的词句。
- 这些语句一般较短,很少超过十个字。
- 不会使用句号。
- 也没有什么谈话的连续性。
- 有时还会骂人。
- 但是,它习得了校群很多专有名词,比如蘑菇、李雪、佘山、wyd等,以及播中的“马穆鲁克”,“巴尔干”等地名,经常会运用这些词语,令人忍俊不禁。
2023年11月,159将模型发给25266,后者将其安装在自己的LemonQuBot中,开放给校群使用。21159、21361、22888、20851、24885等人积极诱导它说奇异搞笑的话,校群中充满了欢乐的气氛。
Bot画廊
后续
25266延续了21159用校群语料训练聊天机器人的技术路线,并在2023年11月到2024年6月依次完成了机器wyd,机器森岛和机器李雪的训练。对于这一技术,25266做出了众多创新,包括收集,清理和容纳微信语料,改用更强大的算法等。
详见LemonQuBot。