清华 ChatGLM-6B 和 ChatGLM2-6B 模型允许免费商用

35小吃技术网 推荐阅读 2023年09月25日21时44分26秒 96 0

感谢IT之家网友提供鲫鱼和雪狐的网线索!

IT之家7月15日消息,智普AI联合清华KEG实验室决定-6B、-6B权重完全开放给学术研究,并在完成企网业注册并获得授权后,允许免费商业使用。 注册地址点击此处进入。

IT之家此前报道,清华自然语言处理团队于3月14日发布了中英双语对话模型-6B,初步具备问答和对话功能。 该模型基于模型(GLM)架构,拥有 62 亿个参数。 结合模型量化技术,用户可以在消费级显卡上本地部署(INT4量化级别仅需要6GB显存)。

清华 ChatGLM-6B 和 ChatGLM2-6B 模型允许免费商用-第1张图片

运-6B型号于6月25日发布,在保留原型号对话流畅、部署门槛网低等特点的基础上,增加了诸多新功能:

-6B采用了Multi-Query,提高了生成速度,减少了生成过程中KV Cache的内存占用。 同时-6B使用Mask进行对话训练,连续对话时可以复用前几轮的KV Cache,进一步优化了内存使用。

清华 ChatGLM-6B 和 ChatGLM2-6B 模型允许免费商用-第2张图片

广告声明:文章中包含的外部跳转链接(包括但不限于超链接、二维码、密码等)用于传达更多信息,节省选择时间。 结果仅供参考。 IT之家的所有文章均包含此声明。