【ZT】ChatGPT国产开源平替--ChatGLM部署教程

寂夜清风 · 发表于 2023-3-25 15:00

https://zhuanlan.zhihu.com/p/615395955

ChatGPT国产开源平替--ChatGLM部署教程

简介

关于chatglm,你可以理解为ChatGPT的国产开源平替

可以看下他自己生成的介绍

Pastedimage20230320091639.png

以webUI图形界面运行效果

以cli命令行交互模式运行效果

相关的链接

github地址： GitHub - THUDM/ChatGLM-6B: ChatGLM-6B：开源双语对话语言模型 | An Open Bilingual Dialogue Language Model

huggingface地址： THUDM/chatglm-6b · Hugging Face

运行使用

在autodl平台封装制作了镜像,在官方仓库示例代码上修改,包含webUI图形界面和cli命令行两种交互使用方式

下面是使用步骤

注册登陆autodl云计算平台账号

选取机子拉取镜像: 镜像链接

(拉取镜像、创建实例详细的步骤可以参考之前录的stable diffusion镜像使用的视频)

[color=inherit !important]使用镜像创建部署StableDiffusionWebUI保姆级教程714 播放 · 4 赞同视频

实例创建完后就可以开始运行我们的chatglm了有两种交互方式新手推荐webUI图形界面使用webUI图形界面运行

进入项目目录 ChatGLM-webui。打开终端运行如下命令

python web_demo.py

Pastedimage20230320094046.png

然后回到autodl实例列表节目,按下图步骤来访问我们部署好的ChatGLM服务了

Pastedimage20230319203023.png

接触过stable-diffusion-webui的朋友可能已经很熟悉这个UI了, demo代码也是用的gradio来制作GUI界面

示例展示

问了chatglm 国内各平台的用户画像个人感觉回答得还不错

使用 CLI 命令行交互

进入项目目录 ChatGLM-webui。打开终端运行如下命令

python cli_demo.py
示例展示

编程能力测试

上下文能力测试

资源占用情况

正常运行显存需达到12G及以上 ( 随着问的问题不断增加，需要记忆处理的上下文增大，显存占用也不断增多 )

本机有足够性能使用整合包快速搭建使用

如果自己电脑显卡显存大于6G,又不想折腾本地装环境,可以使用b站秋叶up的小白整合包,下面是整合包的视频教程

[color=inherit !important]ChatGLM-6B 清华开源模型一键包www.bilibili.com/video/BV1E24y1u7Go

配置要求如下图

镜像的构建过程(想深入研究或者本地搭建的可以看下)仓库克隆

git clone https://github.com/THUDM/ChatGLM-6B.git

依赖安装

使用 pip 安装依赖：pip install -r requirements.txt，其中transformers库版本推荐为4.26.1，但理论上不低于4.23.1即可。

修改代码下载模型文件到本地

模型文件很大，分成了八份，如果直接用官方的代码通过huggingface服务器下载大概率会超时，所以我改了demo的模型读取部分的代码，让程序读取事先下载到在本地的模型权重及相关配置文件，修改代码如下

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", cache_dir='./chatglm/', trust_remote_code=True) model = AutoModel.from_pretrained("./chatglm", trust_remote_code=True).half().cuda()

transformers库会根据我们提供给from_pretrained函数的参数在本地构建模型仓库

参考链接

gradio 文档 :https://www.gradio.app/docs/#interface

chatglm 官方文档 :https://github.com/THUDM/ChatGLM-6B

除了chatglm 这两天还用本地windows的Linux子系统wsl 配合docker镜像搭建部署了Meta的 LLaMA 模型,这两天会写个教程,把Windows 安装Ubuntu子系统wsl 到docker镜像拉取使用全流程都讲解一遍(数不完的坑啊 ) 尽请期待

更多AIGC文章见下方专栏
AI ARTwww.zhihu.com/column/c_1563238376853258240

寂夜清风 · 发表于 2023-3-27 14:47

有朋友进行了调整

chatglm6b模型的训练代码已经更新，基于之前的功能：
1. lora
2. fp16，int8
3. torch.utils.checkpoint（节约显存）
等功能之后，
现在终于加上了：单机多卡训练模型的功能（目前所有仓库里面，唯一一个支持单机多卡并行训练的脚本）

链接：https://github.com/yuanzhoulvpi2 ... imple_thu_chatglm6b

https://github.com/yuanzhoulvpi2017/zero_nlp/tree/main/simple_thu_chatglm6b

复制代码

账号		自动登录	找回密码
密码			加入我们

[AI] 【ZT】ChatGPT国产开源平替--ChatGLM部署教程