[AIGC]从0快速搭建个人版“对话大模子”

打印 上一主题 下一主题

主题 800|帖子 800|积分 2400



本教程介绍如何在阿里云GPU云服务器上基于Alpaca大模子快速搭建个人版“对话大模子”
配景信息

Alpaca大模子是一款基于LLaMA的大语言模子,它可以模仿自然语言进行对话交互,并协助用户完成写作、翻译、编写代码、生成脚本等一系列创作任务。同时,使用了中文数据进行二次预训练,提升了中文底子语义理解本领。
本文基于阿里云GPU服务器和Alpaca大模子,指导您如何快速搭建个人版“对话大模子”。


重要


  • 阿里云不对第三方模子Alpaca大模子的正当性、安全性、精确性进行任何保证,阿里云不对由此引发的任何损害负担责任。
  • 您应自觉遵守第三方模子的用户协议、使用规范和相关法律法规,并就使用第三方模子的正当性、合规性自行负担相关责任。
操纵步骤

创建并配置ECS实例


  • 在ECS实例创建页面,创建ECS实例。
    关键参数说明如下,其他参数的配置,请参见自界说购买实例。
       

    • 实例规格:选择实例规格为ecs.gn7i-c16g1.4xlarge
    • 镜像:公共镜像Ubuntu 22.04,并选中安装GPU驱动,选择CUDA 版本12.1.1/Driver 版本535.154.05/CUDNN 版本8.9.7.29


    • 系统盘:不小于200 GiB。
    • 公网IP:选中分配公网IPv4地点,带宽计费方式选择按使用流量,带宽峰值选择100 Mbps,以加速模子下载速度。



  • 添加安全组规则。
    在ECS实例安全组的入方向添加安全组规则并放行7860端口。详细操纵,请参见添加安全组规则。


  • 查看驱动以及CUDA库是否安装成功。
       

    • 使用root用户长途登录ECS实例。详细操纵,请参见通过密码或密钥认证登录Linux实例。
      初次登录ECS实例时,系统会自动安装驱动。当表现如下图所示的回显信息时,表示驱动以及CUDA库已安装成功。
      重要
           

      • 系统自动安装驱动以及CUDA库时,请不要手动操纵大概重启实例,否则大概会导致驱动大概CUDA库安装失败。等到安装驱动以及CUDA库完成以后,系统会自动重启。
      • 假如创建完ECS实例后,没有立刻长途登录ECS实例,大概看不到雷同下图的回显信息。


    • 再次使用root用户长途登录ECS实例。详细操纵,请参见通过密码或密钥认证登录Linux实例。
    • 执行以下下令,查看GPU驱动的版本。

      1. nvidia-smi
      复制代码
      回显信息雷同下图所示。


    • 执行以下下令,查看CUDA库的版本。

      1. nvcc -V
      复制代码
      回显信息如下图所示。



配置软件


  • 安装Python 3.11并升级pip。
       

    • 分别执行以下令,安装Python 3.11。

      1. apt-get update
      2. apt-get upgrade
      3. apt install -y python-is-python3 # 将默认Python改成Python3
      4. apt install -y software-properties-common   # 安装software-properties-common软件包
      5. add-apt-repository ppa:deadsnakes/ppa       # 添加PPA存储库
      6. apt -y install python3.11       # 安装Python 3.11
      7. update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.11 1 # 设置默认Python为Python 3.11
      复制代码
    • 执行如下下令,查看Python版本。

      1. python --version
      复制代码
      当回显如下所示时,表示已安装Python 3.11.9。


    • 分别执行以下令,升级pip。

      1. wget https://bootstrap.pypa.io/get-pip.py
      2. python3.11 get-pip.py
      复制代码

  • 执行以下下令,安装Git和Git LFS软件。

    1. apt install -y git git-lfs python3.11-distutils
    复制代码
  • 依次执行以下下令,安装模子所需要的Python包。

    1. sudo apt-get install pkg-config cmake
    2. sudo apt-get install python3.11-dev
    3. pip install git+https://github.com/huggingface/transformers
    4. pip install sentencepiece==0.1.97 -i https://mirrors.aliyun.com/pypi/simple
    5. pip install peft==0.10.0 -i https://mirrors.aliyun.com/pypi/simple
    复制代码
    重要
    从GitHub上下载Transformers库,由于网络缘故原由偶尔大概会不成功,建议您多实验几次。
  • 在PyTorch环境下验证GPU是否正常工作。
       

    • 执行以下下令,进入Python运行环境。

      1. python
      复制代码
    • 执行以下下令,验证GPU是否正常工作。

      1. import torch
      2. torch.cuda.is_available()
      复制代码
      返回True,表示GPU正常工作。


    • 执行以下下令,退出Python。

      1. quit()
      复制代码

下载与配置模子


  • 依次执行以下下令,下载tmux并创建一个tmux session。

    1. apt install -y tmux
    2. tmux
    复制代码
    重要
    下载模子耗时较长,建议在tmux session中下载,以免ECS断开毗连导致下载中断。
  • 执行以下下令,下载Chinese-LLaMA-Alpaca模子。

    1. git clone https://github.com/ymcui/Chinese-LLaMA-Alpaca.git
    复制代码
  • 执行以下下令,下载chinese-alpaca-lora-13b模子。

    1. git clone https://www.modelscope.cn/ChineseAlpacaGroup/chinese-alpaca-lora-13b.git
    复制代码
  • 依次执行以下下令,下载llama-13b-hf。
    llama-13b-hf是预训练的llama 13b模子,已经转换成了Huggingface的模子格式。下载llama-13b-hf大约有40 GiB的数据,预估下载时间约30分钟,请您耐心等候。
    重要
    LLaMA是第三方提供的Huggingface格式的预训练模子数据。Meta官方发布的LLaMA模子克制商用,而且官方暂时还没有正式开源模子权重。这里使用这个下载链接只为做演示使用,不负担任何法律责任。

    1. pip install -U huggingface_hub
    2. pip install -U hf-transfer
    3. export HF_ENDPOINT=https://hf-mirror.com
    4. export HF_HUB_ENABLE_HF_TRANSFER=1
    5. huggingface-cli download --resume-download --local-dir-use-symlinks False yahma/llama-13b-hf --local-dir llama-13b-hf
    复制代码
  • 依次执行以下下令,合并代码。

    1. cd Chinese-LLaMA-Alpaca/
    2. python scripts/merge_llama_with_chinese_lora.py --base_model ~/llama-13b-hf/ \
    3.         --lora_model ~/chinese-alpaca-lora-13b/ --output_type huggingface \
    4.         --output_dir ./llama_with_lora_hf
    复制代码
    下令行中需要用--output_dir下令指定一个输出目录,本示例中输出目录为/root/Chinese-LLaMA-Alpaca/llama_with_lora_hf 。转换需要一段时间,需要耐心等候。
  • 执行以下下令,查看转换完成后的文件。

    1. ls -lh llama_with_lora_hf
    复制代码


摆设WebUI


  • 执行以下下令,在/root目录大概您的工作目录,下载WebUI而且进行代码摆设。

    1. cd
    2. git clone https://github.com/oobabooga/text-generation-webui.git
    复制代码
  • 执行以下下令,安装代码及依靠库。
    重要
    安装代码及依靠库涉及从GitHub下载代码,大概会因为网络缘故原由运行失败,请多试几次。

    1. cd text-generation-webui/
    2. pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple
    3. pip install datasets gradio rich bitsandbytes -i https://mirrors.aliyun.com/pypi/simple/
    复制代码
  • 执行以下下令,在models目录下面生成一个软链接,指向合并后模子数据的目录。

    1. ln -s /root/Chinese-LLaMA-Alpaca/llama_with_lora_hf/ models/llama_with_lora_hf
    复制代码
    参数说明如下:
       

    • /root/Chinese-LLaMA-Alpaca/llama_with_lora_hf/:指的是合并模子存放的目录,您可以从合并代码步骤获取。
    • models/llama_with_lora_hf:指的是模子名称,您可以修改成其他名称。

验证结果

完成以上操纵后,您已经成功完成了WebUI摆设和个人版对话大模子的搭建。您可以在WebUI页面进行验证。

  • 执行以下下令,运行WebUI。

    1. cd text-generation-webui/
    2. python server.py --model llama_with_lora_hf --listen --chat --load-in-8bit
    复制代码
    参数说明如下:
       

    • --model:指定的是步骤3生成的软链接的名称,不需要带前面的model/目录名。本示例软链接的名称为llama_with_lora_hf。
    • --listen:用于设置WebUI监听所有外部IP(不配置--listen默认只能监听当地IP),以实现从实例外访问WebUI。默认监听端口是7860,您可通过--listen-port来指定其他监听端口。
    • --chat:用于指定默认的运行模式,本文示例为对话模式(可按需实验其他模式)。
    • --load-in-8bit:用于指定以8 bit模式加载模子。正常加载13B模子需要26 GB以上显存,A10显卡只有24 GB,以是需要以8bit模式加载,模子占用显存大约为15 GB。
    当表现如下图所示的回显信息时,表示运行WebUI成功。


  • 在ECS实例页面,获取ECS实例的公网IP地点。


  • 在浏览器中输入http://<ECS实例公网IP地点>:7860,即可访问个人版对话大模子。
    您可以输入相应的题目和AI呆板人进行对话。



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

悠扬随风

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表