微软多模态Visual ChatGPT, 免费Google Colab搭建Demo详细实操教程!

您所在的位置:网站首页 imageio下载 微软多模态Visual ChatGPT, 免费Google Colab搭建Demo详细实操教程!

微软多模态Visual ChatGPT, 免费Google Colab搭建Demo详细实操教程!

#微软多模态Visual ChatGPT, 免费Google Colab搭建Demo详细实操教程!| 来源: 网络整理| 查看: 265

微软在3.9日在arixv上放出Visual ChatGPT,短短一周不到其github上开源代码已接近16k的stars,可见多模态Chat在AI领域再一次引发了巨大的反响。

今天小源借助Google Colab体验了一把Visual ChatGPT,不同与BLIP2等模型,依赖ChatGPT API强大的NLP能力,其在一些多模态问答推理上甚至超过BLIP2。而且Visual ChatGPT通过Prompt Manager将Image Captioning,VQA,AI绘画等任务串接在一起,功能更加强大。下面将从头开始介绍如何在google colab上搭建Visual ChatGPT,当然如果自己有的GPU的土豪可以直接在本地搭建。不过google colab由于环境在云端,因此方便共享和在线操作(当然最主要还是因为Google Colab GPU免费!!)。

在使用本教程的同学需要先具备以下条件:

已经拥有OPENAI账号能够访问Google Drive 网页搭建Demo体验示例1)申请API KEY

登录OpenAI网站(https://platform.openai.com/),点击右上角View API keys—> Create new secret key,可以生成属于你自己的API,有了这个API,就可以用于开发基于ChatGPT API的应用程序:

登录页面API KEY申请

注意生成的API KEY一定要复制保存好,因为这个申请后只能查看这一次,后续无法再次查看同时还可以在左侧栏Usage 中看到token的使用量情况,数据5分钟更新一次。OpenAI官方针对每一个新注册的账户,提供$18免费token使用额度,有效期一个月。

2)进入google drive, 新建colab

进入google drive之后,在新建>更多>Google Colaboratory中新建一个colab

新建colab

进入colab(.ipynb文件)之后,首先修改设置,点击菜单栏中的修改>笔记本设置,将硬件加速器由CPU改为GPU,然后点击保存,保存后如图所示。

colab设置GPU环境3)在创建colab中Python 3.8 conda虚拟环境

由于colab默认使用Python3.9 torch==1.13.0的环境,需要重新创建一个Python 3.8 conda虚拟环境。在刚刚新建的colab文件中分别运行如下两个脚本即可:

%%bash MINICONDA_INSTALLER_SCRIPT=Miniconda3-4.5.4-Linux-x86_64.sh MINICONDA_PREFIX=/usr/local wget https://repo.continuum.io/miniconda/$MINICONDA_INSTALLER_SCRIPT chmod +x $MINICONDA_INSTALLER_SCRIPT ./$MINICONDA_INSTALLER_SCRIPT -b -f -p $MINICONDA_PREFIX conda install --channel defaults conda python=3.8 --yes conda update --channel defaults --all --yes

导入刚刚新建的Python 3.8 conda虚拟环境包

import sys sys.path.append("/usr/local/lib/python3.8/site-packages")4)安装依赖包

在当前目录新建如下requirement.txt依赖文件(不要使用官方的requirement.txt)

torch==1.12.1 torchvision==0.13.1 numpy==1.23.1 transformers==4.26.1 albumentations==1.3.0 opencv-python==4.5.1.48 imageio==2.9.0 imageio-ffmpeg==0.4.2 pytorch-lightning==1.5.0 omegaconf==2.1.1 test-tube>=0.7.5 streamlit==1.12.1 einops==0.3.0 webdataset==0.2.5 kornia==0.6 open_clip_torch==2.0.2 invisible-watermark>=0.1.5 streamlit-drawable-canvas==0.8.0 torchmetrics==0.6.0 timm==0.6.12 addict==2.4.0 yapf==0.32.0 prettytable==3.6.0 safetensors==0.2.7 basicsr==1.4.2 langchain==0.0.101 diffusers gradio openai accelerate

然后在colab中运行安装如下命令:

!python3.8 -m pip install -r requirement.txt5)下载权重

使用官方的下载download.sh脚本,为了节约磁盘占用,将ControlNet的权重取消下载,修改后如下:

git clone https://github.com/lllyasviel/ControlNet.git ln -s ControlNet/ldm ./ldm ln -s ControlNet/cldm ./cldm ln -s ControlNet/annotator ./annotator cd ControlNet/models #wget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_canny.pth #wget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_depth.pth #wget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_hed.pth #wget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_mlsd.pth #wget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_normal.pth #wget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_openpose.pth #wget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_scribble.pth #wget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_seg.pth cd ../../

之后在colab运行该下载脚本,同时创建图片存放文件夹:

!bash download.sh !mkdir ./image6)设置API KEY

在colab中通过设置环境变量的形式设置OPENAI的API KEY(刚刚申请的)

%env OPENAI_API_KEY=Your OpenAI API Key7)运行官方脚本

最后一步,在colab当前文件夹下新建一个visual_chatgpt.py文件,将官方的visual_chatgpt.py文件(https://github.com/microsoft/visual-chatgpt)复制过去,然后运行即可:

!python visual_chatgpt.py

运行成功后会显示出内网和外网访问链接,如下所示,在浏览器中打开public URL:

成功后public URL

注:public URL打不开可以将https改为http再尝试



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3