服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

微软发布了可发送和接收图片的 ChatGPT - VisualChatGPT

日期: 来源:Github爱好者收集编辑:

Visual ChatGPT 连接了 ChatGPT 和一系列的 Visual Foundation 模型,以便在聊天过程中发送和接收图像。

下图为演示效果:

对该应用实现感兴趣的可以查看其论文 Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models(https://arxiv.org/abs/2303.04671)。

整个系统架构如下所示:

要安装的话可以安装下面的命令步骤进行:

# create a new environment
conda create -n visgpt python=3.8

# activate the new environment
conda activate visgpt

#  prepare the basic environments
pip install -r requirement.txt

# download the visual foundation models
bash download.sh

# prepare your private openAI private key
export OPENAI_API_KEY={Your_Private_Openai_Key}

# create a folder to save images
mkdir ./image

# Start Visual ChatGPT !
python visual_chatgpt.py

下面列出了每个视觉基础模型的 GPU 内存使用情况,可以修改 self.tools 使用较少的视觉基础模型来节省您的 GPU 内存:

Foundation ModelMemory Usage (MB)
ImageEditing6667
ImageCaption1755
T2I6677
canny2image5540
line2image6679
hed2image6679
scribble2image6679
pose2image6681
BLIPVQA2709
seg2image5540
depth2image6677
normal2image3974
InstructPix2Pix2795

Github地址:https://github.com/microsoft/visual-chatgpt

相关阅读

  • 为什么大佬debug五分钟,你却要两小时

  • 将 脚本之家 设为“星标⭐”第一时间收到文章更新作者 | 梁唐出品 | 公众号:Coder梁(ID:Coder_LT)今天我们来聊聊debug,bug这东西几乎是所有程序员都绕不过去的。先来聊个冷知识,
  • 假如变量名允许以数字开头...

  • 将 脚本之家 设为“星标⭐”第一时间收到文章更新出品 | 麦叔编程 (ID:maishucode)已获得原公众号的授权转载假如变量名允许以数字开头...最近有同学问我,“变量名为什么宁可使
  • 正常的乳房到底长什么样?(内附图解)

  • 文 |六团队 来源:第十一诊室(ID:consultingroom_11)(点击关注叨叨,科学育儿不走丢~)有很多朋友在后台问小助手,为什么总感觉叨叨账号神出鬼没的,有时候能看到,有时候看不到?其实这是因
  • 初中语文答题模板,学霸技巧书,不容错过

  • 提起初中语文,经常能看到很多家长和学生反馈:“初中语文分数最难提高了”;“碰到阅读理解完全不知道从哪下手”;“读了很多文章,一做题还是找不到得分点”;“积累了很多好词好句写

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 为什么大佬debug五分钟,你却要两小时

  • 将 脚本之家 设为“星标⭐”第一时间收到文章更新作者 | 梁唐出品 | 公众号:Coder梁(ID:Coder_LT)今天我们来聊聊debug,bug这东西几乎是所有程序员都绕不过去的。先来聊个冷知识,