服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

中文多模态模型问世!IDPChat生成图像文字,只需5步+单GPU

日期: 来源:新智元收集编辑:IDP



  新智元报道  

编辑:桃子 拉燕
【新智元导读】中文多模态模型IDPChat来了,快速上手教程在此。

中文多模态模型IDPChat和大家见面了。

随着GPT4、文心一言等的发布,预训练大模型正式开启由单模态向多模态模型演进。多模态的特性为语言模型带来更加丰富的应用场景。

我们认为,未来的AI应用将主要以大模型为核心基石。

而在大模型的领域,基于基础模型(Foundation model)构建领域或企业自有的大模型,会是近中期的重要发展趋势。

但在私有化大模型微调和应用方面,企业和机构仍面临着微调复杂、部署困难、成本较高等种种工程化挑战。

白海作为AI基础软件服务商,我们希望能够从AI Infra层面,提供端到端的大模型微调、部署和应用工具,降低大模型微调和应用的门槛。白海科技IDP平台目前提供了从大模型数据源接入到大模型微调训练、模型发布的全流程功能。

我们以IDP平台为工具支撑,以预训练大语言模型LLaMA和开源文生图预训练模型Stable Diffusion为基础,快速构建了多模态大模型应用IDPChat。开发者们可根据场景需求,便捷地对其进行微调优化。

项目地址:https://github.com/BaihaiAI/IDPChat

IDPChat 能做什么


IDPChat目前可以同时支持文字对话和图片生成。

首先是图像生成,我们可以让模型根据文字描述画一幅画。


基础的文字对话聊天示例,可支持中文。


IDPChat 快速上手


仅需简单的5步和单GPU,即可快速启用IDPChat。

操作步骤如下:

1.  修改 ./backend/app/stable_diffusion/generate_image.py 文件,设置 diffusion_path 的值为本地 stable-diffusion 模型存储路径,设置 trans_path 的值为本地中文翻译模型的存储路径

2.  修改 ./backend/app/llama/generate_text.py 文件,设置 load_model 的 base 参数值为本地 llama 模型的存储路径

3.  执行 build.sh 脚本进行编译

4.  编译成功后执行 run.sh 脚本启动服务

5.  服务启动成功后,在浏览器中打开http://127.0.0.1:8000

在应用之前,需要下载准备所需的模型,LLaMA、Stable diffusion和相应的翻译模型。

具体所需的环境、模型、和操作步骤可以参考https://github.com/BaihaiAI/IDPChat

目前发布IDPChat初步版本,打通模型微调的全流程。

后续我们会继续对模型进行优化和丰富,如多模态部分增加图像描述功能。

当然要实现特定领域更高质量、针对性的表现,还需要基于领域数据的finetune和优化。

对 IDPChat 和 IDP 平台感兴趣的开发者小伙伴、场景应用伙伴等欢迎关注Github并联系我们。我们相信 IDP 平台和 IDPChat 将成为您探索多模态大模型应用和私有化大模型构建的得力助手。





相关阅读

  • 定了!3天后!北京这里要热闹了!

  • 在北京三天吃遍全国(逛吃攻略)ARE YOU READYLET'S GO艾瑞巴蒂,今天礼拜天明天又该上班了大家是不是只想“躺平”在床上(小声)小编也是这么想的但是!请大家打起精神!再坚持3天!4月2
  • “刷脸”乱象不止,是时候治理了

  • 文|王远方近年来,与“一部手机走天下”一样,靠脸吃饭和生活成了一种新的模式。基于人脸识别技术的发展,点单支付、进出小区、办理业务……用户的脸部特征所包含的是一种无限量
  • 国家安全机关这个短片,走心了

  • 有人说人间烟火气最抚凡人心可司空见惯的日常是否理所当然?国家安全不仅是国家的事而与每个人息息相关从海疆边关到城市阡陌从晨曦微露到万家灯火正是你我无数的守护让维护国
  • 东城:在首都核心区高质量发展中贡献人社力量

  • 为进一步推进本市人社工作开好局、起好步,本期开始推出“勇担新使命 奋进新征程·一把手话开局”系列报道,展现各区人社局“一把手”锚定目标真抓实干、凝心聚力砥砺前行的精
  • ChatGPT火了 成都人工智能赛道如何发力?

  • ChatGPT热度持续高涨,众多大厂、创业公司都瞄准了“中国版ChatGPT”。成都科技企业如何抓住新AI浪潮?日前,由成都市人工智能产业生态联盟主办,达观数据承办,智慧蓉城研究院与趋动
  • 甜蜜来袭!军地青年联谊共赴浪漫之约

  • 人才相约·为爱聚焦  近日,第83集团军某旅携手驻地市委组织部、市直机关工委、市退役军人事务局、军分区政治处、团市委、市妇联,精心举办“人才相约·为爱聚焦”军地青年
  • 哪里能看到不一样的世界?

  • 如今在这个信息高度过剩的时代,一个小小的手机屏幕承载那么多的APP,推送消息响个不停,我们既希望,又害怕。每天处在碎片化的环境中,迷失了自我,不知道自己到底应该干什么,能做什么

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四
  • 美国对华2000亿关税清单,到底影响有多大?

  • 1 今天A股大跌,上证最大跌幅超过2%。直接导火索是美国证实计划对华2000亿美元产品加征25%关税。 听起来,2000亿美元数目巨大,我们来算笔账。 2000亿美元,按现在人民币汇率

最新文章

  • 好想去听张惠妹演唱会啊!

  • 编辑 | 门牙少女虽然真的有永远的经典,但你听多了,终究还是会听到麻木无感的那天。有人想到一种延续,就是在原版沉寂多年之后,再次写下续篇。有一点熟悉,有一点陌生,记忆的“冷饭
  • “现在看来,中国领先美国几步”

  • 香港亚洲时报网站4月11日刊登题为《中国在新冷战的经济博弈中超过美国》的文章,作者是威廉·佩塞克。全文摘编如下: 如果你把全球经济想象成一盘大棋,中国现在看来已经领先美国
  • 离谱!两高中生用AI生成裸照,疯狂「变现」

  • 新智元报道 编辑:拉燕【新智元导读】生成式AI火了以后,限制输出内容的就只剩人们的想象力了。这不,两个高中生用AI生成裸照,疯狂在道德的底线游走。生成式AI爆火之后,人们发现
  • 为什么德国从来不缺技工?深度分析!

  • 士尼战略认为,一个理想的团队,必须有以下三种角色:思想者、批评者和实干者。思想者只管天马行空畅想,思考战略,提出各种建议,哪怕不切实际;批评者专门做挑剔性的工作,从不同的角度审