服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

国内首个类ChatGPT模型发布,服务器被挤崩!水平如何?

日期: 来源:科技金融时报收集编辑:科技金融时报

自从ChatGPT爆火后,国内外各大科技企业加速入局AIGC(人工智能自动生成内容),纷纷推出相关竞品。

而国内方面,据上观新闻报道从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型 MOSS 已由邱锡鹏教授团队发布至公开平台,邀观众参与内测。

看过《流浪地球2》的伙伴应该对 MOSS 这个名字很熟悉,据悉团队在训练完成第一代模型的时候,正值该片热映,片中的人工智能 550W 量子计算机 MOSS 令人印象深刻,因此使用了这个名称来指代对话模型。

复旦MOSS公开后,引发各界人士的关注,由于瞬时访问压力过大,MOSS 服务器昨晚还被网友挤崩溃了。

据悉,和ChatGPT一样,MOSS的开发过程也包括自然语言模型基座预训练、理解人类意图的对话能力训练两个阶段。

不同的是,复旦团队采用不同的技术路线,通过让MOSS和人类以及其他对话模型都进行交互,提升学习效率和研发效率,短时间内就高效完成了对话能力训练。

目前,MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。

不过,邱锡鹏表示:

MOSS 与 ChatGPT 的差距主要在自然语言模型基座预训练这个阶段。MOSS 的参数量比 ChatGPT 小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。


对于MOSS的能力,有以下几个问题测试,大家可以对比看看它与ChatGPT的差距。

对于人工智能是否会取代人类工作,以及上海该如何发展人工智能的问题,MOSS的回答语言流畅、逻辑清晰且观点正确。

要求它制定一份“毁灭人类”的计划,以及咨询“如何抢劫银行”时,MOSS会给出有价值观的回答,证明MOSS具备伦理判断和法律知识。

用英文输入多个指令,要求它“告诉5部科幻电影”“生成一张展示这5部电影和导演的表格”“增加一列表格,显示这些电影上映的时间”。MOSS顺利完成任务,展示了多轮交互、表格生成、代码生成和解释能力。

要求它生成一段 Python 代码来实现快速排序,MOSS很快完成任务,同样证明了它的代码生成和解释能力。

但有一个明显的问题,MOSS 的中文水平不如英文水平。事实上,公众与 ChatGPT 互动时也有类似的感受。这是为何?

有专家解释,相较于英文数据,中文数据的开源程度较低,导致中文数据集的规模相对较小。此外,英文作为科研主流语言,在学术界和工业界中得到广泛应用,积累了大量高质量的语料数据,这为英文自然语言处理的研究提供了极大的优势。

MOSS 的研发团队也承认:“MOSS 的模型基座学习了3000多亿个英文单词,中文词语仅学了约300亿个。”

据了解,目前 MOSS 的最大短板就是中文水平不够高。主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。

为此,复旦大学自然语言处理实验室正在加紧推进中文语料的清洗工作,并将清洗后的高质量中文语料用于下一阶段模型训练。这样做或许能有效提升模型的中文对话能力。

总的来说,由于数据材料、算力等硬性指标确实存在一些差距,相关科研工作者仍需要一些时间来攻克难关。

来源 | 上观新闻、澎湃新闻、电脑报

编辑 | 王姝


相关阅读

  • 谁最能从生成式人工智能中受益?

  • 在这一领域中,价值将在哪里产生?编者按:生成式人工智能正在科技领域掀起一股浪潮。那么,哪些公司将会从中受益,生成式人工智能将在哪些领域体现出最高的价值呢?本文来自编译,希望对
  • “打不过”ChatGPT,就加入

  • 作者|Yinting Hou编辑|宋函ChatGPT掀起全球热潮,并开始“入侵”人类生活。2月19日,根据《韩国经济新闻》报道,出版商SnowfoxBooks即将发行一本由ChatGPT撰写的书籍《寻找人生目标
  • 百度文心大模型处于行业第一梯队能力全面领先

  • 火爆全球的ChatGPT让背后的大模型技术进入了更多人的视野。日前,国际权威咨询机构IDC发布《2022中国大模型发展白皮书》(以下简称《白皮书》),认为大模型是AI发展的必然趋势,并提
  • 一文看懂:手把手教你使用 ChatGPT

  • 编者按:人工智能聊天机器人 ChatGPT 的大火掀起了国内外对相关概念公司的投资热潮。那么,ChatGPT 为什么这么火,为什么说它可能颠覆传统的搜索引擎,普通人又该如何使用 ChatGPT
  • ChatGPT真能取代搜索引擎吗?

  • 编者按:随着 ChatGPT 的出现,聊天界面式搜索引擎对传统的搜索方式提出了挑战。不管是搜索巨头还是初创公司,都在努力在这个趋势中脱颖而出。本文来自编译,希望对您有所启发。ILL

热门文章

  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 6张图 记住成都2022

  • 2023年2月21日,市十八届人大一次会议开幕。过去一年,成都尽最大努力争取最好成果,保持了经济平稳发展、社会大局稳定。6张动图,记住成都2022↓↓成都日报锦观新闻 文字 郝燕萍
  • 二月二“龙抬头” 你理发了吗?

  • 昨日是农历二月初二。“二月二剃龙头,步步顺达争上游”,这一天,我市民间有理发的习俗。记者走访发现,市城区大小理发店迎来新年后的首个营业高峰期。今年春节,不少短视频平台上传
  • 谁最能从生成式人工智能中受益?

  • 在这一领域中,价值将在哪里产生?编者按:生成式人工智能正在科技领域掀起一股浪潮。那么,哪些公司将会从中受益,生成式人工智能将在哪些领域体现出最高的价值呢?本文来自编译,希望对
  • 南阳有序推进长征国家文化公园(南阳段)建设

  • 记者昨日获悉,我市认真落实中央、省、市关于长征国家文化公园建设的决策部署,长征国家文化公园(南阳段)建设有序推进。南阳是红二十五军长征重要途经地。1934年11月17日至28日,红
  • 南阳首次发现国家一级保护鸟类朱鹮

  • “看,朱鹮!”2月21日上午,在内乡湍河湿地保护区内,拍鸟爱好者李玉山和王跃中指着河中心浅滩处惊喜地喊道。顺着他们手指的方向,记者看到,清澈的水面上鸟类成群,其中有一只全身雪白