服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

GPT-4来了:更强大的对话能力之外,还能创造哪些奇迹?

日期: 来源:赛先生收集编辑:药明康德

图源:mikemacmarketing, CC BY 2.0, via Wikimedia Commons

导读:

美国东部时间3月14日周二,OpenAI 公司推出GPT-4模型,延续了ChatGPT问世时的火爆,甚至更令人期待。它不仅展现出了更为强大的语言对话能力,超强的标准考试能力,甚至可以在短时间内编小游戏,而且“胡说八道”的频率也降低了。

OpenAI 表示,目前与多家公司合作,要将 GPT-4 结合到他们的产品中,包括 Duolingo、Stripe 和可汗学院。GPT-4 模型也将以 API 的形式,提供给付费版 ChatGPT Plus 的订阅用户。开发者可以注册,用它打造应用或开发产品。

“比上一代的ChatGPT还要强大500倍”的GPT-4,你不能不去关注。


就在今天,我们或许见证了一个新时代的到来。

延续多个月前ChatGPT的爆火,OpenAI公司于今日推出了新的里程碑——GPT-4。或许用社交媒体上刷屏的一张图,能快速看懂它的强大实力:尽管先前的ChatGPT已能通过律师资格考试,但分数只能说是勉强合格。而如今,GPT-4的得分已能超越90%的人类,可谓彻底进化出了精英的水平。即便申请顶尖名校,它的成绩也完全够格。

在一些标准化考试中,GPT-4的成绩已达到顶尖人类水平。图源:参考资料[1]

在新闻中,OpenAI自豪地说道,GPT-4“在多种职业和学术标准上”,表现已经达到了人类水平。他们尤其强调,越是复杂的任务,越能彰显出GPT-4的实力。如果只是普通的对话,ChatGPT先前使用的GPT-3.5模型与之相差不大。但在更为进阶的领域,我们可以看到两者的巨大区别。比如在一些标准化的考试中,GPT-4的水平有着极大提升,成绩位于最顶尖的20%之列。

有人感叹,GPT-4或许带来了应试教育的终结。图片来源:参考资料[1]

它在语言上也有极大的突破。先前,许多类似的人工智能工具都有些偏科,在使用英文时表现很好,使用其他语言时则表现大打折扣。在GPT-4中,这一瓶颈得到了很好的突破。OpenAI一共测试了26种不同的语言,GPT-4在其中24种语言上的表现要优于GPT-3.5在英语上的表现。换句话说,如果先前ChatGPT在英语对话中的表现曾让你感到惊艳,那么你可以期待在应用新的GPT-4模型后,在使用其他语言上也可以得到类似,甚至更好的体验。

GPT-4在24种语言的表现上,水平都超过了GPT-3.5在英语中的表现。图源:参考资料[1]

GPT-4的另外一大亮点在于不仅可以接受文字中的信息,还可以理解图片。甚至在理解图片的过程中,顺便也理解了人类的幽默感。比如在一张图中,它不仅回答了每一张图里有什么物件,还指出其荒诞之处在于将一个过时的VGA连接器插到了一个智能手机的充电槽中。在另一张图里,它也能理解在“移动的出租车上熨烫衣服”是一件很不寻常的事。

GPT-4学会了看图说话,还学会了在图中寻找幽默的亮点。图源:参考资料[1]

它的读图能力不仅能用于理解幽默,还可以用于进行更学术的应用。比如在提供一张柱状图时,它可以从中抓取关键信息,做出总结并进行进一步的计算分析;而当提供一些论文的截图时,它也能精炼其中的要点,并解释论文图片里的多个不同步骤。

GPT-4的读图能力也能用于更正经的用途……图源:参考资料[1]

说到创造力,GPT-4也同样表现出色。比如它可以用26个单词总结《灰姑娘》的故事大概,而且每一个单词开始的字母都按A-Z的顺序,不带重复……

图源:参考资料[2]

说的废话更少……

图源:参考资料[2]

还有人宣称它的知识储备也更丰富……

GPT-3知识储备与CPT-4知识储备的对比。图源:Acquisition.com

尽管GPT-4在推出后的短短几个小时里凭借它的强大实力引爆了科技圈,它的开发者也指出其中的一些局限。比如尽管在答案的准确程度上有了明显提升,它有时依旧会“捏造事实”,因此在使用时需要人为进行事实的验证。《纽约时报》的一篇文章也指出,它擅长总结过去已经发生的事件,却难以和你探讨未来的无限可能。
正如OpenAI首席执行官Sam Altman先生总结的那样,GPT-4是其公司迄今为止最强大的模型。它和先前的模型相比,有更强大的创造力,在事实上把握得更准确,偏倚也更少。但它依然有缺点,有局限,在最初的几次使用后,新鲜感也会逐渐褪去。不过在这条消息下,更多人的留言反映了他们的看法:这是一个令人振奋的时刻。
当然,在这个人工智能时代,GPT-4也留给人们一个更大的问题:这个技术在未来会如何发展?又会给哪些人的生活带来颠覆?或许,只有时间才知道答案。
本文首发于微信公众号“药明康德”,《赛先生》获授权转载,
参考资料:
[1] GPT-4, Retrieved March 14, 2023, from https://openai.com/research/gpt-4
[2] GPT-4 is OpenAI’s most advanced system, producing safer and more useful responses, Retrieved March 14, 2023, from https://openai.com/product/gpt-4
[3] 10 Ways GPT-4 Is Impressive but Still Flawed, Retrieved March 14, 2023, from https://www.nytimes.com/2023/03/14/technology/openai-new-gpt4.html
[4] ChatGPT Changed Everything. Now Its Follow-Up Is Here. Retrieved March 14, 2023, from https://www.theatlantic.com/technology/archive/2023/03/gpt4-release-rumors-hype-future-iterations/673396/

欢迎关注我们,投稿、授权等请联系
saixiansheng@zhishifenzi.com

相关阅读

  • ChatGPT:你堂堂人类竟然抄袭我?

  • 来源:无限深海作者:蜉蝣采采 & ChatGPT作者 / 蜉蝣采采 & ChatGPT文章字数 / 3971阅读时长 / 不确定最近,ChatGPT火爆出圈,从推出发展到百万用户,只用了5天时间。这一成绩,曾经也
  • 《当代语言学》2022年总目录

  • 《当代语言学》2022年总目录>>>中国社科院语言所网信室编辑今日语言学 语言之妙 妙不可言 长按指纹,识别加关注
  • 必看!教育部发布新规定→

  • 教育部发布《信息技术产品国家通用语言文字使用管理规定》记者16日从教育部获悉,教育部日前发布《信息技术产品国家通用语言文字使用管理规定》,要求信息技术产品使用国家通用

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 考官喜欢的五种面试素材,你都知道吗?

  • 这几天国考出分了,陆陆续续有很多小伙伴开始准备面试了,不少同学给谈谈发来了灵魂疑问,“面试题已经很难了,素材储备有限,有没有素材的升级改造技法可以帮帮孩子?”其实,信息时代的
  • 你笑起来真好看

  • 陆鸿是个爱笑的人,如果你在厂子里碰到他,他总是乐呵呵的。开灯、检查气管、巡视车间,给设备擦擦灰、添添油,这些每天最基础的工作,他也是笑着完成的。其实小时候,他并没有这么爱笑