服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

GPT-4偷袭发布!ChatGPT能识图和逻辑推理,靠自己考上斯坦福【附发布会中英文字幕版】

日期: 来源:物联网智库收集编辑:

物联网智库 整理发布


导读

今日凌晨1点,OpenAI正式推出GPT-4。


一觉醒来,GPT-4突然间就来了,而这距离ChatGPT的发布,才仅仅过去了四个多月。

此前,曾传闻GPT-4有100万亿参数,比现在的ChatGPT强大500多倍,不过这一说法很快被辟谣。近日,OpenAI的CTO曾经对媒体表示,让大家“少一些关于GPT-4的炒作会更好”,而从今天发布的GPT-4来看,这句话多少带点欲扬先抑的意味。在发布的博文中,OpenAI这样表示:

GPT-4是OpenAI努力扩展深度学习的最新里程碑,它是一个大型多模态模型(接受图像和文本输入,提供文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平。

GPT-4都强在哪里


加入图片识别功能
和外界此前的猜测一样,GPT-4是一个多模态大型语言模型,不再仅仅处理文本数据,对图片也有了理解能力。但相比于此前各大科技公司推出的多模态模型,GPT-4可以说是遥遥领先。虽然官方表示,GPT-4现在只开放了文字输入的功能,图片输入功能还在加紧开发中。但在官方的文章中,OpenAI给出了几个使用范例,如说明图片的内容、分析图表、解答图片内的考题、找出图片不寻常的原因等,已经让人大开眼界。


在OpenAI官方发布的视频中,GPT-4通过识别上图中随便画出的草图,就识别出了这是一个关于网站的草图,然后“顺手”生成了建成这个网页的全部代码,再然后...一个网站就这样建成了。


强大的推理能力

还有一个官方示例也值得一提,当被问到下图的笑点在哪里时,GPT-4的回答更是让人惊叹:“这张图片中的幽默来自于将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法”,从这一回答中可以看出,GPT-4所具备的推理能力已经有了大幅度提高。


一直以来,人工智能虽然表现出了强大的能力,但逻辑推理依然是人类区别于AI的最显著特征,而GPT-4表现出的逻辑和推理能力,需要所有人开始重新思考人类区别于AI的本质到底是什么。


支持更长的输入和输出
相比于ChatGPT,GPT-4可接受的文字输入长度增加到3.2万个Token,约2.4万单词,同时也支持更长的输出,大约能处理长达25000字的文本,这使得更多的应用场景变为可能,例如长文本的创建、超长对话和文档的搜寻和分析等,仅需一次对话,就足够写一部剧本或者短篇小说了


考试能力超过90%人类
对于GPT-4来说,最强的并不是视觉能力的加入,因为很多的多模态模型早就已经做出了类似的功能,其最亮眼的功能是它所表现出的推理能力,在GRE、SAT和美国法学院考试等我们较为熟悉的美国考试中,GPT-4的得分几乎和人类考生没有区别了,其中,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。在GRE考试中的数学部分,满分是170分,GPT-4获得163分,而上一代GPT-3.5得分为147分,在GRE语言部分,GPT-4得分为169分,GPT-3.5得分为154分。

也就是说,GPT-4已经可以靠自己考上斯坦福大学。

从下图中也可以看出,GPT-4相比于GPT-3.5,在多项专业考试中都有了巨大的提升(绿色部分为GPT-4提升的部分)。不过,OpenAI官方也警告说,新版本还不完美,在许多情况下,它的能力不如人类。


支持更多语言
许多现有的机器翻译的基准测试都是用英语编写的。而为了初步了解 GPT-4 在其他语言上的能力,OpenAI的研究团队还使用Azure Translate将MMLU基准翻译成多种语言,这套基准涵盖了57个主题的14000个多项选择题 ,在测试的26种语言的24种中,GPT-4全部优于GPT-3.5和其他大语言模型。


以上这些也仅仅只是OpenAI官方示例的一小部分,OpenAI的总裁和联合创始人还展示了GPT-4有关总结文章、写代码、报税、写诗等一系列能,可以说GPT-3.5做不到的, GPT-4大都可以轻松解决。

微软新必应早已用上GPT-4


GPT-4发布之后,微软在第一时间表示:“如果你在过去五周内的任何时候使用过新的 Bing 预览版,你就已经提前了解了 OpenAI 最新模型的强大功能”。是的,新版必应搜索早已经用上了GPT-4,在过去五周中,很多人体验的必应就是GPT-4加强过的,只不过仅仅开放使用了文字能力而已。虽然微软没有用全球首发的字眼来描述,毕竟微软在OpenAPI上已经投入了130亿美元(约合人民币900亿元),换来的这样的待遇也是情理之中。


在搜索上,微软的必应长期以来都无法跟谷歌相竞争,市场份额更是差了一个量级,但是随着ChatGPT的问世,微软率先接入使用,CEO纳德拉表示他们的搜索已经优于谷歌了。而这次GPT-4也被曝用在了必应搜索中,不知道谷歌方面是否依然还能“坐怀不乱”。

可以说,微软是ChatGPT和GPT-4的最大赢家。在过去的两年里,OpenAI重建了整个深度学习堆栈,并利用微软的Azure设计了一台超级计算机,以便于应对他们超高的工作负载,通过此前获得的经验,GPT-4才能快速而稳定的完成了GPT-4的训练,也为微软的云服务赢得了更多的业务。

如何才能用上GPT-4


目前,如果想要体验GPT-4的强大功能,有三种方式可以选择:

1.花费每月20美元订阅ChatGPT Plus直接体验
地址:https://chat.openai.com/chat

2.加入等候列表排队申请内测,等待API开放
地址:https://openai.com/waitlist/gpt-4-api

3.申请加入开源的OpenAI Evals,共同参与改进GPT-4的效果
地址:github.com/openai/evals

同时,OpenAI表示已经与许多公司进行了深度合作,将GPT-4并入它们的产品中,包括Duolingo,Stripe,Khan Academy等,有科学上网方式的用户,未来也可以在更多的产品中直接体验到GPT-4。当前,使用GPT-4的定价是每1k prompt tokens 0.03美元,每1k completion tokens 0.06美元,默认速率限制在每分钟40k tokens和每分钟200个请求,价格虽然有所上升,但相比于ChatGPT来说,返回文本的速度也有了大幅度提高

此外,OpenAI表示, 在比较简单的对话中,GPT-4的表现和之前的ChatGPT相比不会差太多,但在复杂的问题上,答案的合理性、正确性等方面都更加优秀。因为GPT-4至少经过了6个月的“安全训练”,目前相比于GPT-3.5,有82%的可能性不会对不允许的内容进行回应,40%的可能性会提供基于事实的回应。也就是说,相比于此前对于某些问题一本正经的胡说八道,GPT-4“幻想”出来的内容的少了很多,但依然有可能会出现。因此,强烈建议在使用GPT-4的服务时,如果是重要性较高的内容,最好还是把GPT-4作为辅助,同时加以人工校对。


写在最后


这次,OpenAI并没有公布具体模型大小的细节,也没有公布用来训练模型的硬件,理由是出于“竞争原因”。没有了数据、模型和算力的对外参考,OpenAI已经构建起了自己更宽更深的“护城河”能力,也侧面说明了新一轮的科技军备竞赛已经打响。

当国内各大企业还在抢发“中国版ChatGPT”的时候,GPT-4的突然发布,让复现GPT-3.5和ChatGPT的各类工作都在瞬间黯然失色。在这个时候,不仅谷歌等科技大厂需要思考为什么会落后于仅有三百多名员工的OpenAI,每个人也都需要思考未来的创新到底是什么样子。

3月16日,线上直播
探讨AIGC产业落地和应用

参考资料:
1.OpenAI官网

相关阅读

  • 温和复苏,久期加一点

  • 摘 要 1-2月供需整体情况:生产恢复快于需求,供需匹配情况不及去年12月。工业增加值、服务业生产指数两者加权同比增速4.3%。需投资、零售和出口三者加权同比2.8%。需求指数
  • 房地产终于回暖了 销售额增长3.5%!|檀几条

  • 文章一共2355字 预计阅读时间:7分钟明天投资必看的财经解读要闻解读1 房地产终于回暖了 销售额增长3.5%国家统计局3月15日讯,1—2月份,全国房地产开发投资13669亿元,同比下
  • 微软3月补丁星期二值得关注的漏洞

  • 聚焦源代码安全,网罗国内外最新资讯!编译:代码卫士微软3月补丁星期二共修复了83个漏洞,其中2个是0day,9个被评级为“严重”。这些漏洞包括:21个提权漏洞2个安全特性绕过漏洞27个

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 315 从我做起,近期不赎债基和理财

  • 今天好多人问我怎么写日评。。实话说我也不知道今天怎么写日评。。但是还是简单唠唠吧,不然明天大家怎么讲晨会呢是吧海外最近我放弃了,这一天天的波动就整一个无语,等周末回过
  • 中国的制造业供应链核心地位被动摇?

  • 资料来源:中国电子报等物联网智库 整理发布导读“世界工厂2.0”和“亚洲替代供应链”,都是为了字面上弱化中国在全球供应链中的核心位置玩出的文字游戏。如果询问制造业从业者
  • 当我们在聊“智慧工业”时,我们到底在说什么?

  • 来源:美的楼宇科技物联网智库 转载导读可以说,利用各种感应设备、数字孪生、云平台、5G通讯和软件集成,打造的新型工业,让制造业的未来发展呈现出了更多的可能性,当然,在碳中和时