服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

ChatGPT全球赛开场,李彦宏已无退路,百度文心一言正式开始邀请测试!

日期: 来源:慧天地收集编辑:
点击上方“慧天地”关注
文章转载自微信公众号新智元,编辑:编辑部,版权归原作者及刊载媒体所有。

导读 ChatGPT全球赛,百度文心一言正式开始邀请测试!

ChatGPT国内赛,已有选手冲刺到终点了。

在全球大厂中,百度第一个做出了对标ChatGPT的AI产品——文心一言。

2023年3月14日,OpenAI忽然出人意料地官宣了多模态大模型GPT4.0,震惊全世界。

这个时间上的巧合,让人们对于文心一言的出场,更是期待值拉满了。


正式开启邀请测试


3月16日下午2点,万众瞩目的邀请测试展示如期召开。

一上来,李彦宏就直言,文心一言对标ChatGPT,但不能叫完美。但因为有市场需求,所有人都在等着百度发布这个技术。

文心一言有多强 ?

现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。


文学创作

首先,李彦宏就考验了文心一言《三体》作者是谁。(理由是大刘也是山西阳泉人,是他的老乡)

文心一言准确、详细地介绍了《三体》作者刘慈欣。


紧接着,文心一言总结了《三体》核心内容,条理分明地列出了3大点,并且还给出了5个续写的角度,下一个刘慈欣可能就是你了。


然后,对于「于和伟和张鲁一有哪些共同点」、「于和伟和张鲁一谁更高」这两个问题,文心一言基于推理能力得出了正确答案。

上下滑动查看全部

商业文案创作

在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。

在连续3次内容创作生成中,文心一言既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而发生的「智能涌现」。

上下滑动查看全部

李彦宏称,「这些训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。」


数理推算

那文心一言在完成数学推演及逻辑推理等复杂任务时的表现如何呢?让我们看看它会不会解鸡兔同笼问题。

下面演示可以看出,文心一言能理解题意,还有正确的解题思路,可以像学生做题一样,按正确的步骤,一步步算出正确答案。


中文理解

此外,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。

在现场展示中,文心一言正确解释了成语「洛阳纸贵」的含义、「洛阳纸贵」对应的经济学理论,还用「洛阳纸贵」四个字创作了一首藏头诗。

当然了,文心一言在英文理解方面能力还不是很好,因为训练数据比较少,这也是接下来文心一言要努力的方向。


多模态生成

在多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。

比如,让文心一言为2023世界智能交通大会创作一张海报。

还没等几秒钟,一张赛博风格的图片就生成了。


有趣的是,文心一言还能根据内容生成四川话等方言的语音。


这还不算什么,文心一言甚至还能将一段话生成视频。

然而由于视频生成能力成本较高,现阶段还未对所有用户开放。


但遗憾的是,这些都不是实时演示……


有大佬评论道,在GPT-4发布后的第一天,不论是谁发布类似的产品,似乎都变得索然无味了。



整体来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。

但目前还远未到发展完善的阶段,还有赖于通过真实的用户反馈而逐步迭代。


百度CTO王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。

它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

其中,前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。


李彦宏表示,「文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你『士别三日,当刮目相看』的惊喜。」

百度为什么是第一个?


全球大厂都在冲刺对标ChatGPT产品,为什么百度拿下了第一?

李彦宏的话,解答了我们的疑问:「无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。」

可以说,文心一言是百度过去多年努力的延续,百度早已在深度计算领域深耕多年。

早在2012年,百度就注意到了深度学习的风向。2013年,百度建立了中国第一个深度学习研究院(IDL)。

2016年,百度开源首个国产深度学习框架PaddlePaddle(飞桨),而飞桨是国内至今唯一能与TensorFlow 和 PyTorch两大主流框架正面交锋的深度学习框架。

目前,飞桨已经凝聚了535万开发者,创建了67万个模型,构建起一个繁荣的深度学习生态。


而2020年,当GPT-3出现后,百度就更加开始加注大模型。2021年,百度发布了百亿参数中英双语大模型PLATO-X、千亿参数大模型「鹏城-百度·文心」,2022年,又发布了知识增强大模型Ernie 3.0。

上下滑动查看全部

在研发上,百度也是毫不吝啬,在过去十年里的研发投入已经达到了1000亿。

其中核心研发投入占核心收入比例连续8个季度超过了20%。

据统计,百度在2020年的研发投入强度为18.22%,位列民营企业500强第一。2021年为20.03%,位列民营企业500强第二。


在本周一,微软特意在官博上自曝,自己耗资数亿美元,用了英伟达数万颗A100,才在Azure云服务中,造出了符合OpenAI要求的超级计算机。

同样,在AI国内赛中,云计算需求激增,而百度智能云也很早就开始在云上布局AI。

在2012年,百度就在李彦宏的老家山西阳泉建了一个计算中心,包含「冰山」冷存储服务器和X-MAN超级AI计算平台等自研计算系统,每秒可以完成2000万亿次深度神经网络计算。

而在2022年12月底,百度将其正式升级为「智算中心」,对外提供智算需求服务。现在,百度智算中心可以在千卡并行环境下可以实现加速比90%,做到单机群万卡规模,有效支持大规模训练场景,算力可达4EFLOPS。

据称,文心一言也是部分在阳泉中心计算的。

四层全栈布局

人类进入人工智能时代,IT技术的技术栈发生了根本性变化过去基本分为三层:芯片层,操作系统层和应用层。而现在可以分为四层:芯片层、框架层、模型层和应用层。

今天,百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。


文心一言的训练,离不开庞大的真实数据。

现在,ERNIE 3.0每天接受数十亿次用户的搜索请求,这让文心一言能够基于一个庞大的、高效的数据池,快速地学习和改进。

百度的搜索服务,每天响应几十亿次真实的用户使用需求,每天进行1万亿次深度语义推理与匹配,能够提供最真实、最及时的反馈,从而倒逼大模型、深度学习框架和芯片的优化。

就像百度昆仑芯片之所以在AI芯片中拥有领先的性能,正是因为它已经为百度的搜索服务优化了十年。


李彦宏描述道,大模型训练堪称暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。

而全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。

尤其是框架层和模型层之间很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。

事实上,超大规模模型的训练和推理,给深度学习框架带来了很大考验。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了 4D 混合并行技术。

另外,芯片、框架、大模型、和终端应用场景,可以形成一个高效的反馈闭环,帮助大模型不断去调优迭代,让用户体验不断升级。

李彦宏还特别强调,目前在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有,百度的优势非常独特,在后续文心的迭代速度上,我们应该会有明显感受。

文心一言如何定位?

百度认为,文心一言是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造巨大的商业价值。

它超强的自然语言理解和表达能力,可以让任何公司都有机会离自己的客户更近,去创建最好的客户体验。

自2月份百度官宣「文心一言」以来,已有超过650家企业宣布接入文心一言生态。

另外,文心一言对个人也会有巨大的改变。有机构预测,到2030年,人工智能可以将每一个知识工作者的生产力提高4倍以上。

很显然,我们中很多人的工作性质,会发生不可逆转的改变。

催生哪些新机会?

在李彦宏看来,生成式AI会催生新产品、新业态,乃至很多的创业和投资机会。

而对大部分企业来说,所谓的机会并不是从头做ChatGPT这类大模型,这既不现实,也不经济。

而真正的机会应该是,基于通用大语言模型,抢先开发重要的应用服务。

就好比移动互联网时代,最成功的商业产品不见得是安卓和IOS,而是基于安卓和IOS开发的微信、淘宝、抖音等应用。

李彦宏在现场预测到,大模型时代将产生三大产业机会。


第一类是新型云计算公司,主流商业模式从IaaS变为MaaS。

文心一言将根本性改变云计算行业的游戏规则。

以前,企业选择云厂商,更多看算力、存储等基础云服务。而在未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。

第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Know how,调用通用大模型能力,为行业客户提供解决方案。

而文心大模型,已经在电力、金融、媒体等领域,发布了10多个行业大模型。

第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。

今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,很可能就是未来的新巨头。

更多的杀手级应用、现象级产品、里程碑事件,即将诞生。

最后,李彦宏强调说,文心一言并不是中美科技对抗的工具,而是一代代百度技术人员追逐科技改变世界的梦想的产物,是百度服务亿万用户、赋能千行百业的全新平台,是创新驱动发展的最佳证明。


One More Thing

最后,是大家最关心的问题:怎么用上文心一言?

对此百度表示,3月16日起,首批用户将可通过邀请测试码在官网体验产品,后续会陆续开放更多名额。

企业方面,则可以通过搜索「百度智能云」进入官网,申请加入文心一言云服务测试。

直播结束后,科技圈掀起了狂欢,各类点评纷纷出现。

而巨头财经点评道——
GDP4.0和文心一言,完全是两种不同的外向气质。

一个是典型的美式英雄主义,一出场就是王炸完全的颠覆式创新,魔法级的技能让全球瞠目结舌;

一个是典型的中式实用主义,没有英雄,没有浪漫,很务实的市场需求理解,把十多年的积累组合升级,一点都不酷,还显得有点生涩。

我们渴望前者,我们习惯后者。
大家催来了文心一言,虽然不完美,也是一小步。

抗万钧之压,顶千夫之笑,走出这一小步,已经值得侧目。

参考资料:
https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=8117393980



荐读

武汉大学毛庆洲教授:国产高分辨率激光雷达及公铁隧基础设施测量应用

考研调剂 | 北建大测绘与城市空间信息学院2023年硕士研究生招生调剂咨询信息

关于我国测绘地理信息软件装备购买和使用情况的调研报告

《慧天地》敬告

《慧天地》公众号聚焦国内外时空信息科技前沿、行业发展动态、跨界融合趋势,发现企业核心竞争力,传播测绘地理信息文化,为相关专业学子提供日常学习、考研就业一站式服务,打造政产学研金服用精准对接的平台。

《慧天地》借鉴《读者》办刊理念,把时空信息领域的精华内容汇聚到平台上。我们高度重视版权,对于精选的每一篇推文,都会在文章开头显著注明出处,以表达对作者和推文引用平台版权的充分尊重和感谢;对于来源于网络作者不明的作品,转载时如出现侵权,请后台留言,我们会及时删除。感谢大家一直以来对《慧天地》的关注和支持!


——《慧天地》运营团队

投稿、转载、商务等合作请联系

微信号:huitiandi321

邮箱:[email protected]

编辑:吴春奇  审核:刘欣然
指导:万剑华教授

相关阅读

  • 久期全知道:久期上行

  • 01 公募基金久期跟踪公募基金久期上行。3月13日至3月17日,公募基金久期上行至2.56年,处于过去三年75%分位。02 招商固收-机构分歧指数机构分歧程度略有回落。3月13日至3月17日
  • 火爆的GPT-4对国产AI企业有哪些启发?

  • 本报记者 曲忠芳 李正豪 北京报道火爆全球的通用对话机器人ChatGPT,在上线仅三个半月后,迎来了新的“进化”。3月15日,美国人工智能公司OpenAI推出了大型多模态模型GPT-4。相比
  • 文心一言「起舞」,触发云战场「变天」

  • “云市场的一场新型战争要开始了。” 作者 | 何思思编辑 | 林觉民3月16日,百度 “文心一言”正式发布,基于百度智能云同步开放预约测试。近段时间,与文心一言一样火爆出圈的

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • “美欧掀起暴风骤雨,一股新风从中国吹来”

  • 打开手机听报纸,天下风云掌中看。您关心的全球大事,尽在《参考消息》。今日出版的《参考消息》数字报,五大看点不容错过。1.“美欧掀起暴风骤雨,一股新风从中国吹来”拉美社说,在
  • 中国在南海救助外籍货船,21人获救

  • 一外籍货船在南海发生故障 我国专业救助船出动成功救助21人记者3月17日从交通运输部获悉,交通运输部南海救助局近日成功救助一外籍货船,船上21名船员获救,目前遇险船已被拖救至
  • 乌方:计划与美方合作生产核燃料

  • 据俄罗斯卫星社报道,据乌克兰能源部发布消息称,乌方计划开始生产(用于核电站的)核燃料,将取代此前俄罗斯生产的核燃料。报道称,乌能源部在社交媒体平台“脸书”上发文称:“乌克兰将