3月16日北京时间下午两点,百度的语言大模型文心一言发布会。这场发布会是大家期待已久的。自从去年ChatGPT火了之后,国内各大公司都在努力开发自己的语言类大模型,而百度作为一个在人工智能领域耕耘多年的科技公司,是最被大家期待的。
期待归期待,大家也主要想看看百度到底能弄出什么程度的大模型。在这次发布会开始前就已经流传了很多段子,什么百度员工赶在发布会之前抛售股票,文心一言其实背后是真人回复等等。。。
这些传言就很离谱。这次发布会之后,不攻自破。
谣言一:文心一言背后都是真人回复
你看人家压根没有现场演示,吸取了Google发布会的教训,直接全是录屏。
而相对于昨天的 GPT-4 发布会就是很简单的直接上机演示,之前 Google 哪怕翻车了也是因为实时演示翻车的,录屏?说实话,谁知道你这个东西是真是假?
朴素的GPT-4的发布会,一个人一台电脑。
文心发布会,超宽大屏,录屏演示,
谣言二:百度员工抛售股票
至于那个传言百度员工在发布会之前抛售股票的,我想说
真是聪明啊,今天做空百度的都赚翻了吧。
下午港股最高跌幅10个点,截止到这篇文章发布,也有7个点的跌幅。
文心一言的五大功能亮点
今天对外展示的五个案例分别是:文学创作,商业文案创作,数理逻辑推算,中文理解,多模态生成。
文学创作
现场演示的录屏里没有完整的可以称之为文学的东西,大部分的问题都是可以通过搜索得到的答案,你管三体作者哪里人这种问题叫文学创作?GPT系列好歹能写个诗歌,寓言故事什么的,之前的Bing甚至能写故事内涵人。
商业文案创作
数理逻辑推算
这里给出了一个鸡兔同笼的问题,在录屏的前提下,演示的过程还出了问题,也不只是是不是故意展示自己的真实性。
中文理解
中文理解这个部分是我觉得是唯一能好于GPT的,这个得益于百度的中文语料库。
多模态生成
百度展示的多模态一共有四种,一种是生成海报,这个结合了文生图,一种是结合语音生成,还有就是直接内容生成视频。
这些技术之前都有,确实没有结合到大语言模型中去,其中演示的直接生成视频还是挺炫酷的。但是这个“多模态” 跟昨天 GPT-4 的多模态好像不太一样,GPT-4 的多模态是让只会说话只能识字的聊天机器人有了眼睛,能看见能理解了。但是百度这个 “多模态” 更像是之前技术的缝合怪。就拿一键生成视频这个,各大的视频编辑工具也都有这个功能了,生成视频里的内容也不是真的内容生成,而且自动进行内容拼接更为准确。
而且最关键的是,这些都是录屏,演示看起来都非常快,但是实际的生成速度呢?是否到达了可以落地的程度?李彦宏也说了,最后一个生成视频目前还不开放给用户。
优势:百度是中国AIGC大模型的希望么?
其实目前国内确实很需要一个这样的公司来做大模型,因为 openai的GPT不开源,而未来AIGC对产业的革新又迫在眉睫,百度在产业生态的完善上确实是最好的。
但是大力是否真的能出奇迹,这个真的不好说。目前国内做语言大模型的除了百度还有 复旦的 MOSS,西湖心辰的 Friday,还有 MiniMax 的 Inspo。这些大模型在未来哪家会统一国内的市场还需要给他们一点时间。
附录:
百度文心一言官网:https://yiyan.baidu.com/welcome 目前需要邀请码才能用。
复旦Moss:https://moss.fastnlp.top/#/ 目前停止服务升级中
西湖心辰 Friday:https://www.heyfriday.cn/home
MiniMax 的 Inspo:https://inspo.vip/
最后因为需要邀请码才能用,今天又是周四坊间开始流传着这么一个段子:
希望未来的产品发布会不要成为段子。