服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

AI大牛周明发布MChat:生成可控,参数规模可负担,顺便官宣了新融资

日期: 来源:量子位收集编辑:关注前沿科技
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

大模型赛道又有融资新动态:

语言大模型玩家澜舟科技,刚刚完成了Pre-A+轮融资。

本轮融资由北京中关村科学城公司领投,斯道资本和创新工场跟投。这是澜舟科技1年内收获的第2轮融资,2轮累计总额数亿元。

不止于此。和融资消息一同公布的还有澜舟科技推出的语言生成模型,孟子MChat可控大模型

它有类ChatGPT的能力,加上原来澜舟科技孟子大模型N个项目功能引擎,最终呈现出来的MChat,既有对话能力,又具备翻译、生成、信息搜索等能力。

关于MChat,澜舟科技创始人兼CEO周明还作了如下介绍:

  • 将陆续推出10B和100B参数级的大模型;

  • 具备聊天、问答、翻译、文本生成、信息抽取等多种能力;

  • 可融合搜索结果、领域数据和知识图谱;

  • 对功能、风格、人类认知等方面具可控性。

孟子MChat可控大模型

本次融资是创新工场对澜舟科技的“继续跟投”。

创新工场董事长兼CEO李开复在3月14日的趋势分享会上谈到,AI已经来到从1.0迈入2.0的拐点。

顺着这个思路,MChat可以视为澜舟科技尝试从平台基础设施两个层面迈入AI 2.0时代的具体动作:

首先,发布迭代而来的孟子MChat可控大模型,视其为通用底座,提供语言预训练模型、多模态预训练模型、垂直领域预训练模型等能力。

其次,再在其上架构能力平台,提供知识图谱、辅助写作、机器翻译等模块化能力。

据周明介绍,团队走访了100多家公司,发现市场需求迥异。这种情况下,澜舟科技认为在更垂类的赛道做定向优化显得尤为重要。

也因此延伸出孟子大模型技术体系的特点之一,更多样化

具体而言,就是孟子支持BERT(分析类)、GPT(生成类)和T5(翻译类)等架构,能够覆盖阅读理解、文本生成、机器翻译、对话等不同场景。

值得注意的是,MChat虽然具有ChatGPT同样的对话能力,但两者有所不同。

ChatGPT尽可能将多模态数据纳入训练库,数据量越大越好,不甄别数据好坏;

而MChat强调“可控性”

一是功能可控,即根据具体需求加减可调用的具体功能;二是结果可控,保证输出内容的健康、良性。

“未来我们是想继续探索从AI 1.0到2.0到AGI,”周明说,“不过AGI有点太远,但下一步已经确定,就是从单语言扩展到更多的语言。”

选择在这个时间点进军AI 2.0时代,澜舟科技似乎地利不足,放眼大模型创业领域,千帆竞赛;但好处是已有诸多铺垫,且孟子轻量化模型的能力已经经过验证

MChat背后依托的孟子大模型,是澜舟科技自研技术研发的大规模预训练语言模型,于2021年7月推出。

可处理多语言、多模态数据,同时支持多种文本理解和文本生成任务,快速满足不同领域、不同应用场景的需求。

与追求打造AGI不同,基于Transformer架构的孟子,行进路线是轻量化——仅包含10亿参数。

靠这10亿参数,孟子大模型在中文语言理解领域最具权威性的测评基准CLUE上屡次刷榜第一,四两拨千斤,击败其他公司百亿甚至千亿的模型。

到具体的应用层面,同花顺、华夏基金为代表的金融领域,以及中文在线代表的文案写作领域,澜舟科技都以孟子大模型为底座提供了能力支撑。

NLP大牛周明

澜舟科技是以NLP技术为基础的认知智能公司,由AI大牛周明创办的公司,成立于2021年6月。

周明,当今NLP领域成就最高的华人之一,他不仅是中国第一个中英翻译系统的研制者,还在2019年成为AI语言领域最高级顶会ACL(国际计算语言协会)主席。

1991年在NLP重镇哈工大拿到博士学位后,周明进入清华任教;1999年被微软亚洲研究院创始院长李开复挖走,后来不久成为NLP研究组负责人。

2020年离开MSRA加盟创新工场担任首席科学家时,周明已担任MSRA副院长多年。

从工作21.5年的MSRA出走的原因,周明有些戏谑地解释:

“2020年年底,我隐隐约约感知到未来大模型要兴起,所以毅然决然离开微软,成立澜舟科技,专门从事大模型研究。”

据介绍,除了孟子大模型外,目前澜舟科技已经开源了近20个大模型

如果真如李开复所说,AI来到了从1.0过渡到2.0的拐点,这对NLP意味着什么?

周明一边提到,AI 2.0反映在NLP,能看到GPT这样的通用模型,一套模型解决很多问题,效率大幅提升;一边又提出了两个现象

一是AI 2.0时代的NLP能力足够强,在处理新任务时只需用一个提示词来代替它的能力;

二是模型大到一定程度时,会涌现新的能力,尤其是会迸发出一些从未见到过的能力。

他个人表示出对新能力涌现的格外关注,因为涌现这件事目前还是未解之谜,“唯一能启迪你的是在能力范围之内,尽量把模型做的比较大”。

ChatGPT身上的逻辑和思维能力,就是由GPT系列模型的大力出奇迹出品。既然如此,澜舟科技会不会也在模型参数上加码?

周明直截了当地回答,澜舟不会去追从千亿、万亿大模型

我们会尊重大模型,把模型做到相当大,但同时快速考虑它的落地。

关于大牛周明和他对大模型的最新思考,欢迎锁定3月29日量子位举办的中国AIGC产业峰会,周明博士已经确认出席并带来最新思考。

— 联系作者 —

3月29日「中国AIGC产业峰会」

抢票开启

「中国AIGC产业峰会」定档3月29日,线下会场抢票开启!

百度袁佛玉、智源林咏华、澜舟科技周明、小冰徐元春、科大讯飞高建清、启元世界袁泉、云舶科技梅嵩、特赞王喆、微软关玮雅、源码资本黄云刚、元语智能朱雷、无界Ai马千里、Tiamat青柑、峰瑞资本陈石等来自产学研界大咖嘉宾,还有重磅嘉宾陆续确认中。

扫描下方二维码,报名峰会线下会场啦~


点这里

相关阅读

  • 2022年国外军用对地观测卫星发展综述

  • 点击上方“慧天地”关注‍‍文章转载自微信公众号国际太空,来源:《国际太空》2023年第2期,作者:刘韬,责编:刘晓敏,监制:祁首冰,版权归原作者及刊载媒体所有。(NROL-87任务徽章)2022年,面
  • TKDE 2023 | 交叉学科项目申请书学科代码生成

  • ©PaperWeekly 原创 · 作者 | 肖濛单位 | 中国科学院计算机网络信息中心研究方向 | 文本分类摘要本文介绍来自中国科学院大学、中佛罗里达大学、澳门大学与香港科技大学 (广
  • Copilot:科技巨变的蝴蝶效应

  • 《侠说》:新电商,商业智能,房产/金融需要下载报告的朋友,可扫下方二维码付费成为会员,侠说智库已含2.7万+份报告,5100+会员,下载不限制,基本保存日更新。文末加微可免费入群交流~➤~
  • 【技术分享】如何利用API对AI发动攻击?

  • 前 言 现在机器学习即服务(Machine Learning as a Service,MLaaS)是非常热门的,很多大厂都把自己的模型开放作为其云平台的一项服务,国外的Google,Amazon,国内的Baidu,Face++等
  • 兰山区残联开展 “学业务 增能力”集中学习活动

  • 为深化作风建设,提升干部职工专业素质能力,3月20日,兰山区残联组织全体人员开展“学业务 增能力”集中学习活动。会议从出台背景、立法意义、主要内容、重点亮点四个方面对《中
  • 语言智能时代呼唤语言学理论创新

  •   ChatGPT等语言智能技术的出现与应用,对语言学、语言教学、写作、出版等领域带来了一定冲击,并引起了不少争议。随着技术公司的不断涌入以及全球用户的不断增加,各种支持和
  • 到2035年,烟台新增本地水供水能力3亿立方米

  • 大小新闻客户端3月21日讯(YMG全媒体记者 苗春雷 摄影报道) 今天上午,市政府新闻办召开《现代水网建设规划》新闻发布会。记者从发布会上了解到,到2035年,我市新增本地水供水能力3

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 一年节省几个亿,小红书秘籍对外公开

  • 集装箱,一个看起来没有多少技术含量的发明,却带来了标准化和系统化运输的创新,彻底改变了全球的货物贸易体系。如果说信息世界里有什么应用能够称得上“集装箱”式的创新变革,那
  • 黑土之声|地气 人气 烟火气

  • 春分时节,一半予春色,一半期美好。黑土地上地气升腾,绿意隐藏在草木的身体里,就等一场从南向北吹的风。三月是个聚人气的月份,全国两会刚刚胜利闭幕,亚布力论坛就盛妆启幕,各路大咖