服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

张勇带队,阿里朝大模型开了一枪

日期: 来源:21世纪商业评论收集编辑:21世纪商业评论





记者丨何己派 鄢子为 编辑丨鄢子为


“所有产品都值得用大模型重做一遍。”台上的张勇,语气笃定。


4月11日的阿里云峰会,张勇来了,一起亮相的,还有他的新身份。


这是他兼任阿里云智能集团CEO的第15天。


40分钟的演讲,张勇反复提及“人工智能”这个关键词。


他透露,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。


业务重塑,阿里云打响关键的一枪。


高调参战


人实在太多了。


可容纳几千人的会场,几乎没有空位。张勇演讲的半途,工作人员不得不临时增加了几列座椅。


所有人关注的重头戏,是阿里大模型的进展。


几日前,阿里突然上线“通义千问”,与ChatGPT类似,它是达摩院自研的超大规模语言模型,能回答问题、创作文字,表达观点、撰写代码。


《21CBR》记者使用邀请码,体验了多轮对话。


在功能上,它能生成散文、故事、文案等各种类型文本,做简单的数学题,也能编写代码。此外,对“鸡娃”等中文语境的词句,也有不错的理解。


阿里云智能CTO周靖人特别提到,通义千问还具备多语言能力,可以使用英语、法语等语言进行交流。


不过,它并不支持文生图、图生文等多模态功能。


对记者“是否能生成图像”的提问,通义千问的回答列举了OpenAI的GPT-3、DALL-E等工具,表示自己并不具备这个能力,“只能提供算法和模型,不能直接生成图像。”


不同于百度、360在现场演示对话,通义千问主要以周靖人的PPT展示+三个视频介绍来展现具体功能。


现阶段,该模型主要定向邀请企业用户测试,尚未向公众开放。


一位行业人士向《21CBR》记者分析称,阿里云没有直接推C端产品,而是先从企业级别开始,在于企业更容易接受新技术,且企业级别的应用场景更复杂,需要更高级别的技术支持。


在深度科技研究院院长张孝荣看来,阿里采取了谨慎务实的策略。


“GPT模型最先进,但出现不少bug。阿里云大模型技术完善度有限,面向企业市场测试,在舆论层面比面向大众安全,阿里云也可提早定位潜在客户。”


中间形态


负责研发迭代大模型的,是周靖人团队。


周在微软工作多年,于2016年加入阿里,曾负责阿里云、淘宝和支付宝的搜索、推荐等业务。


周靖人表示,不是来凑热闹。“我们在这方面一直在积累,是国内最早探索大模型方向的公司之一。”


在他眼里,“通义千问”是一个中间态产品。“千问是我们既定路线上的一个节点。”


换言之,在阿里,这是一个承上启下、持续发展的大模型。


要训练出GPT-3.5这样的大模型,至少需要1万张英伟达A100的芯片集群,光硬件投入就需要20亿元。


只有大厂,才拥有这个硬件实力。


近日传出的一份交流纪要里,阿里云AI专家提到,阿里云在云上就有上万片的A100,整体能够达到10万片,集团体量应该是阿里云的5倍。


大规模应用,成本也高。“ChatGPT完成一个推理任务,需要5张A100在2秒钟之内做一次推理。”上述AI专家提到。


数据方面,阿里在电商、搜索、办公领域,有相应积累。算法方面,达摩院在NLP领域深耕多年,较早就确定了多模态方向。


达摩院于2019年启动大模型研发,2021年4月,发布语言大模型“PLUG”;2021年10月,训练出多模态M6大模型,参数规模10万亿。2022年9月,阿里发布“通义”大模型;今年4月,通义千问发布。


国盛证券分析师刘高畅测评后指出,通义千问具备基础常识与初步的逻辑思考能力,有代码书写能力,但在复杂理科计算方面仍有提升空间。


“当前未能达到GPT4的水平,但处于国内领军水平。”他评论道。


周靖人也承认,“GPT4,目前是非常领先的。”


阿里将在多模态大模型的路径上继续探索。


“难的是把各个模态的模型能力融入进一个模型,比如怎么把视觉能力融入到语言模型里面。”


周靖人表示,就像大脑可以把视觉、语言、听觉等不同形式的输入联合在一起。


他还期待,企业能把通义千问作为底座,在上面进行额外的开发,走进各行各业的场景里去。


走向产业


去年底,张勇亲自接管阿里云。他对大模型的重视,非同一般。


有消息称,张勇尽管忙着重组集团业务部门,但会亲自盯阿里云的AI项目。


他格外关注AI与场景的结合落地。


2月底的财报电话会议上,张勇提到,“最重要的,不是大家拥有了一个对话式的机器人,而是如何将它融合在各自的业务场景中。”


未来,阿里巴巴所有产品都将接入大模型,率先接入测试的钉钉、天猫精灵,将在评估认证后正式发布新功能。


钉钉能实现自动写工作方案、生成应用等功能,天猫精灵接入通义千问后,回答水平提升。


淘宝天猫的电商业务,也有大量场景适合大模型切入。例如,以文搜图、智能客服、卖点文案生成等。


接下来,通义千问将嵌入阿里电商、搜索、导航、文娱等场景。


AI大模型的商业落地,还在于开放API接口,按调用次数收费,这也是国外主流的商业模式。


“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每家企业打造自己的专属大模型。”周靖人表示,每个企业都可以有自己的智能客服、文案助手、AI设计师等。


前景美好,挑战也多。


大模型开发和训练一次的成本,介于200万美元至1200万美元之间,相当昂贵。


刚经历拆分的阿里,各业务单元独立经营、自负盈亏,大模型相关的成本开支,压力不小。


行业来看,距离普惠化、规模化应用,大模型还需要走很长一段路。


天使投资人、互联网专家郭涛向《21CBR》记者表示,“AI大模型产业尚处于早期探索阶段,存在关键核心技术发展不成熟、算法模型不完善、训练数据缺乏及偏差、产业生态体系不健全等突出问题。”


问题多,机会更多。


张勇认为,智能化时代,大家都站在同一条起跑线上。


相关阅读

  • 小体鉴宝 | 他曾站在大地上飞翔

  • 62年前苏联宇航员尤里·加加林成功完成了世界上首次载人航天飞行标志着人类终于开启了对未知宇宙的探索为纪念人类首飞太空50周年表达对维护和平发展的愿望2011年4月7日第65
  • 阿里农牧民群众:吃上“旅游饭” 日子更红火

  • 近年来,阿里地区结合实际和旅游资源特点、地域文化特色,坚持“打好特色牌、走好高端路、建好精品区、唱好全域戏”的发展路径,在树品牌、强服务等方面发力,并将农牧民的生产生活
  • 华尔街最新投资中国地图

  • “许多人误解了科技行业监管想要达到的目标”。对于投资者来说,就算没有直接投资中国,也无法完全忽视中国。最有可能出现在投资组合里的美国大公司要么向中国消费者销售产品—
  • 从Google TPU v4看AI芯片的未来

  • 上周,谷歌在论文预印本平台arxiv上发表了其关于TPU v4的深入解读论文《TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support fo
  • 计算机ETF(512720)、软件ETF(515230)异动解读

  • 周一(4月10日),大盘高开后全天震荡下滑。盘面上,TMT行业呈现集体杀跌行情,央企改革主题穿插性上涨,高低切换下新能源、基建等板块走强。截至收盘,上证指数跌0.37%报3315.36点,终结6

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 张勇带队,阿里朝大模型开了一枪

  • 记者丨何己派 鄢子为 编辑丨鄢子为“所有产品都值得用大模型重做一遍。”台上的张勇,语气笃定。4月11日的阿里云峰会,张勇来了,一起亮相的,还有他的新身份。这是他兼任阿里云智
  • 黑龙江省“云签发”首份出口检验检疫证书

  • 哈尔滨海关关员指导企业运用“云签发”模式申领检验检疫证书。 哈尔滨海关供图  中新网哈尔滨4月11日电(于磊 李奡 记者姜辉)11日,哈尔滨海关发布信息,哈尔滨海关所属绥芬