日期:
2023-03-18 21:40:45
来源:数智锐角收集 编辑:宛儿立秋
1、文心一言更大的战场在toB,更高的价值在场景。 2、企业数字化的核心区也是无人区,从数到智,AI大模型路径是“难而正确”的。 3、对生产力工具创新多一点宽容,利人利企利国利民。 昨天,百度文心一言正式发布。李彦宏分别演示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等方面的能力。 或许是文心一言前期造势给了观众过高的期待,或是与前脚刚GPT-4参加的成人基准考试(包括美国律师资格考试Uniform Bar Exam、法学院入学考试LSAT、“美国高考”SAT数学部分和证据性阅读与写作部分的考试,GPT-4的得分高于88%的应试者)相比太简单。OKfine,放下所有对比的事实,是百度在国内大厂里,领先一步发布生成式AI大模型的阶段成绩。不仅没有cheat任何人,还开放了文心一言接口(预约),发布会后的3小时内企业级API调用测试用户突破6.5亿。 而作为国内最先秀肌肉的大厂,文心一言的发布会还没开完百度股价就一度下跌10%,今开回升12%.....在笔者看来,昨天股价下跌现象,比文心一言本身的产品力更令人唏嘘。“枪打出头鸟”重点不在鸟,而在枪。讽刺的是,这看似是对大厂抱有近乎完美(拳打微软、脚踢谷歌)的高期待,但另一面往往是对养成系新事物的苛刻、急于求成对创新力的扼杀,结果就造成赢家通吃、输家恒输的恶性循环。GPT-4与文心一言,就是中国企业弯道超车的难度被人为拔高的典型世相。有“枪”如此,对于后起之秀的中国AI巨头们,实在不是什么好事。 说回百度。AI大模型的价值几何,不能只盯着文心一言vs GPT-4的极限较量,主要看它能解决企业数字化过程中哪些具体的问题。越有价值的问题、越高水平越低成本的解决,才是AI大模型在未来漫长的强人工智能时代值得角力的主战场。那么文心一言对大多数企业的价值在哪里?
数字化的下半场是什么?百度的答案是,行业知识的数字化、模型化 ,从而推动AI应用的规模化。强人工智能时代,大数据、大算力、大模型 “AI暴力美学”的价值须在场景中释放。 在前不久国务院发布的《数字中国整体建设布局规划》,主要是两大方向,一是夯实数字经济之技术底座,包括5G、云、AI、物联网等技术体系;二是推动新技术向各大产业渗透,如工业、农业、金融、教育、医疗、交通、能源等重点领域。 过去十余年间,数字化技术体系已发生了翻天覆地的革命,当下更为紧迫也更具价值的是数智技术向传统行业的渗透。这就涉及到一个长期遗留问题:传统行业数字化的难点是什么? 我们分别从企业视角 和AI技术视角 来分析。 从数字化终点看向现在,传统企业的数字化进度条太慢的其一原因在于,必须包含对原有业务流程的数字化改造,而与之相关的Know-how,却往往通过非语言形式存在、非数字化的方式传承。 在数字化终点,企业的一切重要资产都将以数字化形式存在,包括有形资产 的设备、产线、仓储、订单信息,也包括无形资产 的工艺、标准、经验等。目前,企业的有形资产通过物联网等基础设施进入数字化系统不难,但无形资产却大多游离在数字信息之外,它们缺少完整的文字信息载体,难以通过数字化平台来传递传承,更加无法在数字化全流程中方便的调用。但同时,这些行业Know-how又往往是企业最核心的资产,少了核心环节,那数字化就只能在外围打转。
制造企业的整体效益取决于产品能力和生产能力两大块,A产品 取决于前端设计对市场需求的洞察和实现;B生产 包括B1生产效率、B2良品率、B3故障风险 等,其中生产效率又取决于排产、工艺水平、人机协作等。对于每一个子项,数字化都还未全链打通, AI也就没有施展之地。文心一言要做的,不仅仅是全链路从0到1,首先是数据垦荒0到0.1。例如: A产品设计 ,数字化可以提供CAD等设计工具、消费者偏好等参数,但大部分无法将参数整合为需求洞察和迭代建议(少部分C2M制造商也仅实现了部分品类)。B1生产效率 中工艺的提升几乎存在于少数资深从业者的经验里,高度依赖老师傅的传帮带;
B2良品率 。一款合格的AI质检产品需要经过大量的前期训练,包括对瑕疵样本的学习、识别、推理,并保证可用度高于95%以上方能替代传统的人目质检方式。(目前虽有百度、联想、阿里等AI公司为行业客户提供不错的AI质检算法,但质检的行业和场景属性极强,数字化的质检的场景占总量比例不足30%,大量行业质检环节还搁置在数字化之外)。
因此,传统行业的数字化难点可提炼为:行业经验,缺少专业的“数字化翻译”;数据有了,但无法直达解决实际问题的AI应用。数据与算法,缺一不可。谁能解决行业经验数据化、提炼为模型化的难题,谁就是传统企业“最可爱的人”。 庆幸的是,这还算一道技术题,而挑战在于,AI技术公司无法独自完成这场从非语言到大模型的汤汤迁徙。不过仍然可以说,百度选择的行业化AI大模型,可能是一条难而正确的路。
在语言文本领域,百度可以从自有搜索引擎生态中完成数据来源、训练、推理、精调、及算力提供的闭环,到了在垂直行业,百度独自寸bit难行。 robin在发布会上说,构建产业级模型库,这些行业经验是百度所不擅长的。同时,将厚重的专业知识训练成AI模型,也是传统行业者所不具备的,既不经济也不现实。因此,有价值的AI行业大模型需要双方联手共创:企业将无形的行业经验为翻译为数据“原料”,大量的优质原料投入到百度AI训练框架中,大数据经过大算力“暴力烹饪”形成大模型。 补齐了这一短板,企业级数据资产的变现才有可能像GPT-4一样实现质的飞跃:预置了“高工级”知识图谱的AI模型,按照摩尔定律的训练速度,带来生产流程的提效、工具降本、风险预判、商机洞察等等。 与其说这是文心一言给传统行业、实体产业提供的机会,不如说是以百度为代表的AI公司与传统行业之间的“共谋” :抽取企业数字化过程中“天堑”的一环,以生态共创为桥,以AI模型为索,搭建企业从数字化基础设施到高阶AI应用的上升通路。数字化转型中的企业需要,百度更需要。目前,百度已经与国网、浦发等行业头部联合打造了能源电力、金融行业模型,产业级模型库已经开跑。模型即服务(MaaS,model as a service)也有望成为未来的新型整合式云计算提供方式。
当然,为了使之成为富有行业经验、达到专家水平的AI模型,需要借助一系列的训练技巧和工具。这就提到百度的技术基因。
百度智能云CTO王海峰提到,文心一言有多重方式实现 行业模型的精调 :一是有监督学习、二是人类反馈的精调、三是提示;此外,基于百度已经积累的5500亿条知识图谱,可以持续带动知识增强、检索增强、对话增强的正向飞轮。 其次,是百度智能云等“数字底座”的托举。 AI开发的四层框架:芯片层 框架层 模型层 应用层,百度均有布局,有全栈能力的协同优势,协同优势不仅体现在飞浆框架支撑下的算力集约、性能更强,另外“云智一体”也是一大特色,云平台与AI模型的原生耦合,让AI开发流程再提速。
目前,已有650家伙伴加入文心一言生态,无论是内容创作领域,还是产业级模型库,生态领跑具有“高筑墙、广积粮”的壁垒属性。 综上,文心一言是百度诸多优良基因杂交的结果,而长期主义者的预判、选择、坚持,需要周期和历史机遇来检验。阿里选择云,百度扎根AI,在数字化的长里程中,都有高光机会。 “无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”
总结一下,无论是GTP-4还是文心一言,就目前功能而言,本质还是AI生产力工具,未来,随着AI新摩尔定律的演进,同时伴随着一个个超级大脑的跨时空连通:跨学科、跨领域、跨地区知识的融合,连通为一片超级巨脑,这些AI生产力工具的生产力和生产效率都将指数级上升,这不可避免的要革掉一些职业的命,这个范围或将一扩再扩,白领们的职业门槛或将被迫水涨船高,彼时,GTP-X是否还只是一个生产力工具,今天还难有结论。 因此,与其杞AI忧天,不如坚定于看得见摸得着的数字化行动。当下更有价值的是,如何先人一步用好这些低成本的AI生产力工具,使其服务于数字化转型的商业目标中,或许才是百度们的初心。