服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

【安全圈】人美声甜 GPT,数学题哪里不会讲哪里

日期: 来源:安全圈收集编辑:


关键词

GPT

大模型的颠覆和变革,还只是开始。
ChatGPT作为一款引人瞩目的语言模型,通过重塑搜索、办公协同等多个场景和行业后,如今正将目光聚焦在在线教育领域,被认为是最重要的垂直场景之一。毕竟,大语言模型展现出的能力,正是在线教育和人工智能教师急需的。这一趋势已经开始,背靠大模型的在线教育应用已经在海外率先掀起了热潮。
看过来!让 GPT 化身二次元美少女 AI 家教来讲数学题的方案,每步都有解法,再不用担心看见参考答案的“略”字:
基础到某个三角函数的定义,复杂到不同的解题方法与技巧,都能得到答案:

近期在海外火爆的AI解题类应用,背后的App已经在App Store的教育分类板块刷榜。这种现象在情理之中,因为这些应用背靠大语言模型,并且采用了二次元画风,类似于《原神》这样的受欢迎游戏,成功地吸引了大量用户。这种现象真实地把握住了用户流量密码。

在此之前,主流的在线教育行业中的"AI家教",本质上只是推荐算法,换句话说,就是推荐预先录制好的教学视频或解题方法,无法对视频和方法中的某些细节给出解答。

而现在,大语言模型涌现的解题准确性和语言理解能力,开始突破之前难以实现的技术壁垒,不仅在线教育正在面临重塑,整个教育产业也在面临着深刻的变革。

背后技术原理:GPT + 在线教育 =?

在二次元美少女家教背后,实际上是大语言模型(LLM)在AI自动解题方面发挥着作用。基本的思路是在原有的解题流程的前后接入LLM,与原有流程中的可计算语言模型(CLM)形成联合模型(Joint Model)模式。

相较于其他AI模型,CLM在逻辑能力方面表现出色,但在语言理解和输出等方面相对较弱,尤其是在与包括GPT-4在内的大语言模型相比时显得不足。因此,联合模型模式的设计是让LLM提供自然语言处理(NLP)能力,而CLM提供逻辑推理能力。

这种联合模型的设计可以充分发挥大语言模型和可计算语言模型各自的优势,将其结合起来,从而在解题过程中既能处理语言理解的复杂性,又能进行逻辑推理,从而提高解题的准确性和效果。这种创新的解题方式有望对在线教育产生深远的影响,并推动整个教育产业的重塑。

也就是说,现在的整个 AI 解题的过程是这样的:
题干输入 ——LLM 处理文本 ——CLM 解题 ——LLM 形成文本 —— 讲解输出
在联合模型模式中,结合了LLM和CLM的优势,可以处理更复杂的推理任务,并在需要时收集相关数据。这使得AI家教能够更好地理解题干内容,并提供相应的讲解。

在接入LLM之前,这条AI解题流程还可以利用CLM,提供AI家教所需的数理逻辑和推理能力。CLM通过对文本信息进行数据升维,将一维的文字信息进行高维展开,让机器在同一时间接受文本背后诸如实体、关系、参数、知识等多维度的隐含信息,从而理解题干背后最终想要求解的内容。

同时,CLM还可以进行"部分不召回"的设定,即"不能保证100%做对的题,AI不会输出结果",从而保证AI家教的讲解和最终答案一定是正确的。这种设定可以提高解题的准确性,确保AI家教的输出结果是可靠和可信的。

这种综合应用LLM和CLM的联合模型模式,为AI家教提供了强大的语言理解和逻辑推理能力,从而使得在线教育在解题方面能够取得更为突出的成果,推动整个教育产业的重塑。
这也能解释为什么现在的 Joint Model 模式中,对 LLM 的应用重点在 NLP 领域,而非逻辑和推理能力上 ——
GPT-3.5 起,大模型毫无征兆地涌现出数理逻辑和推理能力,但它们既不稳定,也不绝对可靠,AI 家教无法在接入后直接落地使用。
与其执着于纠正 LLM 的“胡说八道”,不如转而重点利用它相对稳定发挥的 NLP 能力。

二次元美少女 AI 家教背后是谁

有趣的是,这位人工智能家教的背后依然是一家中国公司。


该公司名为悉之智能,成立于2017年,核心创始团队都来自中国清华大学和北京大学。


创始人兼CEO孙一乔,毕业于清华大学电子系,是2017届学生,在校期间参与了清华XLP超限学习团队的搭建,并深度参与了清华大学某院系课程体系的深度改革,带领数十人搭建了清华大学首个自适应学习引擎。


联合创始人兼CPO代佩霖,毕业于北京大学金融系,曾入选福布斯亚洲30岁以下30位杰出青年;算法合伙人林东生,也毕业于清华大学电子系,是悉之智能自研CLM背后的发明者之一。


几位合伙人从一开始就专注于AI教育行业中的自动解题领域。他们在进入市场时选择了一个好时机,成为国内第一家开发多模态解题家教产品的公司,并在成立次年成功获得了来自新东方旗下的“东方新创”1000万元的天使轮融资。到了2020年,公司已经完成了近亿元的A轮融资。

然而,到了2021年,公司也经历了双减政策带来的市场调整。幸运的是,在双减政策实施的同一月,公司仍然成功获得了2000万美元的A+轮融资,投资方包括了启明、经纬和真格等一线风投公司。然而,公司不得不将业务重心开始转向海外市场

当公司在新的市场站稳脚跟并开拓市场时,逻辑能力强大的ChatGPT突然出现,突破了业界的传统认知,也对他们原有的市场布局带来了冲击。
我们原本以为 AI 不会这么快出现逻辑能力。
公司低估了OpenAI在GPT系列上的进步以及GPT所展现出的强大能力。早些时候,谷歌使用了一个包含36B个LaTeX数据集的PaLM540B进行Fine-tuning,在MATH测试上取得了50分的成绩。而在同一测试集上,悉之智能在覆盖高中数学部分的CLM解题能力上得分约为70分。

"我们的得分比谷歌引以为傲的PaLM还要高,也高于市场上的Photomath等产品,甚至包括ChatGPT3.5最初的解题能力得分也低于我们。" 孙一乔边笑着复盘边挥舞胳膊,表现出他的兴奋之情。
结果 GPT-4 光速出现,出场即碾压所有玩家的解题能力。
孙一乔似乎对GPT-4的出现并不感到沮丧,反而很兴奋。他认为这只是OpenAI展示自己的方式,让全世界都为之惊叹,甚至连谷歌都吃惊得下巴掉了下来。在他看来,OpenAI正在领先全球,并且他们自家的AI能力也是为了在教育AI领域应用,这才是最重要的。

孙一乔平时很喜欢笑,熟悉他的人都这么说,尤其是在谈到GPT系列对传统带来颠覆性影响和可能性时。他对AI技术在教育领域的潜力非常看好,并且对自家公司在这一领域的表现充满自豪。他对教育AI行业的应用充满信心,对未来充满了积极的展望。
3 月底,欧盟批准谷歌收购了我们在国际市场上最大的竞争对手,也是传统解题公司的代表 ——PhotoMath。
孙一乔对于GPT和CLM的组合在解题能力上的突破感到兴奋。他指出,在一个GPT-4解题率为82%的测试集上,悉之最新fine-tuning的Joint Model的解题率已经达到92%。他解释说,Joint Model天然包含了大量解耦合良好的NLP任务,并且在最新的工作中,团队将之前基于Bert的CLM替换为fine-tuning后的GPT,将GPT作为预训练模型,将CLM作为逻辑校验模型,从而继续提高解题的上限。

这意味着,即使PhotoMath被谷歌收购,接入GPT-4及后续GPT系列API的可能性几乎为零,悉之智能团队依然能够通过GPT和CLM的组合在解题能力上取得突破。这些数据为孙一乔的乐观情绪提供了支持,他对悉之智能在教育AI领域的前景充满信心,并且愿意将团队的最新成果用于推动解题能力的进一步提升。
孙一乔还表示,LLM 不只提升 AI 家教背后模型的 NLP 能力,对多模态交互也有不少帮助。
现在的 AI 家教形象,比以前声音更好听,形象也更好看。在接下来的计划中,对话交互能力也将得到增强,在授课过程中随时提问,都能得到 AI 家教的解答。
计划中,旗下 AI 家教还会拓展数学之外的学科版图,也将开启新一轮的融资。
深陷双减风暴之后,教育底色的公司们都逐渐找到了新的打法。
改弦更张的,如新东方,在直播领域大杀四方;继续探索在线教育之路的,悉之智能利用 LLM 提升解题能力,优化多模态交互,据悉,猿辅导也已经用 AIGC 在传统教育领域寻找新的机会。
LLM 能力应用在教育领域后,不知道继续深耕在线教育的这些公司里,谁又是新一轮的最大赢家?



   END  

阅读推荐

【安全圈】苹果又又又 爆出 BUG,反复要求用户输入 Apple ID

【安全圈】中央有关部门组织编写国家安全读本 关注人工智能和数据安全

【安全圈】暗网丝绸之路黑客因数十亿美元的比特币欺诈被判刑


安全圈

←扫码关注我们

网罗圈内热点 专注网络安全

实时资讯一手掌握!

好看你就分享 有用就点个赞

支持「安全圈」就点个三连吧!

相关阅读

  • MiniGPT-4 ,开源了!

  • 公众号关注 “GitHubDaily”设为 “星标”,每天带你逛 GitHub!不知不觉,距 GPT-4 首次公开问世,已经过去一个月了。在这段时间,有不少人拿到了 GPT-4 API 权限,开通了 ChatGPT Plu
  • 钉钉巨变

  • 作者|桑明强微软Copilot刚发布没多久,中国协同办公玩家也不甘示弱,在阿里云通义千问面世一周后,钉钉也迅速推出了类Copilot能力。相信大家也看到了,在今天钉钉2023春季钉峰会上,钉
  • 这一轮,中国能赢美国么

  • 重要通知一个好消息,我们在知识星球开辟了第二战场【非凡油条】,有很多在公众号不方便说的东西、一些相对私密的个人见解(涉及经济、投资等)、一些财经方面的重要资料,我们都会发
  • 十堰市委党校:拓展教学理念 提升教学效果

  • 通讯员 张红霞4月17日,十堰市委党校科干班开展以“干部能力作风建设存在的问题和对策”为主题的结构化研讨,进一步提升学员对干部能力作风建设工作的认识。课堂上,学员们分为四

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 【安全圈】人美声甜 GPT,数学题哪里不会讲哪里

  • 关键词GPT大模型的颠覆和变革,还只是开始。ChatGPT作为一款引人瞩目的语言模型,通过重塑搜索、办公协同等多个场景和行业后,如今正将目光聚焦在在线教育领域,被认为是最重要的垂
  • 小米今晚的发布会,怎么像是在发布相机。。。

  • 也不知道小米是不是故意的,选在这个时间点召开发布会,这会儿其它厂商的超大杯旗舰基本都已经发布,自家的小米 13 Ultra 自然就成为了上半年压台登场的影像旗舰~但是不得不说,这