前言
本文以新的软件服务计算构架为名,实则深入地分析探讨了ChatGPT目前众多的关键性问题,包括:
•ChatGPT带来了从未有过的计算层次 -——虚拟人
•ChatGPT会带来的新的软件服务计算构架以及对社会的影响
•在人类语料知识用尽的时候,新的智能架构如何成长,如何吸收新的技能
•ChatGPT强泛化能力的来由,以及大模型能力涌现的原因
•ChatGPT一本正经胡说八道的原因和长、短期解决方案
•ChatGPT如何细化到垂直领域,比如法律领域。
•如何引导ChatGPT做你布置的任务,理解ChatGPT因果推理和模仿学习的原理。
本文并不是对已发表的大模型论文的技术总结,不是一篇综述文章,而是基于笔者自己的研究分析去探索这些问题的答案。希望能起到一个抛砖引玉的作用。
本文的第一节给出了一些铺垫性的背景知识,略显枯燥。熟知GPT技术的小伙伴们可以直接从第二节开始阅读。本文的写作跨度比较长,大部分的写作完成于OpenAI推出plugins功能之前,所以有少部分技术内容显得有些滞后了。
ChatGPT通过即时学习的能力记住了我教给它的新知识—中国2022年的人口总数,并在后面的人口列表中使用上了这个新知识。这是多么惊叹的一种能力!按照以往的范式,我们要改变模型存储的知识,需要用新数据在模型上进行多轮的训练。比如,往模型里增加中国2022年的人口总数这个事实,就是非常棘手的一件事情。因为我们不确定训练多少轮以后,模型才能够记住这个事实。而且,我们也不确定对这些新数据训练之后,是否会破坏模型中存储的其它知识。科研界目前也在努力解决这个问题,出现了一个新的研究方向,叫做neuralediting。但是大模型即时学习的能力实际上已经解决这个问题了,而且是用一种近乎完美的方式:一条指令,一步到位。
结束语
人类社会发展的车轮很难停止下来,不管我们愿意不愿意。这场ChatGPT引发的技术变革对人类来说到底是好事还是坏事,很难预料。但是这场大模型的竞赛最终会演变成国家之间生产力的对抗,所以我们不能输。我们必须做好中文的大模型,别无选择。
北大法宝人工智能研究院
北大法宝人工智能研究院一直致力于NLP、大数据、知识图谱技术在法律领域的探索与落地。在企业法律风险分析、类案检索、案例法规结构化、法律问答系统、智慧立法、智慧检查、法治调研、智能定罪量刑、企业合规、合同审查领域拥有丰富的模型与语料积累,并参与了多项国家十四五重大科技攻关项目,核心成员在TKDE、ISWC、AAAI等顶级会议和期刊中多次发表论文,并在CCKS、法研杯等比赛中屡获佳绩,团队同时进行着法律领域大模型的技术探索,在此欢迎各界人士就法律智能领域的实际问题进行咨询、试用、探讨与合作。
联系方式:
韩庐山 北大法宝智能研究院首席科学家hanlushan@chinalawinfo.com
杨灵敏 北大法宝市场营销总监
yanglm@chinalawinfo.com
北大法宝智能产品介绍:
-END-
点击下方公众号名片
获取更多信息