服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

OpenAI不藏着了,开放微调功能

日期: 来源:品玩收集编辑:品玩

8月23日,OpenAI宣布推出基于GPT-3.5 Turbo的微调功能并更新API,让企业、开发人员能够使用自身数据定制ChatGPT。

微调(Fine-tuning)是一种利用已有通用语言模型(如GPT-3.5)来训练一个特定模型的方法。通用语言模型虽然具有很强的语言理解和生成能力,但是它们并不针对特定的领域或任务。通过在自己数据上对通用模型进行微调优化,训练一个专属模型,可以更好地适应特定的使用场景。在保留通用语言模型强大能力的同时,进一步提高模型的准确度等效果和效率。

这就相当于在一个已经建好的房子上进行装修,使其更符合自己的需求和喜好,而不是从头开始建造一个新房子。因此,可以节省大量时间和资源,也可以避免一些技术难题。

OpenAI此次推出的微调功能,使更多开发者能参与到GPT模型应用当中,并借此实现更多个性化和创新的应用场景,提高用户体验和粘性,这对开发者生态的建立也起到了积极的助推作用。同时也极大拓展了通用模型的应用范围和潜力,加快了各行各业部署AI技术的步伐。

对于此次公告中提到的GPT-3.5 Turbo微调的安全性、使用效果、价格、未来更新、部署步骤等方面,重点说明如下。

安全性:从微调API发送的数据归客户所有,OpenAI或任何其他组织不会使用数据来训练模型。同时,为了保障模型部署的安全,OpenAI通过审核API和GPT-4驱动的审核系统,检测与安全标准冲突的有害数据。(微调有利于为用户提供更具个性化的服务,但也降低了技术门槛,可能导致不负责任的使用)

微调效果:在实际测试过程中,GPT-3.5 Turbo的微调版本在某些任务上,与基本型号的GPT-4能力相当甚至要更好。微调客户能够提高常见用例的模型性能,并缩短提示时间。通过对模型本身的指令进行微调,还可加快API调用并降低成本,提示词数量减少了90%。

价格和Token:GPT-3.5 Turbo的微调成本分为初始训练成本和使用成本两部分。一个包含100K tokens训练文件的微调工作,预计成本为2.4美元。具体来说,训练:$0.008 / 1K tokens;使用输入:$0.012 / 1K tokens;使用输出:$0.016 / 1K tokens。可处理的上下文为4K tokens,是之前微调模型的两倍。

微调步骤:只需经过准备数据、上传文件、创建微调作业、使用微调模型四步。一旦模型完成微调过程,就可以立即在生产中使用。

未来更新:GPT-4 的微调将于今年秋天推出,而在秋季晚些时候会推出对GPT-3.5函数调用和16k上下文的微调支持。不久的将来还会推出微调UI,可更容易访问正在进行的微调作业等有关信息。

GPT-3迭代:OpenAI现在正在提供babbage-002和davinci-002型号作为GPT-3基础模型或微调模型。最初的GPT-3基础型号(ada、babbage、curie、davinci)将于2024年1月4日关闭。

总结来说,通过开放先进大模型的微调功能,OpenAI能吸引更多企业和开发者使用其平台和模型,从而扩大影响力和增加营收缓解亏损压力。这有助于AI产品得到更广泛应用,推动大模型加速落地。

同时,此次功能更新,也可看作是对Meta开源模型并允许商用等外部竞争的一个应对举措。通过允许微调模型,OpenAI可以进一步扩大和巩固用户基础,确保自身在行业的引领地位。这或许也会促使其他企业加快商业化步伐,行业竞争进一步加剧。

以下为OpenAI公告全文:

GPT-3.5 Turbo 的微调现已推出,GPT-4 的微调将于今年秋天推出。此更新使开发人员能够自定义更适合其用例的模型,并大规模运行这些自定义模型。早期的测试表明,GPT-3.5 Turbo的微调版本可以在某些垂直的任务上与基础的GPT-4功能相当,甚至要更好。与我们所有的API一样,从微调API发送的数据归客户所有,并且未被 OpenAI 使用或任何其他组织来训练其他模型。

微调用例

自 GPT-3.5 Turbo 发布以来,开发人员和企业要求能够自定义模型,以便为其用户创造独特且差异化的体验。通过此次发布,开发人员现在可以运行监督微调,以使该模型在其用例中表现更好。

在我们的私人测试版中,微调客户已经能够有效地提高常见用例的模型性能,举例来说:

改进的可操纵性:微调允许企业使模型更好地遵循指令,例如使输出简洁或始终以给定语言响应。例如,开发人员可以使用微调来确保模型始终按要求以德语响应。

可靠的输出格式:微调可提高模型一致格式化响应的能力,这对于需要特定响应格式(例如代码完成或撰写 API 调用)的应用程序来说至关重要。开发人员可以使用微调来更可靠地将用户提示转换为可与自己的系统一起使用的高质量 JSON 代码段。

自定义风格:微调是磨练模型输出定性感觉的好方法,具有可识别品牌风格的企业可以使用微调来使模型与其基调更加一致。

除了提高性能外,微调还使企业能够缩短提示时间,同时确保类似的性能。使用 GPT-3.5-Turbo 进行微调也可以处理 4K tokens——是我们之前微调模型的两倍。早期的测试人员通过将指令微调到模型本身,加快了每次 API 调用并降低成本,将提示大小减少了多达 90%。

当与其他技术如提示工程、信息检索和函数调用相结合时,微调的效果是最强大的。对这方面若想了解更多可查看我们的微调指南。另外,对函数调用和GPT-3.5-turbo-16k的微调支持将在今年秋季晚些时候进行。

微调步骤

我们还将在不久的将来推出微调 UI,这将使开发人员更容易访问正在进行的微调作业、已完成的模型快照等有关信息。

安全

对我们来说,安全地部署微调是非常重要的。为了在微调过程中保留默认模型的安全功能,微调训练数据将通过我们的审核API和GPT-4支持的审核系统,以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两类:初始训练成本和使用成本。训练:$0.008 / 1K tokens;使用输入:$0.012 / 1K tokens;使用输出:$0.016 / 1K tokens。例如,用100,000个tokens进行微调工作,预计成本为2.40美元。

更新的 GPT-3 型号

今年7月,我们宣布原始 GPT-3 基本型号将于2024年1月4日关闭。今天,我们正在制造这些模型的替代品,无论是作为基本模型还是微调模型。这些模型可以使用我们新的 API 端点进行微调。基本和微调的 GPT-3 型号的定价如下:

新的端点提供了分页和更多的可扩展性,以支持微调 API 的未来发展,过渡到更新的端点也非常简单,更多详细信息可参见我们的微调指南。


相关阅读

  • 紫光国微涨停,数字经济ETF(159658)已涨0.48%

  • 截至10:33,数字经济ETF(159658)高开,盘中宽幅震荡,现涨0.48%,成交额持续扩大,市场交投活跃。数据显示,该基金近5个交易日有4天获资金净流入,合计“吸金”3003万元。图片来源:wind,截
  • 以行政检察类案监督推进诉源治理

  •   2022年4月18日,最高人民检察院(以下简称“最高检”)发布第三十六批指导性案例,即检例第146号至第149号。这是最高检首次以行政检察类案监督为主题发布指导性案例。本批指导
  • 我国将进一步激活地理空间数据要素

  • 新华社北京8月23日电(记者王立彬)我国将加快推进测绘地理信息事业转型升级,不断激活地理空间数据要素,支撑数实融合,支持高质量发展。自然资源部国土测绘司司长张继贤23日在例行
  • 什么是胚胎?科学家认为要改改了

  • 来源:·中国科学报编译 | 文乐乐现在是重新定义人类胚胎的时候了。研究表明,人类干细胞可以生成类似胚胎的结构——胚胎模型,以重现早期胚胎发育的一些特征。但此类研究存在伦理
  • 中国软件领跌,数字经济ETF(159658)盘中溢价0.10%

  • 截至13:52,数字经济ETF(159658)午后窄幅震荡,现跌2.16%,成交额持续扩大,市场交投活跃。数据显示,该基金近5个交易日累计获资金净流入,合计“吸金”2866万元。图片来源:wind,截至2023

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • OpenAI不藏着了,开放微调功能

  • 8月23日,OpenAI宣布推出基于GPT-3.5 Turbo的微调功能并更新API,让企业、开发人员能够使用自身数据定制ChatGPT。微调(Fine-tuning)是一种利用已有通用语言模型(如GPT-3.5)来训练一
  • 日照召开乡村振兴专题协商座谈会

  •   日照日报/日照新闻网讯 8月23日,我市召开乡村振兴专题协商座谈会,副市长马维强出席并讲话。  市各民主党派、工商联负责人和无党派人士代表王坤英、陈为军、郇梅、牛学
  • 山东累计签发RCEP原产地证书超25万份

  • 山东累计签发RCEP原产地证书超25万份签发数量居全国首位,企业享惠出口货值六百七十余亿元据青岛海关统计,自2022年《区域全面经济伙伴关系协定》(RCEP)正式生效以来,截至今年7月
  • “只是挖了几棵黄栌而已,怎么就违法了?”

  • “老乡,啥是个黄栌?咱山上哪儿有?”“黄栌就是红叶,一到秋天就会变红。”这是河南省修武县检察院在办理一起盗挖黄栌刑事附带民事公益诉讼案的过程中,检察官勘查现场时,与案发当地