服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

一张照片生成3D头像!苹果新模型击败StyleGAN2,表情光线都能调

日期: 来源:量子位收集编辑:量子位

克雷西 发自 凹非寺量子位 | 公众号 QbitAI

随便一张照片,就可生成3D头像。而且光线真实,任意角度可调。

这是苹果的最新黑科技生成框架FaceLit。

正如其名,FaceLit的特色就是可以将人脸“点亮”。

“自带光环”的FaceLit在易用性上也不输同类,甚至更胜一筹——

进行3D建模时,需要的照片素材无需专门选择角度,数量上也只需一张。

甚至对表情、发型、眼镜等元素进行调节时,也不需要额外素材。

而传统的头像合成工具或者需要多张图片才能工作,或者对照片角度有刁钻的要求。

正是凭借这一创新,FaceLit获得了3.5的FID评分,较同类产品直接高出了25%。

改进式EG3D合成人像,光线信息单独处理

下面就来看一下FaceLit具体是如何实现头像合成的。

总的来说,苹果采用了将人物本体与光线分别处理再进行叠加的策略。

早期的三维人像合成工具在转换过程中可能产生形变。

而爆火的NeRF通过将场景拆分成具体因素,提高了3D图像合成效果,改善了这一问题。

但苹果团队认为,在可控性方面,NeRF仍存有不足之处。

于是,在EG3D框架的基础上,苹果创造了FaceLit的合成模型。

EG3D通过三平面解码器,赋予了二维卷积神经网络生成渲染3D模型所需深度参数的能力。

苹果团队对标准的EG3D训练方式进行了扩展,并将之转化成了FaceLit框架。

△FaceLit与传统EG3D渲染流程对比图

标准的ED3G使用相机位置p参数作为基本输入参数。

在建立GAN2操作时,苹果在EG3D的基础上加入了光照参数l。

△不同p(左→右)与l(上→下)值下的初始图像

苹果选择了经过球形谐波方式简化后的Phong反射模型作为处理光源的物理基础。

光照参数l就是在这一基础之上独立处理得到的。

在自然界中,反射包括镜面反射和漫反射两种形式。

△不同镜面反射率条件下的效果对比

因此,苹果在ED3G模型中加入了镜面反射解码器和漫反射解码器。

它们替代了可以直接得到颜色c、密度σ数据的三平面解码器。

△反射解码器流程示意图

通过对GAN2产生的数据进行再次解码,可以得到镜面反射率ks和漫反射率kd。

然后再通过两种反射着色器得到颜色c,密度σ则由漫反射解码器计算得出。

最终,FaceLit以与三平面解码器相同的参数(c,w,σ)渲染图像,并进行分辨率优化。

有的放矢设计训练策略,数据无需人工标注

生成框架已有,那就来到训练阶段,其特点在于训练过程中无需人工标注。

方法论层面,在训练时,团队使用了FFHQ、MetFaces和CelebA-HQ数据集。

对于不同的数据集,苹果使用了不同的训练方式。

FFHQ包含了7万余条人脸数据,其训练分为两个阶段:先在较低的分辨率下训练,再提高分辨率再次进行。

对于包含2万数据量的CelebA-HQ,训练不需要分阶段进行。

而对于更小的MetFAces,则只需要通过ADA扩容的方式,使用预训练的FFHQ进行优化调整即可。

定性地看,训练结果在机位、光源和反射高光等方面都有出色的表现,图中的细节也有所增强。

△FaceLit生成的头像(左侧四列)唇齿部位的细节进行了明显重构

定量结果同样表明,FaceLit在FID、KID等指标上均优于包括标准EG3D在内的传统生成方式。

在使用FFHQ作为训练集的条件下,各生成方式的表现如下表,不难看出FaceLit拥有最低的FID和KID值。

而相比于英伟达的StyleGAN2,FaceLit的表现依旧出色:

光线准确度方面,FaceLit在使用三种不同训练数据集的情况下,与人工设定的标准值平均均方误差均低于0.01。

网友:人们低估了苹果AI

消息发出后,便有网友认为“这是对更重磅产品的预热”。

更有网友直接推测,FaceLit的出现标示着人工智能将进军AR和VR领域,苹果的混合现实将最终实现商用……

也有网友认为,FaceLit不会商用,否则苹果才不会以论文的形式发表。

针对FaceLit本身,也有网友表示,除了LLM,其他都是浮云,他们(苹果)如果不开发LLM,就没有未来。

但这位网友同时也说,苹果可能已经在做(LLM)了。

相应的,也有网友称人们“低估了苹果在AI领域的深度”。

所以各位网友对苹果在AI领域还有什么样的期待呢?

论文地址:https://arxiv.org/abs/2303.15437GitHub地址:https://github.com/apple/ml-facelit参考链接:https://twitter.com/AlphaSignalAI/status/1648361623004774400

相关阅读

  • 不想挤牙膏,苹果准备在 3nm M3 芯片上「翻身」

  • 苹果 M3不挤牙膏?苹果 M2 芯片的这代 MacBook,生来就很是坎坷。在 M2 芯片研发过程中,原本是赶上台积电 3nm 工艺的「早班车」N3,也就是第一代 3nm。但 N3 的良率、工艺水准加上
  • 苹果 Siri 团队内幕曝光:挣扎、斗争、重组

  • 微软投资 OpenAI,推出新 Bing,Google 推出 Bard,Adobe 推出了 FireFly,亚马逊推出 Amazon Titan,随着 ChatGPT 的走红,硅谷大公司的 AI 工具或者助手,瞬间都迸发了出来。▲Github
  • “11个人”的胜利,Midjourney走上AIGC神坛

  • 作者于惠如 编辑罗丽娟 封面图来源:Midjourney生成如今,不知道Midjourney这家公司,似乎就不配谈AIGC。不久前,AI绘图工具Midjourney发布了第五代V5模型,由它生成的一张“中国情
  • 苹果iPhone 15 Pro或支持雷电3,还有14.1英寸iPad

  • 按照惯例,苹果会在今年秋季的发布活动中带来全新的iPhone 15系列。而随着发布时间的接近,越来越多的消息提到这一代iPhone机型将换用USB-C接口。据悉,自从苹果在2012年9月发布
  • 仅有11人的Midjourney,如何走上AIGC神坛?

  • 本文来自微信公众号:全天候科技 (ID:iawtmt),作者:于惠如,编辑:罗丽娟,原文标题:《“少数人”的胜利,Midjourney走上AIGC神坛》,头图:由Midjourney生成如今,不知道Midjourney这家公司,似乎
  • 反射弧有点长

  • 今天股债跷跷板效应明显。大A午后拉升,债券现券期货午后转弱,银行间主要利率债收益率小幅上行,国债期货支撑于20日均线上方。2023年一季末银行间资金供需期限结构性矛盾愈发突

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 家门口的“诗和远方”

  • “五一”假期,除了在城市的步行街逛吃,邀约三五好友来到城郊外,来一次家门口的“诗和远方”,也是一个不错的选择。和风煦日下,几群伙伴在帐篷下围炉煮茶,听风观景,享受假日休闲好风
  • 重庆一景区男子玩水上浮桥时落水溺亡

  • 4月30日,网络上流传一男子在重庆开州区厚坝镇水云天玩水上浮桥时落水身亡。 视频显示,该男子在水中挣扎,后来有人前去营救,事故发生地已拉起警戒线。 据知情者介绍,死者28岁,是家
  • 洛江开展专项督查行动 规范住宿餐饮服务

  • “酒店房价要明码标价,节假日期间禁止‘杀鸡取卵’式的涨价行为……”“后厨卫生要注意,食品安全要有保障……”“监控室要24小时有人值班,确保顾客生命财产安全……”连日来,洛
  • 恒指午盘小幅收涨0.09% 恒宇集团闪崩后暂停牌

  •   中新经纬5月2日电 2日早盘,港股恒指一度涨超1%,重返2万点,但此后走低且一度转跌。  截至收盘,恒指涨0.09%,报19912.2点,恒生科技指数涨0.39%,医药、消费、地产等板块集体走跌