服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

深度估计相关原理(计算机视觉和深度学习基础)

日期: 来源:新机器视觉收集编辑:

点击下方卡片,关注“新机器视觉”公众号

重磅干货,第一时间送达


编者荐语

 

今天来和大家介绍一下深度估计涉及到的理论知识点,包括计算机视觉基础和深度学习基础。

转载自丨3D视觉工坊


一、计算机视觉基础

1.1. 针孔相机模型


相机模型,是指采用一个几何模型来描述三维世界中的坐标点映射到二维图像平面的过程。其中,最简单的模型就是针孔相机模型。
针孔相机模型中一共涉及到四个坐标系,分别为世界坐标系(world),相机坐标系(camera),图像坐标系(image)和像素坐标系(pixel)。相机模型描述的就是四个坐标系中间的转换关系。
为了获得更好的成像结果,相机前方加了透镜,透镜的加入会对成像过程中光线的传播产生新的影响,这种影响我们称之为畸变。结合畸变的纠正,我们就可以找到相机坐标系中某点在像素平面上的正确位置。


1.2. 对极几何


对极几何是研究立体视觉中重要的理论,描述了两张图片之间存在的几何对应关系。
本质矩阵和基本矩阵就反映了两个视图的对极几何约束。如果知道一副图像中的某个点和基本矩阵,就能求得另一张图像上的对应点所在的对极线,这样就约束了两视角下图像中的空间位置关系。
我们可以将左右相机的坐标系旋转至在同一平面(共面),并计算视差图。
根据视差,我们就可以估计像素与相机之间的距离,也就是深度。


1.3. 图像重构原理


图像重构是图像领域的重要应用,也是3D视觉中重要的一个知识点。在基于深度学习的深度估计方法中,会采用图像重构损失来作为其中的约束条件,如自监督学习方法。常见的方法有两种,前向warping和反向warping。
正向Warping
反向Warping

二、深度学习基础

2.1. 相关网络模型


在深度估计中,常用的网络模型有ResNet、UNet和Autoencoder。ResNet的思想,是使用恒等映射直接将前一层传到更深的网络层。
UNet是深度估计中一个比较常用的网络结构,包括下采样和上采样过程。
Autoencoder可以用来提取图像的特征,其训练方式是无监督的。


2.2. 深度估计中的损失函数


损失函数是深度学习中的重要环节,如何设计或选择合适的损失函数,是深度学习的关键。深度估计中,比较常见的损失函数有:
1)用于计算图像重构误差 / 图像相似度
2)用于计算像素梯度的平滑度
3)交叉熵损失函数,用于有监督学习


2.3. 深度估计的评价指标


深度估计的评价指标有很多,比如AbsRel、SqRel、RMSE等等。


声明:部分内容来源于网络,仅供读者学习、交流之目的。文章版权归原作者所有。如有不妥,请联系删除。

—THE END—

相关阅读

  • 图像处理算法工程师——必备技能总结

  • 点击下方卡片,关注“新机器视觉”公众号重磅干货,第一时间送达图像处理算法工程师职位要求编程技能:1、 具有较强的编程能力和良好的编程习惯, 精通c/c++编程,并熟练使用VS 或mat
  • 短波红外(SWIR)成像在不同应用场合中的应用

  • 点击下方卡片,关注“新机器视觉”公众号重磅干货,第一时间送达Abstract摘要短波红外(SWIR)热像仪可以将视觉扩展到肉眼通常看不见的波段和其他类型的热成像。这些近红外和短波红
  • 华为清华共研3D虚拟形象生成专利

  • 科技边角料获悉华为技术有限公司、清华大学共同申请的“3D虚拟形象生成方法与装置”专利日前公布,可使生成的3D虚拟形象更加符合待处理图像中的面部特点。天眼查App显示,该方

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四
  • 美国对华2000亿关税清单,到底影响有多大?

  • 1 今天A股大跌,上证最大跌幅超过2%。直接导火索是美国证实计划对华2000亿美元产品加征25%关税。 听起来,2000亿美元数目巨大,我们来算笔账。 2000亿美元,按现在人民币汇率

最新文章

  • 【华安研究】2023年五月金股

  • 、五月金股金股组合回顾策略-2023年5月市场观点 郑小霞 S0010520080007市场观点4月市场延续震荡格局,行业快速轮动呈现结构性行情特征,“中特估”涨幅持续扩大、TMT板块行情内
  • ​飞行时间(TOF)相机优缺点及其应用领域

  • 点击下方卡片,关注“新机器视觉”公众号重磅干货,第一时间送达3D TOF 相机特性利用TOF技术成像的设备被称为TOF相机(或TOF摄像头), TOF相机与普通机器视觉成像过程也有类似之处,都
  • 启动视觉系统算法开发工作需要考虑的因素

  • 点击下方卡片,关注“新机器视觉”公众号重磅干货,第一时间送达开发基于相机的检测系统需要不断迭代、理解采样和清晰度对图像质量的影响,并使用数据集来评估系统性能。由于使用