人工智能深度学习神经网络多尺度图像80%压缩技术完全机器学习(特约点评:多尺度图像编码技术利用像素卷积网络压缩图像对于图像压缩技术的发展有很好的指导意义。来自网友大鹏的推荐!【欢迎大家给我们投稿,评论和关注,搜索趣说人工智能有大量机器学习,深度学习,人工智能等视频教程不定期免费送上!])
人工智能深度学习神经网络多尺度图像80%压缩技术完全机器学习简介:视频和图像数据的数据压缩是减少通信流量和节省数据存储的关键技术。视频和图像通常包含大量冗余,通过有损压缩实现数据大小的显着减少,数据大小在保存其应用所需信息的同时被压缩。在这项工作中,我们关注自然图像的有损压缩任务。JPEG已被广泛用于有损图像压缩。但是,重建图像的质量会降低,特别是对于低比特率压缩。降解被认为是由于在工程基础上使用线性变换而引起的。线性变换对于自然图像的精确重建是不够的,并且工程基础可能不是最佳的。
在基于机器学习(ML)的图像压缩中,使用训练数据优化压缩模型。通过ML算法优化编码器和解码器模型的概念并不新鲜。 K-means算法用于矢量量化(Gersho&Gray,2012),主成分分析用于构建变换编码的基础(Goyal,2001)。然而,他们的代表能力仍然不足以超越工程编码人员的表现。最近,一些研究建议使用卷积神经网络(CNN)的有损压缩,导致骄人业绩就有损图像压缩通过发挥其强表征能力通过大型训练数据集优化。后者,并行多尺度无损编码器以最小的性能下降促进了快速编码/解码。我们总结下面模型中每个组件的核心概念。
人工智能深度学习神经网络多尺度图像80%压缩技术完全机器学习
人工智能深度学习神经网络多尺度图像80%压缩技术完全机器学习贡献:多尺度有损自动编码器。当我们在这个模型中使用多层CNN进行池化操作和/或逐步回收时,较深层将从图像中获得更多的全局和高层信息。之前的研究仅使用了这些特征出现在CNN模型编码的最深层。相反,我们的有损自动编码器模型包含分析仪和合成器之间不同深度的连接,从而实现多尺度图像特征的编码(参见图5)。使用这种架构,我们可以通过精确定位实现高压缩率。并行多尺度无损编码器。现有的研究依赖于顺序无损编码器,这使得编码/解码时间过大。我们考虑基于(Reed等人,2017)中使用的PixelCNN版本的并行多尺度计算的概念,以便以并行方式对z〜z进行编码/解码;它实现了z〜的快速编码/解码和高压缩率。
我们提出的模型将Kodak1和RAISE-1k(Dang-Nguyen等人,2015)数据集图像压缩成比固定质量重建图像上的JPEG,WebP或BPG文件大小更小的文件,并且实现了可比率失真折衷性能在Kodak和RAISE-1k数据集上尊重最先进的模型(Rippel&Bourdev,2017)(参见图1和8)。同时,所提出的方法实现了合理快速的编码和解码速度。例如,我们提出的模型编码一个尺寸为768×512的PNG图像,70毫秒内具有单GPU和单CPU处理,并将其解码为高保真度。在大约200毫秒内具有0.96的MS-SSIM的图像。图2显示了我们的模型的MS-SSIM约为0.96的重建图像的两个例子。
人工智能深度学习神经网络多尺度图像80%压缩技术完全机器学习网络结构:
人工智能深度学习神经网络多尺度图像80%压缩技术完全机器学习贡献:
人工智能深度学习神经网络多尺度图像80%压缩技术完全机器学习
人工智能深度学习神经网络多尺度图像80%压缩技术完全机器学习结论:在这项研究中,我们提出了一种新颖的基于CNN的有损图像压缩算法。我们的模型由两个网络组成:多尺度有损自编码器和并行多尺度无损编码器。多尺度有损自动编码器提取多尺度特征并对它们进行编码。我们成功地获得了不同的图像特征。局部和精细信息(例如边缘)在相对较浅的层中提取,全局和粗略信息(如纹理)在较深层中提取。我们确认这种架构肯定可以在任何比特率下改善RD曲线。并行多尺度无损编码器将离散化特征图编码为压缩二进制码,并将压缩二进制码以无损方式解码为离散化特征映射。假设条件独立性和并行多尺度像素CNN(Reed等,2017),我们以部分并行的方式对离散化特征映射进行编码和解码,使得编码/解码时间显着快速,而不会损失很多质量。我们对柯达和RAISE-1k数据集的实验表明,我们提出的方法在合理快速的编码/解码时间下实现了最先进的性能。我们相信我们的模型使基于CNN的有损图像编码器迈向要求高图像压缩质量和快速编码/解码时间的实际应用。