一声棒喝,本不立文字
偏要著録,已是二义

apple-ml-research

实用学习式图像压缩中什么最重要

What Matters in Practical Learned Image Compression

二〇二六年五月八日 · 英文原文

该工作研究 practical learned image codec 的建模选择,面向人类视觉系统优化感知质量与运行时间,并在 ablation 中评估若干新技术。作者进一步进行 performance-aware neural architecture search,以获得兼顾 perceptual quality 和实用运行效率的图像 codec。

相较于硬编码的传统 codec,learned codec 带来的一个主要差异化优势,是它们能够被直接优化,以适配人类视觉系统。尽管具备这一潜力,目前仍尚未提出一种兼具感知质量与实用性的图像 codec。在这项工作中,我们旨在弥合这一差距。我们对决定实用 learned image codec 设计的关键建模选择进行了全面研究,并针对感知质量与运行时间进行联合优化——其中在 ablation 中包含了若干新技术。随后,我们执行了 performance-aware neural…

译自 apple-ml-research · 录于 二〇二六年五月八日