本文為大家介紹jpeg圖像壓縮原理(jpeg的壓縮格式),下面和小編一起看看詳細內容吧。
數據壓縮是一個基本的工程問題,在有限容量信道上的數據存儲和傳輸中具有重要應用。圖像作為一種信息載體,擁有龐大的數據量,因此研究人員一直沒有停止對圖像壓縮的研究。
在iclr 2017會議上,來自紐約大學的johannes balle等研究人員提出了一種端到端的優(yōu)化圖像壓縮方法,并發(fā)表了論文:《end-to-end optimized image compression》。該方法包括三個過程:非線性分析變換、均勻量化器和非線性綜合變換。
這些轉換建立在卷積線性濾波器和非線性激活函數的三個連續(xù)階段中。在一組測試圖像上,該方法的性能通常優(yōu)于標準jpeg 和jpeg 2000 壓縮方法,具有更好的率失真性能。更重要的是,該方法在所有比特率的所有圖像中實現了顯著的視覺質量改進,客觀質量測量方法ms-ssim 也證明了這一點。
雷鋒網了解到,這篇論文將在2017年4月24日的iclr大會上作為第一個contributed talk進行討論。
以下是雷鋒網ai科技評論根據論文內容進行的部分編譯。
抽象的
數據壓縮是一個經過充分研究的基礎工程問題,通常為給定的離散數據集設計一種具有最小熵的編碼。該解決方案在很大程度上依賴于對數據概率結構的了解,因此該問題與概率源建模密切相關。
然而,由于所有實際編碼都必然具有有限熵,連續(xù)值數據(例如圖像像素強度的向量)必須量化為離散值,這會導致錯誤。在有損壓縮問題中,必須權衡兩個損失:離散化表示的熵(rate,壓縮率)和量化帶來的誤差(distortion,失真)。不同的壓縮應用場景,如數據存儲或有限容量信道傳輸,需要在壓縮比和失真之間進行不同的權衡。
同時優(yōu)化壓縮和失真是很困難的。在沒有額外約束的情況下,高維空間中的最優(yōu)量化是難以處理的。出于這個原因,大多數當前的圖像壓縮方法將數據向量線性變換為適當的連續(xù)值表示,獨立量化每個元素,然后使用無損熵編碼對得到的離散表示進行編碼。由于變換的關鍵作用,這種方法被稱為變換編碼(transform coding)。例如,jpeg 在塊像素上使用離散余弦變換,而jpeg 2000 使用多尺度正交小波分解。
研究人員開發(fā)了一種基于非線性變換的端到端優(yōu)化圖像壓縮架構(如下圖所示)。這是一種通用的非線性變換編碼架構。圖像向量x 通過參數分析變換y=ga(x;) 映射到代碼空間。這種表示被量化,產生一個離散值的向量q,然后被壓縮。重建壓縮圖像則相反。
對于分析變換,研究人員使用基于級聯線性卷積層和非線性層的更靈活的變換來優(yōu)化均方誤差(mse)。值得注意的是,研究人員使用了廣義pisive 歸一化(gnd) 聯合非線性層,該層對高斯圖像密度非常有效,其靈感來自于生物視覺系統(tǒng)的神經元。
論文結果表明:
在論文中,研究人員將他們的方法與兩種標準方法jpeg 和jpeg 2000 進行了比較。結果如下:
下面是上圖亮度分量的率-失真曲線,左邊是感知質量,通過多尺度結構相似性(ms-ssim)測量。右邊是峰值信噪比。
下圖顯示了三種比特率下的圖像壓縮。從上到下是jpeg,論文中的方法,jpeg 2000,從左到右,碼率逐級遞增。
與未壓縮的原始圖像相比,論文中的方法細節(jié)較少,消除了大部分細節(jié)紋理和圖案,但保留了輪廓的平滑度和邊緣的銳度,使圖像看起來更自然.
相比之下,jpeg 和jpeg 2000 有明顯的偽像,這也是所有線性變換編碼方法的問題:由于局部特征(邊緣、輪廓、紋素等)是由局部線性基函數的組合表示的,因此變換系數 的獨立標量量化導致這些組合不平衡,導致底層基函數的視覺反射,即圖像混疊和振鈴。
值得注意的是,本文的方法在所有測試圖像和所有比特率上都具有可檢測的優(yōu)勢。上圖顯示了從高比特率到低比特率的進展。隨著比特率的降低,jpeg 和jpeg 2000 通過粗化線性基函數系數的精度降低了它們對原始圖像的近似,從而暴露了這些基函數的視覺外觀。另一方面,論文中的方法逐步簡化了輪廓和其他圖像特征,有效地隱藏了表示的潛在量化。
iclr 評論
iclr 委員會最終決定
評價:這是我們接受的兩篇最好的論文之一,我推薦它作為口頭報告。審稿人對該主題進行了相當的關注和深入的了解。
決定:接受(口頭)
很好的紙
評分:9分:在所有入選論文中排名前15%,強烈推薦
評論:這是迄今為止我讀過的關于使用深度神經網絡進行圖像壓縮的最有說服力的論文。這篇文章寫的很好,客觀評價中的rate-distortion理論很符合這個框架。本文將結果與合理的基準(jpeg 2000,上一篇文章僅與jpeg 進行比較)進行比較。希望這篇文章能夠產生深遠的影響。
希望能把該方法在lena/barbare/baboon圖像上的結果加進去,與更多的經典方法進行對比,得到最好的結果。能夠清楚地表明神經網絡方法與以前的最先進技術不同
好地方法之間的不同是至關重要的。從目前提交版本的論文看來,我仍然不知道這兩個范疇的方法哪個更好。
有極好的性能,但是缺乏細節(jié)
打分:8分:在全部入選論文中排名top 50%,確定接收
評論:本文將rate-distortion優(yōu)化的方法拓展到深度編碼器和解碼器,并從簡單的熵編碼方法拓展到自適應熵編碼。此外,本文還討論了該方法和變分自動編碼器之間的關系。
由于rete-distortion優(yōu)化的方法已經被出版過,這次遞交的文章的新穎性并不是非常高。在某些方面上,這篇文章甚至有退步,由于早期的工作是對perceptual metric進行優(yōu)化,而這里使用的是mse。然而,結果很明顯的優(yōu)于jpeg 2000,我并不知道目前有哪種其他的學習編碼器能夠達到這種層次的性能。這篇文章寫得非常好。
官方評論
打分:8分:在全部入選論文中排名top 50%,確定接收
評論:這是一篇很好的文章,它展示了一種端到端訓練的圖像壓縮和解壓系統(tǒng),相比于目前的圖像壓縮算法(例如jpeg-2000)實現了更好的壓縮比和質量之間的權衡。除了展示了深度學習在新應用下的效率,該論文的一個關鍵性貢獻是一種差分形式的 rate 函數,作者展示了它可以被用來有效的訓練不同的rate-distortion權衡。我希望這種方法不僅僅應用在圖像壓縮方面發(fā)揮影響,一些其他的差分近似方法可能都會從中受益。
一個很好的文章,使用了有趣的前提,一些新穎的方法,得到了很好的結果
打分:8分:在全部入選論文中排名top 50%,明確接受
評論:這個寫得很好的文章提供了一種端到端學習的方法進行圖像壓縮。通過優(yōu)化rate-distortion性能,該方法能夠通過自然圖像數據集上的優(yōu)化實現高效的圖像壓縮。
由于方法很有趣,結果吸引人,分析很透徹,因此我推薦接受這篇論文。
jpeg imager v2.1.2.25 官方版 jpeg imager能將bmp、jpg文件壓縮,使文件變的更小,可自設壓縮比例、大小、明暗度等,是一款采用智能過濾壓縮算法的圖片壓縮軟件。jpeg imager不僅可以改善圖像的觀感質量,而且還可為輸出的圖片“減肥”,允許壓縮后的圖形文件不失真,歡迎體驗。
jpegmini pro(圖片壓縮工具)v3.3.0.0 綠色最新版 jpegmini pro綠色最新版是一款專業(yè)的jpg圖片壓縮工具,jpegmini pro能夠幫助用戶在不影響畫質的同時盡量的壓縮圖片的大小,并且jpegmini pro還能進行批量進行壓縮,有需要的朋友快來下載吧。
exif信息查看器(jpeg lossless rotator) v10.0 綠色版 jpeg lossless rotator是功能簡單的圖片瀏覽和處理軟件。軟件能讀取并顯示所有的exif 2.21標記,支持tiff6及常用軟件的擴展exif標記,完全展示exif記錄的全部細節(jié),同時用戶可以自行設計軟件的外觀,打造屬于自己的軟件,彰顯出個性,體驗動手的樂趣。 基本
好了,jpeg圖像壓縮原理(jpeg的壓縮格式)的介紹到這里就結束了,想知道更多相關資料可以收藏我們的網站。