【影像處理】非銳化濾鏡 Unsharp Masking

12/21/2018

一、影像銳化 Sharpening

對一張數位影像做銳化其實是一種很常見的動作/需求，特別是在一些修圖軟體中，可能我們想要增強原始影像中的某一些細節(detail)，這時後要做的就是銳化！[註一]
我們前面所指的那些細節(detail)，通常會存在於影像的邊緣(edge)。
而邊緣通常具有以下幾點特性：

表面法向量不連續性 (Surface normal discontinuity)
深度不連續性 (Depth discontinuity)
表面顏色不連續性 (Surface color discontinuity)
亮度不連續性 (Illumination discontinuity)

所以你把一張影像經過傅立葉轉換(Fourier transform)後，把影像從Spatial domain -> Frequency domain
你會發現影像裡面的那些細節(邊緣)的地方是會在所謂的高頻區，而低頻區就是影像的平坦區(如果你從Spatial domain 來看，就是周邊臨點數值都差不多的地方。)

那麼接下來你可能會覺得，既然這樣那不是很直覺的做一個High-pass filter ( 高通濾波器 )，把低頻的成分濾掉用高頻的那些細節回頭去Enhance 原圖這樣工作不就做完了嗎?

嗯.. 理論上是這樣沒錯，但在現實生活中事情總沒這麼美好Q_Q
因為只要你的影像是一張自然影像[註二]，就一定有雜訊！
只是你不是在絕對零度 K 的地方進行取像，有熱的地方就一定會有雜訊。
而那些雜訊在Frequency domain 分佈也是落在高頻區，所以如果你真的只是單純的用高頻的成份去Enhance 原圖的話，那麼連雜訊也都被你放大了！而雜訊被放大這件事，在人眼視覺中是相當糟糕的。

為了要避免這個問題，並做到影像銳化的效果，所以就會採用這次要講的Unsharp Masking。
其實它的概念也很簡單，就是透過設計一個Mask 把它罩在影像的邊緣上，然後針對邊緣的部分做sharpening 的動作，其餘的不是邊緣的地方我們就把它給略過，進而避免把平坦區的雜訊放大。

二、邊緣偵測 Find Edge

Ok 在有了前面的基本觀念之後，那我們接下來要做的就是找到影像的邊緣。
其實看完前面寫的，我想你大概也有一個概念就是，找影像邊緣這件事是可以在Frequency domain中輕鬆做到的！但是做Fourier transform 這件事本身卻非常麻煩，如果是工科背景出身以前學過傅立葉的大概就知道我再講什麼。即便你今天是可以把這些麻煩的工作全部都丟給電腦來做，但是這樣的話你寫出來程式的Performance 可能就不會太好，這也不會是一個好的演算法設計。
那我能不能直接在Spatial domain就把這件事情給做掉呢?
( 以省去對Image 做Fourier transform 與 Inverse Fourier transform 的計算資源與時間 )

答案是可以的！
偉哉的數學家們告訴我們可以設計一個遮罩(mask) 配合捲積(convolution)運算，就可以在Spatial domain 中得到跟在Frequency domain 上一樣的結果。
至於這個遮罩要怎麼去設計，那就有一點學問了！
我們今天先不用討論這個，就先拿別人研究/設計好的遮罩來用吧。

2-1 Sobel Operator

這東西中文應該翻作｢索伯運算子」，是在影像裡面很常用到的運算子，基本上現在做Edge Detection 的大部分都是直接用 Sobel 或者 Canny edge。
這個運算子用到的 mask 有兩個，分別是 dy 跟 dx 的部分：

所以只要把原圖套進 dy 的 mask 算一次，可以得到Gy；把原圖套進 dx 的 mask 算一次，得到Gx。
這樣你就得到 2個不同dimension 的微分結果了( 雖然認真講的話這是差分啦xD )，
在來算它們的距離就好了，一般在數學上是用歐氏距離 [註三]：

但是又要平方，又要開根號的，太麻煩了~
能不能簡單一點?
答案是可以的！
一般在實作上我們會改用 L1距離，即曼哈頓距離：

講了那麼多，我們還是直接來看一下實作出來效果長的怎樣吧！
Source Image -> Sobel Operator -> 一階微分結果

2-2 Laplace Operator

Ok 這個東西呢，對有學過工程數學的同學都不太陌生的吧~
是的，就是我們的｢拉普拉斯運算子」啦~
至於沒學過的就..
大概有個概念它是個很屌的算子，在天體力學、熱力學、流體力學、電磁學、量子力學...
幾乎都會看到它的身影，大概只要有用到微積分的地方就很容易會用到laplacian這樣的數學工具。
而在影像處理/電腦視覺這個domain，laplacian 就常被用在斑點偵測跟邊緣偵測上。

至於我們今天要應用的Laplace Mask 長這樣：

跟 Sobel 不一樣的是，Laplace 做一次就做完了，不需要像 Sobel 那要dy 做一次 dx 做一次再加起來。而我上面列出來的兩個mask 其實都是 laplace 的 mask，只差在左邊的是基礎版的，右邊的是加強版。
那有沒有比右邊更強化的版本? 其實也是有的，只是 Jason 認為應該是沒有必要再列出來這樣。
實作的時候你從兩個裡面，挑一個來用就可以了。

Source Image -> Laplace Operator -> 二階微分結果

三、非銳化濾波 Unsharp Masking

如果你Google "unsharp masking"，搜尋結果跳出來在維基百科裡面，你應該會看到下面這個數學公式：

我相信很多人在看完上面的公式可能也不太懂到底要幹嘛吧~
所以 Jason 稍微幫大家整理了一個流程步驟出來，見下圖：

基本上就是有一張原始影像(Source Image)進來，我們想對它做 Unsharp Mashing，步驟如下：

程式載入一張原始影像，若為"彩色影像"則將它轉成"灰階影像"，得〈Result 1〉
對〈Result 1〉做 Sobel Operator，會得到一張一階維分的〈Result 2〉
對〈Result 1〉做 Laplace Operator ，會得到一張二階維分的〈Result 3〉
對〈Result 2〉做算術平均濾波(Mean Filter)，將做完的結果正規化[0,1]得到〈Result 4〉
將〈Result 3〉與〈Result 4〉做相乘的動作，得到我們真正要 Enhance 的數值〈Result 5〉
用〈Result 5〉對原始影像(Source Image) 做 Enhancement

其中〈Result 4〉即是我們的Mask；〈Result 3〉為從原圖過濾出來的細節(detail)。
步驟(5) 利用〈Result 4〉做為mask 把〈Result 3〉非影像邊緣的數值(即被放大過後的雜訊)給濾掉。
步驟(6) 利用〈Result 5〉對原圖做Enhancement 即完成了所謂的Unsharp masking。

實驗的結果就長的像本篇封面圖片那樣，就不在重複貼了。
好吧！這篇就寫到這樣吧~ 感謝各位收看

【程式碼下載】

[註一] 與銳化相反的動作就叫作鈍化；銳化是增強影像中的細節，而鈍化就是會把影像中的細節給模糊掉。
[註二] 利用取像設備(由感光元件組成)，在真實自然場景中所擷取(拍攝)到的影像；非人工用軟體做出來的。
[註三] 所謂的歐氏距離，就是大神歐基里德發明的那個，即你在國中的時候學的距離公式。也稱L2距離

8 評論

balmydrizzle

9/20/2019 11:56:47

mask應該是遮罩，怎會翻作濾鏡？濾鏡應該是filter吧？

回覆

Jason Chen

9/20/2019 13:49:33

Hi balmydrizzle,

一般我們在討論空間濾波的時候，它的濾波器 Filter 其實也可以稱作：
遮罩 Mask、核心 Kernel、模板 Template 或者是視窗 Window。

像我跟幾位不同的老師學習影像處理的時候，就有發現他們各自習慣稱呼的方法都不太一樣！比如說搞訊號處理出身的就會很直覺的叫它 Filter、搞網路的更習慣稱呼它 Window、深度學習的叫 Kernel、玩 PR 的叫它 Template。

所以我覺得吧，想怎麼稱呼它都可以吧！只要能讓大家能有個共識，能相互理解、知道你再說啥就好了吧。

另外如果我沒記錯的話，我以前看到的中文資料應該也是把 unsharp masking 翻作非銳化濾鏡啦，但其實這根本沒有人在乎啦~ 因為在資工的領域像這種關鍵字是沒有人在講中文的。

F.Y.R

回覆

Mark

11/14/2019 16:43:01

Hi Jason

程式碼是否可分享，上面貼的載點好像無法下載~

回覆

Jason Chen

11/16/2019 01:36:14

Hi Mark,

我想載點應該都是沒問題的才對，只是我以前有在測試一些 adfly 的東西，所以你可以看到我部落格之前發布過的東西裡面有蠻多載點都是用 adfly 去縮址的，可能是你的電腦或瀏覽器有某種 Blocker 把它給擋掉了。

如果是這樣的話，你可以試試看這個短網址：https://tinyurl.com/vf2tzup

回覆

周玄

2/26/2020 22:49:12

您好:我想請問Unsharp Mashing的步驟5:將〈Result 3〉與〈Result 4〉做相乘的動作，得到我們真正要 Enhance 的數值〈Result 5〉。

我的問題是〈Result 3〉跟〈Result 4〉皆是0-255的uint8矩陣，你有提到〈Result 4〉結果要做正規化，我比較不解的是，最後要用〈Result 3〉0-255的矩陣乘上〈Result 4〉正規化[0,1]嗎?

回覆

Jason Chen

2/27/2020 12:41:43

是的，我記得我當初是這麼做沒有錯，另外我應該有附上一段之前用 C++ 配合 OpenCV 實作的代碼在上面，你可以參考看看。

不過你也不一定要照我文章裡面的流程這麼做，unsharp masking 並不是很死板的一個方法，更像是一種思想，你可以有很多不同的實現方法。像我文中 smoothing 的方法是用 mean filter 你也可以換成 gaussian blur 或者用來抓邊緣的 High Pass Filter 你也可以換成別的，還是你覺得這樣 Enhance 的效果不是很理想你也可以加入一些 gamma correction 的技巧，甚至多加個控制參數 λ 進去也是沒問題的。

這就完全取決於你想怎麼設計你的演算法了。

F.Y.R

回覆

Kins

5/15/2020 11:53:31

您好，最近作業剛好要做Unsharp Masking。
有幸在網路上能找到中文的介紹。
我想請問步驟4: 對〈Result 2〉做算術平均濾波(Mean Filter)，將做完的結果正規化[0,1]得到〈Result 4〉>。
這裡說要正規化成0~1的值，是視255為1 (最大值)嗎?
還是視做完mean filter後得到的maximum pixel value (不見得是255)為1?

回覆

Jason Chen

5/16/2020 03:31:56

Hi Kins,

就像我回覆上一個人的那樣，沒有說很死板一定要怎麼做才是對的。
unsharp masking 的精神就是，如何透過技巧性的設計演算法來實現銳化影像的同時又能抑制雜訊，以提升影像的品質。其實蠻多影像處理的演算法都是以騙過人眼為目的在設計的，像JPEG影像壓縮算法也是。

回到你的問題，其實你也可以試著想一下，除以 255 跟除以 mean 完的 max value 會差在哪? 稍微想一下的話你的心裡應該也有個答案了，我想應該就是對原圖 enhance 的程度不一樣吧? 就看你演算法想怎麼設計搂~

不過如果是學校作業的話，我想你直接除 255 就可以了，一般來說，助教也沒看那麼細吧? xD

回覆