書接前文:【開發工具】免費在雲端上玩轉深度學習-Google Colab 我們在前文中介紹了一個好用的 Cloud IDE,接著我們就要來實作第一個深度學習專案,通常我們在學習一門新的程式語言的時候,會寫的第一支程式叫做:Hello World!主要是用來驗證基本的運行環境是否正常,同時也代表我們打開了一扇通往程式新世界的大門,並跟這個世界打聲招呼。而在深度學習領域,它的 "Hello World" 就是使用 DNN 來辨識 MNIST 這個資料集。 What is the MNIST ?
MNIST ( Mixed National Institute of Standards and Technology database ),意思為混合美國國家標準與技術研究所資料庫。不過 MNIST 的實際應用跟這串名字沒什麼關係,可以當作一個專有名詞看就好。
MNIST 是一個手寫數字的數據集,由 Yann LeCun 等人提供。 在他整理過的這份 Dataset 裡面涵蓋了約 250人手寫數字( 0 到 9 ) 的圖檔,共70,000 張 ( Training Set 60,000 張;Testing Set 10,000;並且它確保 Training Set 跟 Testing Set 是 Disjoint 的,即由不同批人所寫的 )。資料的格式都經過處理了,每張的大小都是 28 * 28 的灰階圖檔並包含Header。基本上它長的像這個樣子:
可能有人會問,像這樣的一個手寫辨識資料集有啥用?
MNIST 最主要的作用就是替那些想要研究手寫辨識的人提供各種各樣的手寫數字,可以省去他們收集、整理、格式化等繁瑣的工作。而像研究人員就可以直接使用這個數據集來訓練一個 AI Model,訓練完成後就可以用來辨識你寫在銀行支票上的數字、幫助老師改考卷、甚至用在發票對獎、車牌辨識等應用,其實說穿了,就是傳統影像辨識裡面的 OCR ( Optical Character Recognition, 光學字元辨識 ) 的範疇。 而一般在做研究的時候,我們也常常需要去比較自己研究的方法跟別人的比,孰優孰劣。 如果是研究一般的演算法,通常我們可以比較「時間複雜度與空間複雜度」(註一) 來判斷它的好壞,至於用在手寫辨識上的,我們更看重的是它的準確率,這時候如果各自都是用自己的 Dataset 來計算的話,那就會變的難以比較,所以我們會需要一個大家都有的 Dataset 來做判斷,故 MNIST 在這邊就發揮了很好的作用!基本上我們甚至可以說 MNIST 之於手寫辨識的地位就像 Lena 跟 Baboon 之於影像處理一樣(註二)。
|
Jason Chen人不光是生來就擁有一切,而是靠他從學習中得到的一切來造就自己。- 歌德 文章分類
全部
封存檔
九月 2023
|