我們在前一篇:【教學】從Pascal Dataset中提取所需的類別資料 中已經介紹了什麼是PASCAL VOC Dataset,以及說明了為什麼要從開源資料集中提取特定了類別資料,不清楚的可以先去看那一篇。今天這一篇則是要教,怎麼從另一個常見的大型開源資料-MS COCO Dataset 來提取特定類別的資料。 什麼是 MS COCO Dataset ? 簡單的說,它是一個Microsoft、Facebook、CVDF 及 Mighty Ai 等組織所提供的一個大型開源圖片數據集。基本上它跟前一篇介紹的那個 PASCAL VOC Dataset 一樣,可以用於CV 領域的各類研究,如:Detection, Segmentation, Keypoints 等等,而跟 PASCAL 比起來它又更加的龐大,包含超過了33萬張影像(其中有超過20萬張已標記),包含150萬個物件、並分成80個類別(for object detection)以及91類的stuff(for semantic scene labeling),也正因為它的強大,所以現在CV領域的主流研究幾乎都會採用這份資料集來測試及驗證他們的方法。 Ok, 基本的介紹完了,接下來開始實作。 Step 1. Download MS COCO Dataset
這部分一樣,就連到他們官網後,點 Dataset 然後選 Download,接著會進入下載頁面:
我們一般在做機器學習任務的時候,習慣會將資料集分成:Training, Validation and Test Sets,COCO 也不例外,我們這邊只要把 Train images (18GB) 載下來做使用來應該就相當夠用了!然後也要記得下載它的標籤檔 Train/Val annotations (241MB)。
Step 2. Using COCO API
Install COCO API
Step 3. Extract Specific Classes from MS COCO Dataset
Extract Specific Classes from MS COCO Dataset
執行的過程如下方影片所展示的這樣:
如果你們要用的話,基本上就跟前一篇的方法一樣,只要將程式跟載好的資料集放在同一個資料夾底下,然後生成一個 classes.txt 文件,文件裡面就寫你感興趣的類別(一個一行),然後一行程式都不需要改,直接執行就可以了!
Ok, 今天這篇就寫到這邊了,感謝各位看官們的收看。
17 評論
葆葆
7/2/2021 11:50:33
node_name.text = entity if entity in ['bus','car','truck'] else 'motorbike'
回覆
Jason Chen
7/2/2021 13:16:27
喔對,這邊看起來是有點問題。
回覆
miao
5/21/2022 23:01:22
你好 請問我在跑程式碼的時候出現以下問題
回覆
Jason Chen
5/21/2022 23:42:22
如果一個 list 會在 index 0 的地方 out of range,一般代表說這個 list 其實是空的。那至於為什麼這個 list 是空的? 你可以 tracking back 回去一步一步看到底是哪個環節出錯了。
回覆
miao
5/22/2022 14:19:47
你好 我找到哪裡出問題了!
回覆
M
11/19/2022 18:53:08
您好
回覆
Jason Chen
11/19/2022 19:47:31
Hi M,
回覆
Jason Chen
11/19/2022 19:52:39
突然想到,如果在同個資料夾底下的其他圖檔都讀的到,只有該圖檔讀不到的話,那就可能是那個檔案的問題,比如說受損了之類的。
M
11/19/2022 20:53:24
如果os.path.isfile('/content/drive/MyDrive/yoloimg/train2017')
M
11/19/2022 20:57:23
btw
M
11/19/2022 21:05:53
我試os.path.isfile('/content/drive/MyDrive/yoloimg/train2017/000000098304.jpg')
Jason Chen
11/20/2022 00:03:16
Hi M,
Jason Chen
11/20/2022 00:08:00
程式裡面在做路徑套接的時候建議可以使用 os.path.join(),這樣跨平台的時候比較不會有問題,不然 Windows 跟 Linux 在路徑的部分使用的斜線方向並不一樣。
M
11/20/2022 20:27:28
上面的問題大致解決了 是路徑問題 感謝
Jason Chen
11/20/2022 20:42:00
Hi M,
M
11/21/2022 19:46:13
我成功提取資料了 感謝~~
回覆
K
12/27/2023 15:14:22
謝謝
回覆
發表回覆。 |
Jason Chen人不光是生來就擁有一切,而是靠他從學習中得到的一切來造就自己。- 歌德 文章分類
全部
封存檔
九月 2023
|