訓練電腦視覺模型需要許多標注過的圖片,而這些過程會消耗大量的時間。為了節省時間,有人致力於開發好用的影像標註軟體,其中之一是 Computation Vision Annotation Tool(CVAT) 。原本由Intel開發,然後在2022年轉為由OpenCV維護的開源專案。以下我將介紹如何安裝CVAT。
事前準備
CVAT原本是被設計在Linux下運行。托現在虛擬環境越來越成熟的福,目前在不同的作業系統上都可以安裝CVAT。在Windows上可以透過Windows Subsystem for Linux 2 (WSL 2)安裝CVAT,這也是本文使用的方式。以下是需要事先安裝的軟體:
請依照上列順序、選擇預設模式安裝軟體就可以了。
啟動Docker
開啟Docker Desktop for Windows。如果有成功的話,畫面應該如下圖。
開啟 Ubuntu 20.04.5 LTS 的Terminal (終端機)
在開始列搜尋 Ubuntu 20.04.5,圖中的應用程式就是終端機,然後雙擊開啟它。我們將會在這個終端機中安裝CVAT。
從Github下載CVAT 原始碼並安裝
我們要下載CVAT的穩定版原始碼。首先進入CVAT的Github網頁,點選develop > tags。查看最新的穩定版的版本號,我的情況是v2.3.0,請把它記起來,等等會用到它。
回到剛才的終端機,並輸入以下指令,就可以建立一個Docker Container。
# 下載 CVAT
git clone --depth 1 --branch v2.3.0 https://github.com/opencv/cvat.git
# 建立 CVAT 的 Docker Containers
cd cvat
docker compose up -d # 大概需要等10分鐘,根據網路狀況而定。
CVAT是一個基於Django的網站架構。CVAT中需要有一個administrator(系統管理員)管理所有專案內容,所以我們接著在終端機輸入以下指令,接著依照提示步驟就可以創立CVAT的系統管理員的帳號。
sudo docker exec -it cvat_server bash -ic 'python3 ~/manage.py createsuperuser'
驗證
回到Docker Desktop,請確認Container中有以下這些元件。點擊8080就可以開啟CVAT的首頁,使用剛才的系統管理員帳號即可登入。
Hello World
以下我將示範如何使用CVAT,我用的資料集是COCO 128。點擊左上角”Task” > 右上角”+” > “Create a new task”。輸入必要的名字、標記清單、以及想要標記的圖片,完成後點擊”Submit & Open”。接著點擊下列的Job,就可以開始標記圖片了。
小結
使用CVAT前,不得不提的是現在已經有許多成熟的線上影像標記平台,但代價是你的一切資料都寄放在別人的資料庫中。如果有保密需求的使用者,可以考慮選擇保證不會濫用客戶資料的方案,或是自己安裝CVAT。
所有文章分類