目錄
1.COCO數據集簡介
2.COCO數據集的優缺點(簡述)
3.COCO數據集信息統計
4.下次將推出VOC轉COCO的腳本,期待關注。
1.COCO數據集簡介
微軟發布的 COCO 數據庫是一個大型圖像數據集, 專為對象檢測、分割、人體關鍵點檢測、語義分割和字幕生成而設計。
COCO 數據庫的網址是:
- MS COCO 數據集主頁:http://mscoco.org/
- Github 網址:https://github.com/Xinering/cocoapi
- 關于 API 更多的細節在網站:?http://mscoco.org/dataset/#download
- 推薦參考文章:https://zhuanlan.zhihu.com/p/29393415
COCO API?提供了 Matlab, Python 和 Lua 的 API 接口. 該 API 接口可以提供完整的圖像標簽數據的加載, parsing 和可視化。此外,網站還提供了數據相關的文章, 教程等。
2.COCO數據集的優缺點(簡述)
優點:數據集量大,作為官方數據集廣泛用于深度學習--目標檢測,是一個極富挑戰性的數據集。
? ? ? ? ? ?采用json標注格式(VOC采用的是xml格式),具有良好的自我描述性,便于閱讀。
缺點:由于數據集量很大,json文件一般也很大,當我們需要打開json文件時,導致文本編輯器卡死
3.COCO數據集信息統計
比如說我們想要知道由于訓練的數據的具體信息或測試數據的具體信息,要通過json統計,針對COCO數據集的缺點,寫者編寫了一個Python腳本統計json文件中的數據信息。
具體代碼如下:
from pycocotools.coco import COCO
#文件路徑
dataDir='D:/Users/Desktop/'
dataType='trainval2014'
annFile='{}/instances_{}.json'.format(dataDir,dataType)
# initialize COCO api for instance annotations
coco_train=COCO(annFile)
# display COCO categories and supercategories
#顯示所有類別
cats = coco_train.loadCats(coco_train.getCatIds())
cat_nms=[cat['name'] for cat in cats]
print('COCO categories:\n{}'.format('\n'.join(cat_nms))+'\n')
#統計單個類別的圖片數量與標注數量
for cat_name in cat_nms:
catId = coco_train.getCatIds(catNms=cat_name)
if cat_name == "person":
print(catId)
imgId = coco_train.getImgIds(catIds=catId)
annId = coco_train.getAnnIds(imgIds=imgId, catIds=catId, iscrowd=False)
print("{:<15} {:<6d} {:<10d}\n".format(cat_name, len(imgId), len(annId)))
#統計全部的類別及全部的圖片數量和標注數量
print("NUM_categories: "+str(len(coco_train.dataset['categories'])))
print("NUM_images: "+str(len(coco_train.dataset['images'])))
print("NUM_annotations: "+str(len(coco_train.dataset['annotations'])))
運行結果展示
運行代碼可能出現的bug:
問題:提示pycocotools.coco module缺少
解決辦法:python執行pip install?pycocotools,成功安裝即可
如果有遇到其他問題,請評論區留言,與寫者一起交流
4.下次將推出VOC轉COCO的腳本,期待關注。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
