サンプル:examples/deeplab
モデル:chainercv/links/model/deeplab

学習に使用したデータセットによって入力解像度が異なる。入力解像度未満の画像は入力解像度まで引き上げられる。

cityscapes : 1025x2049
ada20k : 513x513
voc : 513x513

入力画像のレンジは-1.0〜1.0。

Deeplabv3のFeatureExtractorは下記の解像度を出力する。

voc : 21x129x129

21はカテゴリ数である。各画素はカテゴリ数分のスケールがかかっているため、/21を行う。

セグメンテーションを可視化する際にはバイリニアで元解像度まで拡大した後、しきい値処理する。

vis_semantic_segmentation.py