画像内の「カップラーメン」を検出する [Object Detection API]

Python/TensorFlowの使い方(目次)

今回は「カップラーメン」のオリジナルデータセットを使用して、TensorFlowのObject Detection APIで画像内のカップラーメンを検出します。

この記事及びプロジェクトは「一般物体検出アルゴリズム」のSSD(Single shot multibox detector)を使用した研究を目的としています。

※データセットを含むソースコードはGitHubで公開しています。

加筆(2021年3月30日)

この記事は2018年08月08日に「Ubuntu16.04 + TensolFlow1.9.0」で作成されました。2021年3月30日に「Windows10 + TensolFlow1.15.5」でも動作するように記事を加筆しました。

Googleが公開していた「object_detection_tutorial.ipynb」のPythonコードが公開されなくなりましたので、それもこのページの下部にある13章のWindows版でご紹介します。

Windowsの方は今回、加筆した13章のWindows版からご覧ください。

※なお、加筆時点での動作確認はWindows版のみです。
※Ubuntuの方もWindows版を確認すると解決できる場合があります。

<重要な変更点>
ここで使用している「tensorflow/models」は
https://github.com/tensorflow/models
ではなく
https://github.com/tensorflow/models/tree/archive/
のアーカイブに移動されました。

前提条件

画像内の「犬猫の品種」を検出するトレーニングをローカルで行う

の続きとなります。事前準備がありますので先にご覧ください。

1. 共有フォルダに専用フォルダを作成する

ホストOSとコンテナの「共有フォルダ」は次のようになっています。

[ホストOS側]
/home/ユーザー名/tensor

[コンテナ側]
/foo

今回は/fooに「cup」フォルダを作成して使用します。

※コンテナ上の/fooは、実質的に/home/ユーザー名/tensorと同じです。

2. ラベリング

ラベリングでは各画像の「何処に何があるか」を指定する必要があります。

今回はLabelImgというツールを使用して手動でラベル付けを行います。

[ファイル構成]

images/	画像を収納する
annotations/	xmlファイルを収納する
annotations/trainval.txt	拡張子を除くファイル名の一覧を記述する

xmlファイルはLabelImgで作成します。trainval.txtは適当なコマンドやプログラムでリストして下さい。(trainval.txtの例)

[LabelImgの使い方]

LabelImgを起動して「Open Dir」でimagesフォルダを選択します。1枚毎に「Create RectBox」アイコンを選択して範囲を選択します。その後に、ラベルを入力して「save」でXMLファイルを出力します。

※XMLのフォーマットはデフォルトの「PscalVOC」のままにして下さい。(左メニューのアイコンがPscalVOCならばOK)

全てのラベリング作業が完了したら、全てのXMLファイルの<path></path>のパスをLinuxならgrep、Windowsなら秀丸のGREP置換などで絶対パス(フルパス)に変更します。

これらのファイルを

/foo/cup/images
/foo/cup/annotations

に移動します。

3. create_tf_record.pyを作成する

object_detection/dataset_toolsにあるTFRecordファイルを作成するコードでも良いのですが、少し複雑だったのでJwataさんのcreate_tf_record.py(MITライセンス)をテンプレートとします。

94/95行目の

Cup_Ramen_detector	ダウンロード
tensorflow/models (アーカイブ版/旧版)	ダウンロード
TensorFlow 1 Detection Model Zoo ※必要なのはssd_mobilenet_v1_coco	ダウンロード ※右クリでダウンロード

前の記事：	画像内の「犬猫の品種」を検出するトレーニングをローカルで行う [Object Detection API]
次の記事：	複数のTFRecord形式のファイルを生成する [create_pet_tf_record.pyの改造]

	💻 ITスキル・経験サーバー構築からWebアプリケーション開発。IoTをはじめとする電子工作、ロボット、人工知能やスマホ/OSアプリまで分野問わず経験。画像処理/音声処理/アニメーション、3Dゲーム、会計ソフト、PDF作成/編集、逆アセンブラ、EXE/DLLファイルの書き換えなどのアプリを公開。詳しくは自己紹介へ
プチモンテ代表、アーティスト名：プチモンテ
🎵 音楽制作 BGMは楽器(音源)さえあれば、何でも制作可能。歌モノは主にロック、バラード、ポップスを制作。歌詞は叙情詩、叙情的な楽曲が多い。楽曲制作は2023年12月中旬～

画像内の「カップラーメン」を検出する [Object Detection API]

加筆(2021年3月30日)

前提条件

1. 共有フォルダに専用フォルダを作成する

2. ラベリング

3. create_tf_record.pyを作成する

4. cup_label_map.pbtxtを作成する

5. ライブラリパスを通しておく

6. TFRecordファイルを作成する

7. 事前学習モデルをダウンロードする

8. Configファイルの設定

9. トレーニングと評価ジョブを開始する

10. Tensorflowグラフのエクスポート

11. テストイメージの移動

12. 推論(モデルの実行)

最後に

13. Windows版

13-1. 精度について

13-2. 必要なファイル群

13-3. ファイルのパス

13-4. C:\Users\ユーザー名\Desktop\foo\cup\annotations

13-5. ssd_mobilenet_v1_coco.config

13-6. create_tf_record.py

13-7. 各パッケージのインストール

13-8. cup_train.record/cup_val.recordの作成

13-9. protobuf-compilerのインストールとコンパイル

13-10. model_main.py

13-11. トレーニングと評価ジョブを開始する

13-12. TensorBoard

13-13. export_inference_graph.py

13-14. Tensorflowグラフのエクスポート

13-15. object_detection_tutorial.ipynb

おもちゃのAI研究室

関連記事

この記事を書いた人

オリジナル曲を始めました✨

ピックアップ

最新の記事

人気の記事 (毎週月曜日～)

Webアプリ

3Dゲーム

パズルゲーム

スマートフォン

AI(人工知能)

ロボット