顔検出、顔識別(顔認識)に挑戦してみる

Python/TensorFlowの使い方(目次)

AI(人工知能)を使用して画像から顔を検出して、その顔を認識する。

結論から言うと、

お主は誰だ。
AI(人工知能)が「あなたの顔はどんな芸能人、有名人に似てるか」を判定する顔診断アプリ

をアウトプットしました。

今回は、顔でしたが「自動車を検出して、車種を特定」など他のケースにも置き変えることが可能です。

以降は私の奮闘記です。どなたかのご参考になると幸いです。

1. データ収集

318人の芸能人、有名人の写真を3181枚、Googleの画像検索から収集。

日数	2日
データ構成	約10枚 / 人

収集する際にはWindowsアプリを作成して、コピペとボタン1つでファイルが作成されるようにした。(日数にはラベリング作業も含まれる)

<著作権に関する引用>
日本の著作権法では、「情報解析を行うために著作物を複製すること」が、営利・非営利問わず認められているのだ。世界にもまれな規定だ。

※引用元：「日本は機械学習パラダイス」その理由は著作権法にあり

2. Object Detection API

このデータでカップラーメンと同様にObject Detection APIを試してみる。

顔検出の精度は抜群。でも顔認識は使い物にならない。

3. MNISTで試す

MNIST Converterを作成して、データセットを28x28にする。精度は0.01で全くダメ。そもそも318種類というクラス数が多すぎる。

MNIST Converter付属のgrowth.exeで1枚の画像を10倍、30倍、50倍に「水増し」しても効果なし。

この時点で気づいた。1人10枚の写真じゃ、データ数が少なすぎる。

4. 新規にデータ収集

手動で収集は疲れたので「Bing画像検索API」で自動で画像を収集する。

15人で4319枚を収集した。

日数	1時間以内
データ構成	約287枚 / 人

で、収集した画像から顔を切り取るのは2で作成したモデルを使用した。

その後、それらの顔画像をMNIST Converterで28x28のデータセットにしました。CNNで試すと精度は0.63。クラス数を減らすと0.75ぐらいある。

なるほろ、なんとか実用レベルになりました。

5. 最終的に

「画像から顔を検出するAI」(SSD)で顔を切り出して、その顔を「顔を判別するAI」(CNN)で判定する事としました。AIは2種類です。

スマホで学習済みモデルを動作させるにはTensorFlow Mobileのデモアプリのインストール、TensorFlow MobileのHello Worldをご覧ください。

Pocket
LINE

前の記事：	MNISTファイルを読み書きするMNIST Converter
次の記事：	Tensorflow detection model zooの「学習済みモデル」をTensorFlow.jsで動かす

公開日：2018年08月25日最終更新日：2018年08月26日

記事NO：02719

この記事を書いた人

	💻 ITスキル・経験サーバー構築からWebアプリケーション開発。IoTをはじめとする電子工作、ロボット、人工知能やスマホ/OSアプリまで分野問わず経験。画像処理/音声処理/アニメーション、3Dゲーム、会計ソフト、PDF作成/編集、逆アセンブラ、EXE/DLLファイルの書き換えなどのアプリを公開。詳しくは自己紹介へ
プチモンテ代表、アーティスト名：プチモンテ
🎵 音楽制作 BGMは楽器(音源)さえあれば、何でも制作可能。歌モノは主にロック、バラード、ポップスを制作。歌詞は叙情詩、叙情的な楽曲が多い。楽曲制作は2023年12月中旬～

オリジナル曲を始めました✨

YouTubeで各楽曲を公開しています🌈
https://www.youtube.com/@petitmonte

【男性ボーカル】DA・KA・RA | 新たな明日が風と共に訪れる

【男性、女性ボーカル】時空を超越する先に | 時空と風の交響曲

【女性、男性ボーカル】絆 | 穏やかな心に奏でる旋律

ピックアップ

Stable Diffusionのインストール方法(AUTOMATIC1111)【初心者/AIイラスト/画像生成AI/Windows/誰でもAI絵師になれる】

Webアプリ

このブログのマスターが作成した無料ツールです。

Free 疾風 - ときかぜ - (オープンソース)
ブラウザで写真などの画像を編集する

Free PDFデザイナー (オープンソース)
ブラウザでPDFファイルを編集(結合、分割、抽出、回転、しおり等)する

Free 複数画像のPDF変換
ブラウザで複数の画像を1つのPDFファイルにまとめる

Free PDFのテキスト変換
ブラウザでPDFファイルをテキストに変換する

Free PDFの画像変換
ブラウザでPDFファイルを画像に変換する

Free Exifの確認と削除 (オープンソース)
カメラで撮影した画像ファイル(JPEG)に潜むGPSなどのExif情報を確認、削除する (ブラウザ/スマホ対応)

Free エクセルのCSV変換
ブラウザでエクセルをCSVに変換する(一括変換も可能)

Free GIFアニメの作成 (オープンソース)
ブラウザで画像からGIFアニメを作成する

Free 動画のGIFアニメ変換
ブラウザで動画ファイルをGIFアニメへ変換する

Free アイコンエディタ
ブラウザでアイコンを作成、読み込み、編集する

Free 複数画像のAVI変換 (オープンソース)
ブラウザで画像/音声を動画ファイル(AVI)に変換する

Free Webカメラ動画変換
ブラウザで映像/音声を動画ファイル(AVI)に変換する

Free 音声形式の変換 (オープンソース)
ブラウザでMP3/OGG/AAC/FLAC/WAVなどの音声ファイルをWaveファイルに変換する

Free Waveファイルで効果音作成 ♪
ブラウザでWaveファイルの効果音を作成する

Free Waveフォーマット変換 (オープンソース)
ブラウザで8/16/24/32bitの相互変換。サンプリング周波数、チャンネルを変更する

Free 音声の結合 / 抽出 / 削除 (オープンソース)
ブラウザでWaveファイルを結合、抽出、削除する

Free Waveファイルの解析 (オープンソース)
ブラウザで全体の波形、再生時間、ビットレート、WaveFomat構造体を解析して表示する

Free 波形データと周波数スペクトル
ブラウザでマイクやパソコン内で流れている音声、MP3/OGG/WAVなどのファイルの周波数を解析する

Free 双2次フィルタ(BiquadFilter)
ブラウザで音声の特定周波数をカット/増幅/減衰する

Free 絶対音感
ブラウザでマイクやパソコン内で流れている音声のドレミなどの音階をリアルタイムに表示する (スマホ対応)

Free 音声録音くん
ブラウザでマイクやパソコン内で流れている音声をMP3/WAVE形式で保存する

Free iResEditor (オープンソース)
ブラウザでEXE/DLLファイルのリソースを編集する

Free Webの逆アセンブラ
ブラウザでEXE/DLLファイルを逆アセンブルする

※その他にも「プチラボ」でアプリを多数公開しています。

3Dゲーム

このブログのマスターが作成した無料ゲームです。

短時間で遊べるファンタジーのオンラインRPG風

ほのぼの癒し系のスマホアプリ

パズルゲーム

ナンプレのドン！

スマートフォン

このブログのマスターが作成したアプリです。

お主の画像減色
カメラの写真や画像ファイルを「高品質に減色」する

お主は誰だ。
AI(人工知能)が「あなたの顔はどんな芸能人、有名人に似てるか」を判定する顔診断アプリ (女性向け)

AI(人工知能)

おもちゃのAI研究室
イラストの自動着色などのAIアプリの研究室(学習用)

めえめえ(自動作曲システム)
ブラウザで歌詞を入力するだけで自動作曲する(簡易版)
※オリジナルの作詞・作曲はYouTubeで公開中

ロボット

このブログのマスターが作成したロボットです。(試作機)

ロボットアーム

二足歩行ロボット

四足歩行ロボット

1位	ControlNetのインストール、使い方、モデルの早見表【Stable Diffusion Web UI】
2位	Stable Diffusion XL(SDXL)をインストールする【Stable Diffusion Web UI】
3位	WindowsでTensorFlow(GPU)の環境を構築する [初心者向け]
4位	複数の範囲にオブジェクトを指定する【Stable Diffusion Web UI】
5位	Python学習向け総合開発環境のSpyder(スパイダー)
6位	Colab Proの使い方 [高性能GPU]
7位	Djangoの本番環境を構築する [uWSGI+ Nginx]
8位	Jupyter Notebookでプログラムのコード補完、入力補助 [Python]
9位	クラス/アトリビュート/スロット/カプセル化/プロパティ/継承 [Python]
10位	ディープラーニング向けパソコンを20万円以下で購入する [ディープラーニング環境]
11位	画像サイズの自動設定(ワンクリックで変更)【Stable Diffusion Web UI】
12位	Stable Diffusionのインストール方法(AUTOMATIC1111)【初心者/AIイラスト/画像生成AI/Windows】
13位	Djangoの本番環境を構築する [Gunicorn+ Nginx]
14位	ネットワークカメラを用いた顔認識及び人物特定システムの構築 [防犯カメラの自作]
15位	MNISTファイルを読み書きするMNIST Converter
16位	複数のTFRecord形式のファイルを生成する [create_pet_tf_record.pyの改造]
17位	画像内の「カップラーメン」を検出する [Object Detection API]
18位	TensorBoardに表示されているログをリセット(初期化)する
19位	Couldn't open CUDA library libcupti.so.9.0 [Docker/nvidia-docker2]
20位	Web版のHello WorldとGET/POST [Python]