ホーム > カテゴリ > Python・人工知能・Django >

CNNで畳み込み/プーリング後のテンソルのサイズ(Shape)を確認する

Python/TensorFlowの使い方(目次)

CNN(畳み込みニューラルネットワーク)で畳み込み、プーリング後のテンソルのサイズは非常にわかりにくいです。

そこで、Tensorオブジェクトのget_shape()メソッドを使用すると、テンソルのサイズを簡単に確認する事が可能です。

※全コードは後述する参考文献を参照してください。

[5x5]ストライド1でパディングあり

ソースをコピー

x = tf.placeholder(tf.float32, [None, 784])
img = tf.reshape(x,[-1,28,28,1])
f1 = tf.Variable(tf.truncated_normal([5,5,1,32], stddev=0.1))
conv1 = tf.nn.conv2d(img, f1, strides=[1,1,1,1], padding='SAME')

print(conv1.get_shape())

(?, 28, 28, 32)

[5x5]ストライド1でパディングなし

ソースをコピー

x = tf.placeholder(tf.float32, [None, 784])
img = tf.reshape(x,[-1,28,28,1])
f1 = tf.Variable(tf.truncated_normal([5,5,1,32], stddev=0.1))
conv1 = tf.nn.conv2d(img, f1, strides=[1,1,1,1], padding='VALID')

print(conv1.get_shape())

(?, 24, 24, 32)

[3x3]ストライド1でパディングなし

ソースをコピー

x = tf.placeholder(tf.float32, [None, 784])
img = tf.reshape(x,[-1,28,28,1])
f1 = tf.Variable(tf.truncated_normal([3,3,1,32], stddev=0.1))
conv1 = tf.nn.conv2d(img, f1, strides=[1,1,1,1], padding='VALID')

print(conv1.get_shape())

(?, 26, 26, 32)

[3x3]ストライド2でパディングなし

ソースをコピー

x = tf.placeholder(tf.float32, [None, 784])
img = tf.reshape(x,[-1,28,28,1])
f1 = tf.Variable(tf.truncated_normal([3,3,1,32], stddev=0.1))
conv1 = tf.nn.conv2d(img, f1, strides=[1,2,2,1], padding='VALID')

print(conv1.get_shape())

(?, 13, 13, 32)

[3x3]ストライド2でパディングあり

ソースをコピー

x = tf.placeholder(tf.float32, [None, 784])
img = tf.reshape(x,[-1,28,28,1])
f1 = tf.Variable(tf.truncated_normal([3,3,1,32], stddev=0.1))
conv1 = tf.nn.conv2d(img, f1, strides=[1,2,2,1], padding='SAME')

print(conv1.get_shape())

(?, 14, 14, 32)

[3x3]ストライド3でパディングなし

ソースをコピー

x = tf.placeholder(tf.float32, [None, 784])
img = tf.reshape(x,[-1,28,28,1])
f1 = tf.Variable(tf.truncated_normal([3,3,1,32], stddev=0.1))
conv1 = tf.nn.conv2d(img, f1, strides=[1,3,3,1], padding='VALID')

print(conv1 .get_shape())

(?, 9, 9, 32)

[3x3]ストライド3でパディングあり

ソースをコピー

x = tf.placeholder(tf.float32, [None, 784])
img = tf.reshape(x,[-1,28,28,1])
f1 = tf.Variable(tf.truncated_normal([3,3,1,32], stddev=0.1))
conv1 = tf.nn.conv2d(img, f1, strides=[1,3,3,1], padding='SAME')

print(conv1 .get_shape())

(?, 10, 10, 32)

最後に

これらの例は畳み込みでしたが、プーリングでも同様に確認可能です。

参考文献

TensorFlowではじめるDeepLearning実践入門のサンプルコード

Pocket
LINE

関連記事

前の記事：	TensorFlow.jsのHello World [WebでAIモデルを実行する]
次の記事：	画像内の物体を検出するObject Detection APIの使用方法 [TensorFlow]

公開日：2018年08月02日最終更新日：2018年08月24日

記事NO：02710

この記事を書いた人

	💻 ITスキル・経験サーバー構築からWebアプリケーション開発。IoTをはじめとする電子工作、ロボット、人工知能やスマホ/OSアプリまで分野問わず経験。画像処理/音声処理/アニメーション、3Dゲーム、会計ソフト、PDF作成/編集、逆アセンブラ、EXE/DLLファイルの書き換えなどのアプリを公開。詳しくは自己紹介へ
プチモンテ代表、アーティスト名：プチモンテ
🎵 音楽制作 BGMは楽器(音源)さえあれば、何でも制作可能。歌モノは主にロック、バラード、ポップスを制作。歌詞は叙情詩、叙情的な楽曲が多い。楽曲制作は2023年12月中旬～

オリジナル曲を始めました✨

YouTubeで各楽曲を公開しています🌈
https://www.youtube.com/@petitmonte

【男性ボーカル】DA・KA・RA | 新たな明日が風と共に訪れる

【男性、女性ボーカル】時空を超越する先に | 時空と風の交響曲

【女性、男性ボーカル】絆 | 穏やかな心に奏でる旋律

ピックアップ

Stable Diffusionのインストール方法(AUTOMATIC1111)【初心者/AIイラスト/画像生成AI/Windows/誰でもAI絵師になれる】

最新の記事

音楽・DTM・作曲 2025年07月03日
音楽制作(DTM)のPC移行でやること [プラグインのアクティベート、ディアクティベート、アンインストール]

Windows 2025年01月19日
Windows11で「ブルースクリーン」を直す方法 [24H2/23H2]

Windows 2023年11月11日
デュプリケーターでSSD/SSD換装(OS丸ごとクローン)[LGB-2BDPU3ES/LHR-2BDPU3ES]

Python・人工知能・Django 2023年08月05日
複数の範囲にオブジェクトを指定する【Stable Diffusion Web UI】

Python・人工知能・Django 2023年08月03日
高画質の美少女、動物、風景を作成する【Stable Diffusion Web UI】

人気の記事 (毎週月曜日～)

1位	ControlNetのインストール、使い方、モデルの早見表【Stable Diffusion Web UI】
2位	Stable Diffusion XL(SDXL)をインストールする【Stable Diffusion Web UI】
3位	WindowsでTensorFlow(GPU)の環境を構築する [初心者向け]
4位	複数の範囲にオブジェクトを指定する【Stable Diffusion Web UI】
5位	Python学習向け総合開発環境のSpyder(スパイダー)
6位	Colab Proの使い方 [高性能GPU]
7位	Djangoの本番環境を構築する [uWSGI+ Nginx]
8位	Jupyter Notebookでプログラムのコード補完、入力補助 [Python]
9位	クラス/アトリビュート/スロット/カプセル化/プロパティ/継承 [Python]
10位	ディープラーニング向けパソコンを20万円以下で購入する [ディープラーニング環境]
11位	画像サイズの自動設定(ワンクリックで変更)【Stable Diffusion Web UI】
12位	Stable Diffusionのインストール方法(AUTOMATIC1111)【初心者/AIイラスト/画像生成AI/Windows】
13位	Djangoの本番環境を構築する [Gunicorn+ Nginx]
14位	ネットワークカメラを用いた顔認識及び人物特定システムの構築 [防犯カメラの自作]
15位	MNISTファイルを読み書きするMNIST Converter
16位	複数のTFRecord形式のファイルを生成する [create_pet_tf_record.pyの改造]
17位	画像内の「カップラーメン」を検出する [Object Detection API]
18位	TensorBoardに表示されているログをリセット(初期化)する
19位	Couldn't open CUDA library libcupti.so.9.0 [Docker/nvidia-docker2]
20位	Web版のHello WorldとGET/POST [Python]

Webアプリ

このブログのマスターが作成した無料ツールです。

Free 疾風 - ときかぜ - (オープンソース)
ブラウザで写真などの画像を編集する

Free PDFデザイナー (オープンソース)
ブラウザでPDFファイルを編集(結合、分割、抽出、回転、しおり等)する

Free 複数画像のPDF変換
ブラウザで複数の画像を1つのPDFファイルにまとめる

Free PDFのテキスト変換
ブラウザでPDFファイルをテキストに変換する

Free PDFの画像変換
ブラウザでPDFファイルを画像に変換する

Free Exifの確認と削除 (オープンソース)
カメラで撮影した画像ファイル(JPEG)に潜むGPSなどのExif情報を確認、削除する (ブラウザ/スマホ対応)

Free エクセルのCSV変換
ブラウザでエクセルをCSVに変換する(一括変換も可能)

Free GIFアニメの作成 (オープンソース)
ブラウザで画像からGIFアニメを作成する

Free 動画のGIFアニメ変換
ブラウザで動画ファイルをGIFアニメへ変換する

Free アイコンエディタ
ブラウザでアイコンを作成、読み込み、編集する

Free 複数画像のAVI変換 (オープンソース)
ブラウザで画像/音声を動画ファイル(AVI)に変換する

Free Webカメラ動画変換
ブラウザで映像/音声を動画ファイル(AVI)に変換する

Free 音声形式の変換 (オープンソース)
ブラウザでMP3/OGG/AAC/FLAC/WAVなどの音声ファイルをWaveファイルに変換する

Free Waveファイルで効果音作成 ♪
ブラウザでWaveファイルの効果音を作成する

Free Waveフォーマット変換 (オープンソース)
ブラウザで8/16/24/32bitの相互変換。サンプリング周波数、チャンネルを変更する

Free 音声の結合 / 抽出 / 削除 (オープンソース)
ブラウザでWaveファイルを結合、抽出、削除する

Free Waveファイルの解析 (オープンソース)
ブラウザで全体の波形、再生時間、ビットレート、WaveFomat構造体を解析して表示する

Free 波形データと周波数スペクトル
ブラウザでマイクやパソコン内で流れている音声、MP3/OGG/WAVなどのファイルの周波数を解析する

Free 双2次フィルタ(BiquadFilter)
ブラウザで音声の特定周波数をカット/増幅/減衰する

Free 絶対音感
ブラウザでマイクやパソコン内で流れている音声のドレミなどの音階をリアルタイムに表示する (スマホ対応)

Free 音声録音くん
ブラウザでマイクやパソコン内で流れている音声をMP3/WAVE形式で保存する

Free iResEditor (オープンソース)
ブラウザでEXE/DLLファイルのリソースを編集する

Free Webの逆アセンブラ
ブラウザでEXE/DLLファイルを逆アセンブルする

※その他にも「プチラボ」でアプリを多数公開しています。

3Dゲーム

このブログのマスターが作成した無料ゲームです。

短時間で遊べるファンタジーのオンラインRPG風

ほのぼの癒し系のスマホアプリ

パズルゲーム

ナンプレのドン！

スマートフォン

このブログのマスターが作成したアプリです。

お主の画像減色
カメラの写真や画像ファイルを「高品質に減色」する

お主は誰だ。
AI(人工知能)が「あなたの顔はどんな芸能人、有名人に似てるか」を判定する顔診断アプリ (女性向け)

AI(人工知能)

おもちゃのAI研究室
イラストの自動着色などのAIアプリの研究室(学習用)

めえめえ(自動作曲システム)
ブラウザで歌詞を入力するだけで自動作曲する(簡易版)
※オリジナルの作詞・作曲はYouTubeで公開中

ロボット

このブログのマスターが作成したロボットです。(試作機)

ロボットアーム

ロボットアーム

二足歩行ロボット

二足歩行ロボット

四足歩行ロボット

四足歩行ロボット