ホーム > おもちゃのAI研究室 >

OCR(英数字)

人工知能で画像から英数字を認識します。※簡易版です。

この推論のボタンを押すだけです。

これは画像サイズが100x32の簡易版です。詳細は「ocr_tflite」のcolabsなどを確認してください。

今回は英数字のみですがネットを探せば日本語OCRのオープンソースもあるかも知れません。

本格的にOCRをやる場合の流れとして1つ目のAIで画像から文字領域を検出する「テキスト検出」。次に検出された矩形から文字の「テキスト認識」。この2つのAIを用意すれば良いと思われます。

このAI(人工知能)はWebサーバー上で、改良した「TensorFlow Lite」を用いて学習済みモデルで推論しています。

※サーバーに送信されたファイルは保存されません。