日本語OCRの最高峰(?)技術を無料で利用する
日本語OCR(光学文字認識)とは新聞や雑誌などの日本語の文字を機械的に読み取ってPCなどで利用できるデータにすることです。この分野は音声認識と同様に難易度が高く認識率が決して高くない。ここでは無料で認識率が高いGoogleドライブを使用してのOCRをご紹介します。
1.Googleドライブにアクセスする
まずはGoogleドライブにアクセスします。googleのアカウントが無い方はメールアドレスなども無料で利用できますのでこの機会に作りましょう。(利用規約は必ず確認して下さい)

2.OCR処理の設定をする
ログインしたら右上にある歯車の設定アイコンをクリックします。そこで「アップロード設定」「アップロードしたPDFや画像ファイルからテキストに変換」にチェックマークを入れます。

3.画像ファイルをドラッグ&ドロップする
次はログインした画面に文字が入力された画像ファイルをドロップします。
4.アップロードされたファイルを選択する
後はアップロードされたファイルを選択するだけで自動的にOCRの処理が完了しています。
OCR - サンプル
下記はOCR用のサンプルの画像です。

OCR - サンプルのOCRの結果
下記はOCR処理後の画面です。

画面下部に抽出されたテキストが表示されています。実際の画面ではコピペも可能です。
まとめ
Googleドライブでは無料のOCR機能がある。GoogleはAndroidの音声認識だけではなく、文字認識にも力を入れているところを見ると、将来的にはAndroidをAndroid(ロボット)として販売しようとしているのかもしれませんね。今後のロボット工学が楽しみです^^
関連記事
この記事を書いた人
![]() | 💻 ITスキル・経験 サーバー構築からWebアプリケーション開発。IoTをはじめとする電子工作、ロボット、人工知能やスマホ/OSアプリまで分野問わず経験。 画像処理/音声処理/アニメーション、3Dゲーム、会計ソフト、PDF作成/編集、逆アセンブラ、EXE/DLLファイルの書き換えなどのアプリを公開。詳しくは自己紹介へ |
プチモンテ代表、アーティスト名:プチモンテ | |
🎵 音楽制作 BGMは楽器(音源)さえあれば、何でも制作可能。歌モノは主にロック、バラード、ポップスを制作。歌詞は叙情詩、叙情的な楽曲が多い。楽曲制作は2023年12月中旬 ~ |
オリジナル曲を始めました✨
YouTubeで各楽曲を公開しています🌈
https://www.youtube.com/@petitmonte