手書き数字をAIに判定させてみよう【Keras×Colab】-忘れないようにメモ

はじめに

こんにちは、SHOUです！

前回の記事では、Google Colab × Keras × MNIST を使って、手書き数字画像の分類モデルを構築しました。

今回はその続編として、自分で用意した画像ファイル（PNG/JPG形式の手書き数字）をAIモデルに認識させる方法を解説します。

「自分で書いた数字がAIに正しく分類されるか？」を実際に試すワクワク感を楽しみながら、機械学習モデルに画像を与えて予測させる流れを体験できます。

準備するもの

このチュートリアルを実行するには、以下の環境・ファイルを用意してください：

Google アカウント（Colab・Drive にログイン）
Google Drive に保存した画像ファイル（例：handwritten_digit.png）
画像はなるべく白背景に黒い数字で、正方形・28×28pxが理想ですが、大きな画像でもColab上でリサイズ可能です

Colabを使えばローカルに環境構築しなくても、すぐに機械学習が試せるので、初心者の方にもおすすめです。

Google DriveをColabにマウント

まず、Google Drive を Colab に接続します👇

from google.colab import drive
drive.mount('/content/drive')

すると、認証リンクが出るので、指示に従って認証してください。
マウントが完了すると、Drive のファイルが /content/drive/MyDrive/ 以下に見えるようになります。

Google Colabのセットアップ

まず、Google Colabを開き、ランタイムでGPUを選んでおきましょう。設定：

[ランタイム] → [ランタイムのタイプを変更] → [ハードウェアアクセラレータ: GPU]

必要なライブラリをインポート

import tensorflow as tf 
from tensorflow import keras
import numpy as np 
from PIL import Image 
import matplotlib.pyplot as plt

学習済みモデルの用意

以前作ったモデル（MNIST用）をColabで再度学習して使用します。

# モデルの構築と学習
model = keras.models.Sequential([
    keras.layers.Input(shape=(28, 28)),
    keras.layers.Flatten(),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dropout(0.2),
    keras.layers.Dense(10, activation='softmax')
]) 

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) 

# MNISTデータで学習
(x_train, y_train), _ = keras.datasets.mnist.load_data() 
x_train = x_train / 255.0
model.fit(x_train, y_train, epochs=5)

# モデル保存
model.save('mnist_model.keras')

または、事前に保存したモデルをロード👇

model = keras.models.load_model('mnist_model.keras')

画像ファイルの読み込み

ここでは、Drive内の画像ファイルを指定します。

# Drive内の画像パス
image_path = '/content/drive/MyDrive/Colab/handwritten_digit.png' 
# 画像を開く
img = Image.open(image_path).convert('L')
# 表示して確認
plt.imshow(img, cmap='gray')
plt.axis('off')
plt.show()

今回判定させる画像👇

画像の前処理

MNISTは「28×28ピクセル・グレースケール・黒地に白の数字」という形式なので、自前の画像も同様に整形（前処理）します。

リサイズ（28×28）
白黒反転（白背景に黒数字 → 黒背景に白数字）
正規化（0～1 にスケーリング）
バッチ形式に変換（1枚でも4次元配列に）

 # 画像ファイル名を指定
img = Image.open('/content/drive/MyDrive/Colab/handwritten_digit.png').convert('L')

# リサイズ＆正規化
img = img.resize((28, 28))
img_array = np.array(img) / 255.0

# モデル入力用に形を整える
img_array = img_array.reshape(1, 28, 28)

# 追加：白黒反転
img_array = 1.0 - img_array

MNISTの画像確認

MNISTの画像が黒地に白い数字になっているか確認してみます。

import matplotlib.pyplot as plt
from tensorflow.keras.datasets import mnist

# データの読み込み
(x_train, y_train), (_, _) = mnist.load_data()

# 最初の画像とラベル
image = x_train[0]
label = y_train[0]

# 画像を表示
plt.imshow(image, cmap='gray')
plt.title(f'Label: {label}')
plt.axis('off')
plt.show()

MNISTの画像👇

判定させる画像を表示

MNISTに合わせて白黒反転させた画像を確認します。

import matplotlib.pyplot as plt

# グレースケール画像として表示
plt.imshow(img_array[0], cmap='gray')
plt.title('Preprocessed Image')
plt.axis('off')
plt.show()

白黒反転した画像👇

いよいよ予測！

prediction = model.predict(img_array)
predicted_class = np.argmax(prediction)
print(f'AIの判定結果: {predicted_class}')
print("---")
print(f'AIの自信度')
for i, prob in enumerate(prediction[0]):
    print(f'{i}: {prob:.4f}')

AIが自分の書いた数字を正しく認識しているか確認してみましょう✨

1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 37ms/step
AIの判定結果: 4
---
AIの自信度
0: 0.0022
1: 0.0000
2: 0.0001
3: 0.0000
4: 0.9866
5: 0.0000
6: 0.0000
7: 0.0044
8: 0.0000
9: 0.0066

この画像は '4' で、AIも '4' と認識しました。

また、98%で'4'と認識しているようです。

白黒反転させなかった場合の判定結果

白黒反転させなかった世界線での判定結果

1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 41ms/step
AIの判定結果: 3
---
AIの自信度
0: 0.0000
1: 0.0000
2: 0.0000
3: 0.9984
4: 0.0000
5: 0.0016
6: 0.0000
7: 0.0000
8: 0.0000
9: 0.0000

元の画像は同じ'4' ですが、AIは '3' と誤認識してしまいました。

また、自信満々99%で'3'と認識しているようです。

まとめ

今回は、Google ColabとKerasで構築したAIモデルを用いて、自作の手書き数字画像を分類させる方法を紹介しました。

画像のサイズや色の形式を、MNISTと揃える前処理（リサイズ・白黒反転）が重要で、これを行うことで高精度な判定が可能になります。

AIが自分の書いた数字を正しく認識してくれると、楽しさと実用性を実感できますね！
ぜひ、自分だけの画像や他の数字でも試してみてください。

手書き数字をAIに判定させてみよう【Keras×Colab】

はじめに

準備するもの

Google DriveをColabにマウント

Google Colabのセットアップ

必要なライブラリをインポート

学習済みモデルの用意

画像ファイルの読み込み

画像の前処理

MNISTの画像確認

判定させる画像を表示

いよいよ予測！

白黒反転させなかった場合の判定結果

まとめ

0 件のコメント:

コメントを投稿

このブログを検索

このブログのまとめページ

ブログアーカイブ

カテゴリー

人気記事

自己紹介

お問い合わせフォーム

プライバシーポリシー