|
|
- import os
- import tensorflow as tf
- import matplotlib.pyplot as plt
- import numpy as np
-
- mnist = tf.keras.datasets.mnist
- (x_train, y_train),(x_test, y_test) = mnist.load_data(path="/data/data/mnist.npz") #加载mnist数据集
-
- #验证mnist数据集大小。x为数据,y为标签。mnist每张图的像素为28*28
- print(x_train.shape)
- print(y_train.shape)
- print(x_test.shape)
- print(y_test.shape)
-
- #打印训练集中前9张,看看是什么数字
- for i in range(9):
- plt.subplot(3,3,1+i)
- plt.imshow(x_train[i], cmap='gray')
- plt.show()
-
- #打印相应的标签
- print(y_train[:9])
-
- #基操:将像素标准化一下
- x_train, x_test = x_train / 255.0, x_test / 255.0
-
- #搭建一个两层神经网络
- model = tf.keras.models.Sequential([
- tf.keras.layers.Flatten(input_shape=(28, 28)), #拉伸图像成一维向量
- tf.keras.layers.Dense(128, activation='relu'), #第一层全连接+ReLU激活
- tf.keras.layers.Dropout(0.2), #dropout层
- tf.keras.layers.Dense(10, activation='softmax') #第二层全连接+softmax激活,输出预测标签
- ])
-
- #设置训练超参,优化器为sgd,损失函数为交叉熵,训练衡量指标为accuracy
- model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
-
- #开始训练,训练5个epoch,一个epoch代表所有图像计算一遍。每一个epoch能观察到训练精度的提升
- model.fit(x_train, y_train, epochs=5)
-
- #计算训练了5个epoch的模型在测试集上的表现
- model.evaluate(x_test, y_test)
-
-
- #直观看一下模型预测结果,打印测试集中的前9张图像
- for i in range(9):
- plt.subplot(3,3,1+i)
- plt.imshow(x_test[i], cmap='gray')
- plt.show()
-
- #打印模型识别的数字,是否正确?
- np.argmax(model(x_test[:9]).numpy(), axis=1)
-
- #保存训练好的模型
- model.save("/data/output/model_epoch_5")
|