import os
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np

mnist = tf.keras.datasets.mnist
(x_train, y_train),(x_test, y_test) = mnist.load_data(path="/data/data/mnist.npz")   #加载mnist数据集

#验证mnist数据集大小。x为数据,y为标签。mnist每张图的像素为28*28
print(x_train.shape)
print(y_train.shape)
print(x_test.shape)
print(y_test.shape)

#打印训练集中前9张,看看是什么数字
for i in range(9):  
    plt.subplot(3,3,1+i)
    plt.imshow(x_train[i], cmap='gray')
plt.show()

#打印相应的标签
print(y_train[:9])

#基操:将像素标准化一下
x_train, x_test = x_train / 255.0, x_test / 255.0

#搭建一个两层神经网络
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),    #拉伸图像成一维向量
  tf.keras.layers.Dense(128, activation='relu'),    #第一层全连接+ReLU激活
  tf.keras.layers.Dropout(0.2),                     #dropout层
  tf.keras.layers.Dense(10, activation='softmax')   #第二层全连接+softmax激活,输出预测标签
])

#设置训练超参,优化器为sgd,损失函数为交叉熵,训练衡量指标为accuracy
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

#开始训练,训练5个epoch,一个epoch代表所有图像计算一遍。每一个epoch能观察到训练精度的提升
model.fit(x_train, y_train, epochs=5)

#计算训练了5个epoch的模型在测试集上的表现
model.evaluate(x_test,  y_test)


#直观看一下模型预测结果,打印测试集中的前9张图像
for i in range(9):  
    plt.subplot(3,3,1+i)
    plt.imshow(x_test[i], cmap='gray')
plt.show()

#打印模型识别的数字,是否正确?
np.argmax(model(x_test[:9]).numpy(), axis=1)

#保存训练好的模型
model.save("/data/output/model_epoch_5")