TensorFlow模型的保存与加载(二) |
您所在的位置:网站首页 › tensorflowjs模型转换 › TensorFlow模型的保存与加载(二) |
如果本文对您有帮助,欢迎点赞支持! 目录前言 1、TF模型保存方法 2、pb模式 3、适合保存模型的时机 一、保存模型 1、定义简单网络模型 2、保存网络模型为pb文件 二、加载网络模型 前言 1、TF模型保存方法网络模型的保存和重载操作是学习和训练AI模型的必备技能之一,也是进一步学习迁移学习知识的基础。Tensorflow的模型保存加载有不同格式,使用方法也不一样。目前来看,Tensorflow的保存方式按照生成的主要文件的格式基本可以分为三种:(1)checkpoint模式;(2) pb模式;(3)saved_model模式。 2、pb模式通常我们使用 TensorFlow时保存模型都使用 ckpt 格式的模型文件,但是这种方式依赖 TensorFlow 的,只能在其框架下使用。 谷歌推荐保存模型为 PB 文件,这种方式具有以下优点: (1)PB文件是一种可以跨语言,跨运行环境的序列化格式,几乎任何主流编程语言都可以解析它,它也允许其它深度学习框架读取、继续训练和迁移 TensorFlow 的模型。 (2)PB 文件会将模型的变量都会变成常量来使模型的大小大大减小,适合在手机端运行。 3、适合保存模型的时机尽可能多地保存模型能帮助我们不错过效果最好的模型,但是实际操作也要考虑内存大小和运行效率。 工程师的通用做法是每训练多少步后就在验证集上计算一次准确率,如果本次结果比上次好则保存新的模型。最常见的做法是直接每训练多少步就直接保存一次模型,实际上TensorFlow的API也提供了在模型文件名提供添加训练step后缀的方式。 一、保存模型在上述内容我们只是介绍了方法步骤,而且路径的输入上也存在一些技巧,所以我们实际使用时要将上述步骤封装起来,下面我们将上述方法封装起来并给出测试代码和运行效果: 1、定义简单网络模型为了让读者将精力集中到模型的保存和加载上,这里我们使用一个非常简单的计算图结构x*y+b: # 定义计算图结构 x*y+b x = tf.placeholder(tf.int32, name='x_input') y = tf.placeholder(tf.int32, name='y_input') b = tf.Variable(1, name='b') xy = tf.multiply(x, y) output = tf.add(xy, b, name='output')运行上述计算图,相关测试代码如下: # 输出计算图结果 sess = tf.Session() sess.run(tf.global_variables_initializer()) y_pred = sess.run(output, {x: 10, y: 3}) print(y_pred) # 输出31最后输出结果是10*3+1=31,和我们预想的一致。 2、保存网络模型为pb文件接下来我们使用如下方法保存该计算图模型: save_pb_model(sess,'./models/',['output'])save_pb_model()是我们封装的方法,其相关代码如下: def save_pb_model(sess, save_path, output_nodes): # 将变量转换为常量,第1个参数是会话,第2个参数计算图的graph_def对象;第3个参数是结果输出节点的名称 output_graph_def = graph_util.convert_variables_to_constants(sess, tf.get_default_graph().as_graph_def(), output_nodes) # 检查是否存在路径 path = os.path.abspath(save_path) # 获取绝对路径 if os.path.exists(path) is False: os.makedirs(path) print("成功创建模型保存新路径:{}".format(path)) # 将计算图写入序列化的pb文件,第1个参数是保存路径及其文件名 with tf.gfile.FastGFile(save_path + "model.pb", mode="wb") as f: f.write(output_graph_def.SerializeToString()) print("成功使用PB模式保存模型到路径:{}".format(path))成功运行后,会生成如下文件: 注意,运行代码中,代码编辑器可能不会马上更新文件目录,建议打开目录查看下是否生成。 二、加载网络模型现在我们要将上述保存的计算图结构x*y+b从文件中重载出来,下面直接给出加载代码: # 加载计算图结构 x*y+b sess = tf.Session() load_pb_model(sess, './models/') # 获取计算图节点 graph = tf.get_default_graph() # 获取计算图 x = graph.get_tensor_by_name("x_input:0") y = graph.get_tensor_by_name("y_input:0") output= graph.get_tensor_by_name("output:0") # 运行计算图计算结果 y_pred = sess.run(output, {x: 10, y: 3}) print(y_pred) # 输出 31其中加载方法load_pb_model()代码如下: def load_pb_model(sess, save_path): with tf.gfile.FastGFile(save_path + 'model.pb', 'rb') as f: graph_def = tf.GraphDef() graph_def.ParseFromString(f.read()) sess.graph.as_default() tf.import_graph_def(graph_def, name='') # 导入计算图
|
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |