Kaggle平台持续运行项目最多9小时的解决方法

您所在的位置:网站首页 kaggle免费gpu30小时 Kaggle平台持续运行项目最多9小时的解决方法

Kaggle平台持续运行项目最多9小时的解决方法

2023-08-09 10:01| 来源: 网络整理| 查看: 265

在Kaggle平台运行自己的项目经常遇到9小时就中断的问题,很多时候到9小时项目并没有跑完,导致前面的时间都浪费了,没能能到最终结果。

有一个解决方案是分开运行项目。如果一共需要跑200轮,则拆分成两次跑,一次100轮。(这100轮要保证能够在9小时内跑完。)

注意:1、前100轮的epoch=100,后100轮的epoch=200!千万不要设置错了。

           2、运行的时候要选择 Save&Run All,将模型保存下来,这样才能继续训练,并且查看日志文件。

            3、前100轮跑完之后,更改代码中的epoch值,更改模型读取保存模型的路径。路径一定要仔细查看,弄错了就没法使用之前保存好的模型了。保存下来的模型一般都是保存到/kaggle/working中,和日志文件的根路径一样。代码更改完之后重新上传后运行,运行过程如下图所示,前一次的epoch=1,第二次设置为3,可以看到使用了之前的模型,从第二轮开始跑的。这样就能解决9小时限制的问题啦!

        下图标注出的地方是我训练代码里更改的路径。先将之前训练好的模型下载下来,加入到项目中,再重新上传项目。代码里加上一句,把之前训练好的模型加入到现在的日志文件中。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3