机器学习PAI 为什么还是1000个step才记录一次summaries?-[阿里云_云淘科技]

机器学习PAI save_summary_steps这个配置项我设置了值为50,为什么还是1000个step才记录一次summaries?在global step达到1000后,eval_results就不是空dict了

以下为热心网友提供的参考意见

save_summary_steps这个参数是用来控制训练过程中保存摘要的频率的。默认情况下,每1000个步骤会保存一次摘要。如果你将其设置为50,那么理论上应该每50个步骤就会保存一次摘要。

然而,这并不意味着每次保存摘要时都会进行一次评估。评估是在每个评估周期(eval_steps)进行的,而不是在每个保存摘要的步骤。所以,如果你的eval_steps设置为1000,那么每1000个步骤才会进行一次评估。

至于你提到的eval_resultsglobal_step达到1000后就不再为空,这可能是因为在训练开始时,模型还没有开始进行评估,所以eval_results为空。当global_step达到1000时,模型已经进行了第一次评估,所以eval_results就不再为空了。

如果你希望更频繁地进行评估,可以考虑减小eval_steps的值。但是请注意,频繁的评估可能会增加训练的时间,因为每次评估都需要对整个数据进行前向传播。

以下为热心网友提供的参考意见

根据你提供的信息,save_summary_steps配置项设置为50,但仍然每1000个step记录一次summaries。这可能是因为save_summary_steps的值被其他配置项覆盖或优先级更高的原因。

在PAI中,save_summary_steps配置项用于指定每隔多少步保存一次模型的摘要信息。然而,还有其他配置项可能会影响保存摘要的频率。例如,eval_interval和save_checkpoint_steps等配置项可能具有更高的优先级。

以下为热心网友提供的参考意见

eval 评估次数应该只是和 save_checkpoints_steps 有关,每一次保存 checkpoint 的时候,评估一次 ,此回答整理自钉群“【EasyRec】推荐算法交流群”

本文来自投稿,不代表新手站长_郑州云淘科技有限公司立场,如若转载,请注明出处:https://www.cnzhanzhang.com/13694.html

(0)
匿名
上一篇 2023年12月10日 下午3:39
下一篇 2023年12月10日

相关推荐

新手站长从“心”出发,感谢16年您始终不离不弃。