简单总结下教训:
输入,输出
输入就是 a和 b, 输出是c。
First attempt
一开始想把天数,1到28天作为输入,28天的感染人数作为输出。去找 天数和 感染的函数关系。错误的原因,28天只是任意的28天时间段,去强行找 1-28 和感染的关系是不成立的。也没有关系。
Second attempt
用RNN实现,方向是对的。能力不够复现RNN或LSTM(吐槽下,老师说如果要写的话,要从0复现一个,地狱级难度任务)
总结
其实确认输入输出,最重要的就是确立,想找的是什么与什么直接的关系。相互影响的那两个量。题目写的已经很清楚了,用c_t 和 t_pd 预测 c_inf
其中忽视的问题
只看到了cost变大,没有去考虑原因。原因是因为梯度爆炸。梯度爆炸的原因是,输入之间差值太大,呈现exponetial爆炸增长。
!!!! 最重要学到的点,什么时候要做归一化,即Normalizition
归一化,在处理奇异值时候特别重要,如果数据存在极大或极小值,会严重影响weight 的收敛。归一化即,把输入和输出限制在同意范围内,如[0,1],映射到同一维度内。
参考:机器学习——标准化/归一化的目的和作用
Anyway, 有空的话,可以用LSTM复现个玩玩。获取一个多维度输入,输出将来的感染人数。直到感染变化为0为止。