?
你先抽掉10亿升的水(相当于减去最大值),这样所有的水量都变成一个较小的数字,水池就不会溢出了。
比喻2:计算机的“溢出”锅
假设你在做饭,想同时煮四个锅的水,每个锅的温度分别是:
?
100°c
?
200°c
?
300°c
?
10亿°c
你的炉子最高只能加热到
500°c,但第四个锅的温度远超这个上限,直接导致炉子爆炸(计算机溢出)!
怎么办?
你可以先把所有锅的温度减去一个基准值(比如减去10亿°c),让温度变成:
?
-9。99亿°c
?
-9。98亿°c
?
-9。97亿°c
?
0°c
现在,最高的温度也只是
0°c,不会再超出炉子的承受范围。
总结
?
softmax的溢出问题
是因为指数运算会导致数值过大,超过计算机的上限。
?
解决方案
是在计算softmax之前,先减去最大值,这样所有的数值都会变小,防止指数爆炸。
?
就像往水池倒水、往锅里加热,数值太大就会溢出,我们需要先做调整,确保计算不超出范围!