Среднеквадратичное отклонение

Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

То есть среднеквадратичное отклонение используют чтобы определить насколько значении данных отдалены от среднего значения? Почему в формуле используют квадрат отклонения? Почему не используют просто отношение суммы отклонения на общее количество данных чтобы определить сгруппированность?

Потому что рассматривается разброс по модулю. Если суммировать обычные отклонения, то результат разности между данной точкой и средним значением может быть как положительным, так и отрицательным. Например, если точки разбросаны симметрично, то таким способом общее отклонение равно нулю, что на самом деле не так.

1 лайк

Почему тогда просто не используют модуль отклонения? Мне кажется она бы решила проблему симметричного графика.

Можно, но расчёты с ним проводить не всегда удобно. Лично я не видел такого, чтобы взятию в квадрат предпочли использование модуля и так рассчитывали разброс.

Потому что f(x)=|x| не является непрерывной функцией, а значит она недифференциируема. Значит с ней неудобно работать (что если мы хотим минимизировать среднеквадр. отклонение?)

Еще дисперсия (variance, Var) суммы независимых случайных величин есть сумма дисперсий независимых величин. Если X, Y две случайные независимые величины, то

Var(X+Y)=Var(X)+Var(Y)

Сильно сомневаюсь, что такое будет работать с модулем.

Помимо этого, у f(x)=x^2 есть еще и другое преимущество – она наказывает большие отклонения сильнее, чем маленькие.

Существует mean absolute error, но она больше про accuracy, нежели precision.

3 лайка

Является :smiley: , но тем не менее не дифференциируема в x = 0

4 лайка