공식의 이해 (왜 꼭 제곱하는가?)
표준편차의 공식을 증명하지는 않겠습니다.
공식은 평균에서 떨어진 만큼 제곱해서 그것을 다 더하고 n으로 나누는 개념입니다.
하지만 왜 제곱하는 지를 알면 표준편차의 수치를 더 믿게 될 겁니다.
끝까지 읽으면 아~~ 할 겁니다.
확실히 표준편차를 보는 감각이 달라집니다.
▶표준편차 실생활 예시
전 포스팅 예시처럼, 저는 효정이와 만남 약속을 합니다.
약속시간 기준으로 일찍 오냐, 늦게 오냐, 제시간에 오냐를 변량으로 합니다.
충분히 만났고, 평균은 0이라고 하겠습니다.
(일찍 오는 것과, 늦게 오는 것이 상쇄되어 평균은 0)
3시 00분에 오면 : 0
2시 50분에 오면 : -10
3시 10분에 오면 : +10
3시 50분에 오면 : +50
2시 50분(-10), 3시 10분(+10)
이 둘은 같은 취급 하면 안 되고 구분을 해야 하잖아요?
단순히 더하면 0이니까 데이터가 없는 것과 마찬가지가 되므로 안 되는 건 알겠죠?
그러면 이런 의문이 생길 겁니다.
질문 A. 절댓값 :ㅣ-10ㅣ+ㅣ10ㅣ
질문 B. 세제곱 : (-10)³ + (10)³
질문 C. 네제곱 : (-10)⁴ + (10)⁴
이런 건 안 되나?
왜 하필 제곱만 되는 거지?
답변 A 절댓값 : 안 됩니다. 만약에 효정이가
1. 1분을 50번 늦은 경우
솔직히 1분을 50번 늦은 게 머리에 들어오나요?
1분인데?
2. 50분을 1번 늦은 경우
근데 50분을 1번 늦은 경우는 어떤가요?
바로 늦는 친구구나 뇌리에 박히죠.
절댓값으로 할 경우 1 × 50 = 50 × 1이기 때문에 이 둘은 동일하게 평가됩니다.
평균에서 멀리 떨어지면 '가중치'를 주어 '증폭'해야 합니다.
그래야 평균에서 크게 벗어난 데이터를 수치로 표현할 수 있습니다.
또한, 절댓값은 미분이 불가능하기 때문에 연산에 불리한 것도 있습니다.
답변 B 세제곱 : 안 됩니다.
(-10)³ + (10)³ = 0 이죠?
단순 합산과 동일한 논리입니다.
빨리 온 것과, 늦게 온 것이 서로 상쇄가 되기 때문입니다.
(즉, 홀수 차수는 전부 안 됩니다.)
답변 C 네제곱 : 됩니다. 다만 제곱보다는 별로입니다.
50분을 1번 늦은 경우
제곱의 경우도 50²=2500으로 증폭이 충분히 됩니다.
네제곱의 경우는 50⁴=6,250,000으로 증폭이 너무 큽니다...
50분 1번 늦었다고 거의 매장시키는 꼴이죠... ㅋㅋ
증폭도 너무 크고, 통계량들은 상호 간 융합하여 연산을 많이 하는데요.
제곱은 미분하면 1차 식이 되어서 계산에 용이합니다.
네제곱은 미분하면 3차 식이 되어서 계산에 불리합니다.
핵심은
'부호 제거'
'증폭'
2가지입니다.
▶표준편차 제곱의 결론
표준편차는 평균으로부터 멀리 떨어져 있는 데이터를 증폭하여 표현해야 하는데, 그 적합성은 '제곱' 뿐입니다.
제곱보다 좋은 방법은 없기 때문입니다.
그래서 논란이 없는 공식입니다.
그리고 표준편차 이외에도 수많은 통계량은 동일 논리가 적용됩니다.
일부를 제외하곤, 대부분 제곱을 사용합니다.
오늘 표준편차의 공식에서 왜 제곱을 쓰는지 이해했나요?
제곱하는 이유를 알고 표준편차 수치를 보는 것과 그렇지 않은 것은 보이는 게 다릅니다.
표준편차의 정성적인 이해를 하고 싶으면 아래 포스팅 확인 바랍니다!
'해외 ETF, 투자 지식' 카테고리의 다른 글
레버리지 투자에서 왜 특히 'ETF'가 위험한가? [나스닥 QQQ, TQQQ 사태] (2) | 2024.01.10 |
---|---|
레버리지 투자가 불리한 이유는 단지 위험해서일까? [변동성의 중요성] (0) | 2024.01.09 |
표준편차 뜻을 제발.. 제대로 알고 가세요![단순 공식 X] 비트코인 예시 (0) | 2024.01.05 |
복리의 올바른 개념 - 워런버핏 복리 23%, 단리 1,325% 이유 [대부분 안다고 착각] (0) | 2024.01.04 |
투자 수익률의 올바른 개념을 알아보자 [대부분 모름] (2) | 2024.01.03 |