티스토리 뷰

과학과 연구

엑셀 표준편차 그래프 STDEV 함수 간단히 처리하기

건강한돼지와 병약한멸치 2018. 9. 19. 13:36

안녕하세요 신박한 정보를 전하는 실리비우스입니다. 논문을 정리하다보면 본인의 전공과 상관없이 통계처리를 해야하는 일이 많은데요. 모든 종류의 데이터는 의미를 가지기 위해서는 통계적으로 처리 및 의미를 가지는 숫자를 나타내야 하기때문입니다. 그 중에서도 표준편차는 자료의 값이 평균에서 얼마나 흩어져 있는 지를 보여주는 값이므로 데이터의 특성 및 신뢰도 등을 판단하는데 중요한 역할을 하기도 합니다. 오늘은 엑셀을 이용해서 표준편차를 구하고 표준오차 등을 구하는 방법을 알아보도록 하겠습니다.



표준편차와 표준오차를 이용해서 데이터의 신뢰도를 믿을 수 있는지 그래프에 에러바를 다는 것도 대부분의 상위 저널에서는 거의 대부분 요구하는 부분이기도 합니다. 아마 표준편차나 오차를 표시하지 않는 경우에는 메이저 리비전이나 마이너 리비전에 아마도 이 내용이 포함되어 있지 않을까 하는 내용이 듭니다. 




표준편차 (Standard Deviation)


먼저 간단하게 표준편차에 대해서 알아보겠습니다.




만일 두 명의 학생이 평균 80점을 맞았다고 가정을 해보겠습니다. 이런 경우 두 학생의 등수는 동일할 수 있겠지만 두 학생이 골고루 80점 정도의 성적을 모든 과목에서 얻었는지 혹은 특정 과목에서는 매우 높은 점수를 얻고 다른 과목에서는 매우 낮은 점수를 얻었는지를 알아보는 것이 표준편차입니다.



예를 들자면, 현재 국어 영어 수학 생물 화학 물리 총 6가지 과목을 A와 B학생의 점수를 얻었습니다. 각 학생의 평균은 80점으로 동일한데요. (Average함수를 이용했습니다.)



두 학생의 평균은 동일하므로 같은 등수일 가능성이 있지만, 두 학생의 표준편차는 큰 차이가 납니다. A학생은 0.89/ B학생은 7.75 의 표준편차를 보이는데요. 즉 B학생은 점수의 분포가 훨씬 더 크다는 것을 보여주는 것입니다. 



엑셀의 경우 표준편차를 얻는 것은 =STDEV(C8:H8) 로 계산했습니다.


표준 오류의 경우는 S.E.로 표현을 하기도 하는데요. Standard error의 줄임말로 위의 두 가지 경우에 정규분포의 경우 모집단의 평균이 95% 가 신뢰구간이 되는데요. 예를 들어서 평균값에 비해서 분포가 너무 넓으면 신뢰할 수 있는 구간의 범위도 영향을 받는 다는 것을 알아두시면 되겠습니다. 





표준 오차 (Standard Error)


표준 오차의 함수는 아래와 같은데요. 값의 범위만 바꿔주셔서 사용하시면 됩니다. 


=STDEV(Q19:Q23)/SQRT(COUNT(Q19:Q23))


오늘은 엑셀을 통해서 표준편차와 표준오차를 알아보는 방법을 알아봤는데요. 위에 표준 오류라고 오타가 있습니다만... 표준 오차를 뜻한 것입니다. 혹시라도 엑셀 파일이 필요하신 분이 계신다면 이메일 주소를 남겨주시면 보내드리겠습니다. 다음번에는 엑셀에 표준편차와 표준오차를 계산한 후에 그래프에 표시하는 방법을 알아보겠습니다. 도움이 되셨기를 바라겠고 즐거운 실험실 생활 되세요 :)

댓글