t-검정

(T-테스트에서 넘어옴)

t-검정 (t-test) 또는 스튜던트 t-테스트 (Student's t-test)는 검정통계량귀무가설 하에서 t-분포를 따르는 통계적 가설 검정법이다.

t-테스트는 일반적으로 검정통계량이 정규 분포를 따르며 분포와 관련된 스케일링 변숫값들이 알려진 경우에 사용한다. 이때 모집단분산과 같은 스케일링 항을 알 수 없으나, 이를 데이터를 기반으로 한 추정값으로 대체하면 검정통계량은 t-분포를 따른다. 예를 들어 t-테스트를 사용하여 두 데이터 세트(집단)의 평균이 서로 유의하게 다른지 여부를 판별할 수 있다.

역사

편집
 
t-테스트를 스튜던트라는 필명으로 발표한 윌리엄 실리 고셋의 사진.

t-분포는 1876년에 프리드리히 로베르트 헬메르트[1][2][3] 야콥 뤼로스[4][5][6] 의해 사후검정법 중 하나로 유도되는데, 1895년에는 칼 피어슨에 의해 피어슨 분포 4형의 특별한 꼴임이 밝혀졌다.[7] 스튜던트 t 분포라는 이름은 1906년부터 1907년까지 유니버시티 칼리지 런던의 칼 피어슨 휘하 연구실에 있었던[8] 윌리엄 실리 고셋이 1908년 과학 학술지인 《바이오메트리카Biometrika》에 스튜던트라는 필명으로[주해 1] 논문을 제출한 데에서 기인했다.[10][11] 로널드 피셔가 이 분포를 소개하면서 '스튜던트 t-분포', '스튜던트 t-테스트'라는 이름을 사용해 널리 알려지게 되었다.[12]

t-테스트는 독립된 또는 종속된(대응된) 두집단의 비교에서 유용하다. 일반적인 연구설계나 논문등에서 t-검정(t檢定)은 두 평균 등 비교값이 의미 있게 차이가 나는지를 검사하는 방법으로 많이 사용된다. 영가설 하에서 t-분포를 이루는 통계치를 사용한다. t-테스트는 일반적으로 영가설 기각여부에 앞서서 등분산성(homoskedasticity)을 검증하는 전단계를 갖는다. 스튜던트 t-검정(Student t檢定)으로도 불리며 두 표본 평균 간의 차이에 대한 유의성을 결정하는 데 유용한 통계적 방법이다.

통계프로그램

편집

IBM SPSS는 T-테스트에서 영가설의 임계치(α) 영역(영가설 기각 유무)을 확인할 수 있는 P값(유의확률)인 sig를 제시한다. PSPP에서도 이와같이 sig 값을 보여준다.

(예) α < sig(P) 이면 영가설 채택(영가설 기각불가)
(예) α > sig(P) 이면 영가설 기각 (대립가설 채택 - 통계적으로 유의미하다)

이러한 IBM SPSS , PSPP, R, SAS등의 통계프로그램의 가설검증은 가독성을 높이는 P값(유의확률) sig를 보여준다는 점에서 T-테스트뿐만아니라 분산분석,회귀분석등에서 일관되게 편리성을 제공한다.

Z테스트

편집

Z-테스트로부터 T-테스트 값을 계산하여 추정할 수 있다.

 

같이 보기

편집

주해

편집
  1. 고셋을 고용한 기네스에서는 기업의 비밀 엄수를 위해 원래 논문의 발표를 허용하지 않았으나, 특별히 필명을 사용한다는 조건으로 허용한 것이다.[9]

각주

편집
  1. Szabó, István (2003), 《Einführung in die Technische Mechanik》 (Springer Berlin Heidelberg), 196–199쪽, doi:10.1007/978-3-642-61925-0_16, ISBN 978-3-540-13293-6  |제목=이(가) 없거나 비었음 (도움말); |장=이 무시됨 (도움말)
  2. Schlyvitch, B. (October 1937). “Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit in Zusammenhang stehende Fragen”. 《Zeitschrift für Anatomie und Entwicklungsgeschichte》 107 (6): 709–737. doi:10.1007/bf02118337. ISSN 0340-2061. S2CID 27311567. 
  3. Helmert (1876). “Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit”. 《Astronomische Nachrichten》 (독일어) 88 (8–9): 113–131. Bibcode:1876AN.....88..113H. doi:10.1002/asna.18760880802. 
  4. Lüroth, J. (1876). “Vergleichung von zwei Werthen des wahrscheinlichen Fehlers”. 《Astronomische Nachrichten》 (독일어) 87 (14): 209–220. Bibcode:1876AN.....87..209L. doi:10.1002/asna.18760871402. 
  5. Pfanzagl J, Sheynin O (1996). "Studies in the history of probability and statistics. XLIV. A forerunner of the t-distribution". Biometrika. 83 (4): 891–898. doi:10.1093/biomet/83.4.891. MR 1766040.
  6. Sheynin, Oscar (1995). “Helmert's work in the theory of errors”. 《Archive for History of Exact Sciences》 (영어) 49 (1): 73–104. doi:10.1007/BF00374700. ISSN 0003-9519. S2CID 121241599. 
  7. Pearson, K. (1895-01-01). "Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material". Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. 186: 343–414 (374). doi:10.1098/rsta.1895.0010. ISSN 1364-503X
  8. Raju, T. N. (2005). “William Sealy Gosset and William A. Silverman: Two "students" of science”. 《Pediatrics116 (3): 732–5. doi:10.1542/peds.2005-1134. PMID 16140715. S2CID 32745754. 
  9. Wendl MC (2016). "Pseudonymous fame". Science. 351 (6280): 1406. doi:10.1126/science.351.6280.1406.  PMID 27013722
  10. "Student" William Sealy Gosset (1908). "The probable error of a mean" (PDF). Biometrika. 6 (1): 1–25. doi:10.1093/biomet/6.1.1. hdl:10338.dmlcz/143545. JSTOR 2331554
  11. “T Table | History of T Table, Etymology, one-tail T Table, two-tail T Table and T-statistic”. 
  12. Walpole, Ronald E. (2006). 《Probability & statistics for engineers & scientists》. Myers, H. Raymond. 7판. New Delhi: Pearson. ISBN 81-7758-404-9. OCLC 818811849.