스피어만 브라운 공식

(반분 신뢰도에서 넘어옴)

스피어만 브라운 공식(Spearman-Brown formula) 혹은 브라운 스피어만 공식은 심리측정 및 교육측정 분야에서 스피어만 브라운 예측 공식, 스피어만 브라운 예언 공식 등으로도 지칭된다. 스피어만 브라운 공식은 검사의 길이를 변경시켰을 때 검사의 신뢰도를 예측하는 공식으로 사용된다. 혹은, 검사의 임의의 반분간 상관관계에서 항목간 신뢰도를 구하기 위한 반분 신뢰도 공식으로도 사용된다.

예측식의 계산편집

예측 공식  은 다음과 같다.

 .

여기서, n은 새롭게 만들어진 검사가 현재 검사의 몇 배인지의 비율,  은 현재 검사의 신뢰도이다.

이 공식은 현재 검사의 n배, 즉 현재 검사와 평행(parallel)인 n개의 검사를 만들었을 때 새 검사의 신뢰도를 예측한다. 예를 들어, n=2는 현재 검사와 동일한 속성을 가진 항목을 추가하여 검사의 길이를 두 배로 늘린다는 것을 의미한다. 1보다 작은 n을 쓸 경우, 검사를 줄일 때의 효과를 예측할 수 있다.

검사 길이의 예측편집

위의 공식을 정리하면, 특정 수준의 신뢰도를 얻기 위해서는 현재의 검사가 얼마나 더 길어져야 하는지도 예측할 수 있다.

 

반분 신뢰도편집

타우동등 신뢰도(tau-equivalent reliability)[1]가 개발되기 전까지, 반분 신뢰도는 항목간 신뢰도를 구하는 유일한 방법으로 활용되었다[2]. 즉, 전체 항목을 임의의 절반으로 나눈 후, 항목간 상관관계를 스피어만 브라운 공식에 의해 신뢰도로 변환하는 것이다.

 

여기서,  은 예를 들면 짝수문항번호와 홀수문항번호간의 반절씩 반분한 피어슨 상관관계를 표현한다. 위의 공식은 앞서 제시한 예측식에서 n=2를 대입한 것이다. 타우동등 신뢰도의 개발 이후 반분 신뢰도 계수로서 스피어만 브라운 공식은 거의 사용되지 않지만, 경우에 따라 이 방법이 유용하다고 주장하는 학자들도 있다.[3] 한편 크론바흐 알파 계수도 신뢰도가 높다.

다른 반분 신뢰도 계수와의 관계편집

반분 평행 신뢰도편집

Cho(2016)[4]는 기존의 신뢰도 계수들이 역사적으로 부정확하고 무의미한 이름과 무원칙적이고 비일관적인 공식 표현을 갖고 있다고 비판하면서 체계적 명칭과 공식 표현을 사용할 것을 제안하였다. 스피어만 브라운 공식의 가정은 두 반분이 평행(parallel)하다는 것, 즉 두 반분의 분산이 같다는 것이다. 스피어만 브라운 공식에 제안된 체계적 명칭은 반분 평행 신뢰도(split-half parallel reliability)이다. 또한, 다음과 같은 체계적 공식이 제안되었다.

 

반분 타우동등 신뢰도편집

반분 평행 신뢰도는 현실의 자료가 쉽게 충족하기 어려운 엄격한 가정을 요구한다. 반분 타우동등 신뢰도(Split-half tau-equivalent reliability)는 두 반분의 분산이 서로 같지 않은 경우에 사용될 수 있는 반분 신뢰도 계수이다. Flanagan-Rulon[5]( ,  ), Guttman[6]( )에 의해 다음과 같은 공식들이 제안되었다.

 ,  ,  .

여기서  ,  ,  , 는 각각 첫번째 반분, 두번째 반분, 두 반분의 합, 두 반분의 차이의 분산이다.

겉보기와는 달리, 이 공식들은 모두 대수적으로 동일하다. 그 체계적 공식[7]은 다음과 같다.

 .

반분 동류 신뢰도편집

반분 타우동등 신뢰도는 두 반분의 길이가 같다는 가정을 갖고 있다. 반분 동류 신뢰도(Split-half congeneric reliability)는 이 가정을 완화시킨 반분 신뢰도이다. 단, 주어진 정보보다 추정해야 하는 모수가 더 많기 때문에 또 다른 가정이 필요하다. Raju(1970)[8]는 각 반분의 상대적 길이가 알려져 있을 때의 반분 동류 신뢰도 계수를 발표하였다. Angoff(1953)[9]과 Feldt(1975)[10]는 각 반분의 길이가 각각의 분산과 공분산의 합에 비례한다고 가정했을 때의 반분 동류 신뢰도를 발표하였다[11].

역사편집

스피어만 브라운 공식은 Brown (1910)[12]과 Spearman (1910)[13]British Journal of Psychology에 동시에 발표한 논문에서 유래한다. 찰스 스피어만킹스 칼리지 런던에 함께 근무하던 칼 피어슨과 사이가 좋지 않았으며, 둘은 서로를 비판하고 조롱하는 논문을 주고 받았다.[14] 브라운은 피어슨의 지도를 받아 박사학위를 받았다. Brown은 박사 학위 논문[15]의 중요한 부분을 Spearman의 연구[16]를 비판하는 데 할애했다. 이 공식에서 스피어만이 브라운보다 먼저 등장하는 것은 스피어만이 브라운보다 더 명성이 높은 학자이기 때문이다.[17] 예를 들어, 스피어만은 신뢰도에 대한 최초의 이론을 정립하였으며,[18] "고전적 신뢰도 이론의 아버지"라고 지칭된다.[19] 즉, 마태 효과 혹은 스티글러의 명명법칙의 한 사례이다.

다음의 이유에서 이 공식은 브라운 공식, 혹은 브라운 스피어만 공식으로 지칭되어야 한다.[20] 첫째, 오늘날 우리가 사용하는 공식은 Spearman(1910)이 제안한 버전이 아니라, Brown(1910)이 제안한 버전이다. 반분신뢰도 공식도 Brown(1910)만이 명시적으로 제시하였다. 둘째, Brown(1910)의 공식 유도가 Spearman(1910)보다 더 간결하고 우아하다.[21] 셋째, Brown(1910)의 논문이 Spearman(1910)보다 먼저 쓰여졌을 가능성이 높다. Brown(1910)은 그의 박사 학위 논문에 기반하고 있으며, 이 논문이 발표될 당시에 그는 이미 박사학위를 취득한 상태였다. Spearman(1910)은 Brown(1910)을 비판했지만, Brown(1910)은 Spearman(1904)만을 비판하였다.넷째, 저자들을 알파벳 순서로 표기하는 것이 미국 심리학회의 인용 원칙(APA 양식)이다.

같이 보기편집

참고 문헌편집

  1. Kuder, G. F., & Richardson, M. W. (1937). The theory of the estimation of test reliability. Psychometrika, 2, 151-160. doi:10.1007/BF02288391.
  2. Kelley, T. L. (1924). Note on the Reliability of a Test: A reply to Dr. Crum’s criticism. Journal of Educational Psychology, 15, 193–204. doi:10.1037/h0072471.
  3. Eisinga, R.; Te Grotenhuis, M.; Pelzer, B. (2013). "The reliability of a two-item scale: Pearson, Cronbach or Spearman-Brown?". International Journal of Public Health. 58 (4): 637–642. doi:10.1007/s00038-012-0416-3
  4. Cho, E. (2016). Making reliability reliable: A systematic approach to reliability coefficients. Organizational Research Methods, 19, 651-682. doi:10.1177/1094428116656239.
  5. Flanagan, J. C. (1937). A proposed procedure for increasing the efficiency of objective tests. Journal of Educational Psychology, 28, 17-21. doi:10.1037/h0057430.
    Rulon, P. J. (1939). A simplified procedure for determining the reliability of a test by split-halves. Harvard Educational Review, 9, 99-103.
  6. Guttman, L. (1945). A basis for analyzing test-retest reliability. Psychometrika, 10, 255-282. doi:10.1007/BF02288892.
  7. Cho, E. (2016). Making reliability reliable: A systematic approach to reliability coefficients. Organizational Research Methods, 19, 651-682. doi:10.1177/1094428116656239.
  8. Raju, N. S. (1970). New formula for estimating total test reliability from parts ofunequal length. Proceedings of the 78th Annual Convention ofAPA, 5, 143-144.
  9. Angoff, W. H. (1953). Test reliability and effective test length. Psychometrika, 18(1), 1-14.
  10. Feldt, L. S. (1975). Estimation of the reliability of a test divided into two parts of unequal length. Psychometrika, 40(4), 557-561.
  11. Cho, E. (2016). Making reliability reliable: A systematic approach to reliability coefficients. Organizational Research Methods, 19, 651-682. doi:10.1177/1094428116656239.
  12. Brown, W. (1910). Some experimental results in the correlation of mental abilities. British Journal of Psychology, 3, 296-322.
  13. Spearman, C. (1910). Correlation calculated from faulty data. British Journal of Psychology, 1904-1920, 3, 271-295. doi:10.1111/j.2044-8295.1910.tb00206.x.
  14. Cowles, M. (2005). Statistics in psychology: An historical perspective. New York: Psychology Press.
  15. 나중에 책으로 출판됨 Brown, W. (1911). The essentials of mental measurement. London: Cambridge University Press.
  16. Spearman, C. (1904). The proof and measurement of association between two things. American Journal of Psychology, 15, 72-101.
  17. Cho, E. & Chun, S. (2018). Fixing a broken clock: A historical review of the originators reliability coefficients including Cronbach's alpha. Survey Research, 19(2), 23-54.
  18. Spearman, C. (1904). The proof and measurement of association between two things. American Journal of Psychology, 15, 72-101.
  19. Cronbach, L. J., Rajaratnam, N., & Gleser, G. C. (1963). Theory of generalizability: A liberalization of reliability theory. British Journal of Statistical Psychology, 16, 137-163. doi:10.1111/j.2044-8317.1963.tb00206.x.
  20. Cho, E. & Chun, S. (2018). Fixing a broken clock: A historical review of the originators reliability coefficients including Cronbach's alpha. Survey Research, 19(2), 23-54.
  21. Traub, R. E. (1997). Classical test theory in historical perspective. Educational Measurement: Issues and Practice, 16, 8-14. doi:10.1111/j.1745-3992.1997.tb00603.x.