품질경영기사 19 : t 분포

안녕하세요, 감귤소년입니다.

 

오늘은 품질경영기사 공부의 19번째 이야기인 t 분포에 대한 내용입니다.

 

 

t 분포의 개념

 

통계에서 t-분포는 표본 크기가 작거나 모집단의 표준 편차를 알 수 없을 때 정규 분포를 따르는 모집단의 평균을 추정하는 데 사용되는 확률 분포입니다. 

 

표준 정규 분포와 비슷하지만 꼬리가 더 두껍습니다. 즉, 꼬리가 더 넓게 퍼져 있고 꼬리의 영역이 더 넓습니다.


t-분포는 1908년에 "Student"라는 가명으로 작업을 발표한 William Sealy Gosset에 의해 처음 소개되었습니다. 

 

Gosset은 아일랜드 더블린에 있는 기네스 양조장에서 일하는 통계학자였으며 품질을 개선하는 방법을 찾는 데 관심이 있었습니다. 

 

회사 맥주. 그는 실험의 표본 크기가 작고 모집단 표준 편차를 알 수 없다는 사실을 설명하는 방법으로 t-분포를 개발했습니다.

t-분포는 자유도(df)로 정의되며, 이는 표본의 독립 관측치 수입니다. 

 

자유도가 증가함에 따라 t-분포는 표준 정규 분포와 유사해집니다. 자유도가 무한대일 때 t-분포는 표준정규분포가 됩니다.

 

t 분포의 사용


t-분포는 t-테스트 및 분산 분석(ANOVA)을 비롯한 다양한 통계 테스트에 사용됩니다. 

 

t-검정은 두 독립 표본의 평균이 서로 유의하게 다른지 여부를 확인하는 데 사용되는 반면 ANOVA는 두 개 이상의 독립 표본의 평균이 서로 유의하게 다른지 여부를 확인하는 데 사용됩니다.

t-분포의 중요한 용도 중 하나는 신뢰 구간입니다. 

 

신뢰 구간은 특정 수준의 신뢰를 가진 실제 모집단 모수를 포함할 가능성이 있는 값의 범위입니다. 

 

예를 들어, 모집단 평균에 대한 95% 신뢰 구간은 모집단에서 많은 샘플을 추출하고 평균을 계산하는 경우 결과 구간의 95%에 실제 모집단 평균이 포함된다는 것을 의미합니다.

t 분포의 공식

t-분포를 사용하는 신뢰 구간의 공식은 다음과 같습니다.

X̄ ± tα/2,s/√n


여기서 X̄는 표본 평균이고, tα/2는 원하는 수준의 신뢰도와 자유도에 해당하는 t-점수이며, s는 표본 표준 편차, n은 표본 크기입니다.


예를 들어 표준 편차를 알 수 없는 정규 분포 모집단에서 20개의 관측치 샘플이 있다고 가정합니다. 

 

표본 평균은 50이고 표본 표준 편차는 10입니다. 모집단 평균에 대한 95% 신뢰 구간을 계산하려고 합니다.


자유도가 19인 t-분포(n-1)를 사용하여 95% 신뢰 수준과 19자유도에 해당하는 t-점수는 2.093입니다. 

 

값을 연결하면 다음을 얻습니다.

50 ± 2.093(10/√20) = (42.33, 57.67)


즉, 실제 모집단 평균이 구간(42.33, 57.67) 내에 있다고 95% 확신합니다.

t-분포의 또 다른 중요한 용도는 가설 검정입니다. 

 

가설 검정은 모집단 매개변수에 대한 주장을 뒷받침할 충분한 증거가 있는지 여부를 결정하는 방법입니다. 

 

귀무 가설은 테스트 중인 주장이고 대립 가설은 연구자가 지지하려는 주장입니다.

t-분포를 사용한 가설 검정에서 검정 통계량은 다음과 같이 계산됩니다.

t = (X̄ - μ) / (s/√n)


여기서 X̄는 표본 평균, μ는 가정된 모집단 평균, s는 표본 표준 편차, n은 표본 크기입니다.

그런 다음 t-점수는 자유도가 n-1이고 주어진 유의 수준(α)이 있는 t-분포의 임계값과 비교됩니다.

 

계산된 t-점수가 기각 영역(즉, 귀무가설이 있을 것 같지 않은 t-분포의 극단값) 내에 있으면 귀무가설이 기각되고 대립가설이 지지됩니다.

예를 들어, 연구자가 모집단의 평균 IQ 점수가 100이라는 주장을 테스트하려고 한다고 가정합니다. 

 

연구자는 25명의 무작위 표본을 추출하여 표본 평균이 105이고 표본 표준 편차가 15임을 알아냅니다. 유의성 사용 0.05 수준과 양측 테스트를 통해 다음과 같이 t-점수를 계산합니다.

t = (105 - 100) / (15/√25) = 2


t-테이블 또는 통계 소프트웨어를 사용하여 자유도가 24이고 유의 수준이 0.05인 양측 검정의 임계값은 ±2.064입니다. 

 

계산된 t-점수 2는 기각 영역(즉, 2.064보다 크거나 -2.064보다 작음)을 벗어나므로 귀무 가설이 기각되고 연구자는 모집단의 평균 IQ 점수가 100보다 클 가능성이 높다는 결론을 내릴 수 있습니다. .

 

t 분포의 속성


t-분포에는 통계 분석에 유용한 몇 가지 중요한 속성이 있습니다. 

 

첫째, 연속 분포입니다. 즉, 값 범위 내의 모든 값을 가질 수 있습니다. 

 

이 속성을 사용하면 이산 분포에 비해 모집단 매개변수를 더 정확하게 추정할 수 있습니다.

둘째, t-분포는 일반적으로 0인 평균을 중심으로 대칭입니다. 이는 양의 t-점수와 음의 t-점수를 얻을 확률이 동일함을 의미합니다. 이 속성을 사용하면 확률 및 임계 값을 더 쉽게 계산할 수 있습니다.

셋째, 표본의 크기가 커질수록 t-분포는 표준정규분포에 가까워진다. 이는 표본 크기가 커질수록 평균의 표준 오차가 감소하기 때문입니다. 이는 표본 평균의 분포가 모집단 평균을 중심으로 더 밀집되어 있음을 의미합니다.

결론


요약하면 t-분포는 표본의 크기가 작거나 모집단의 표준편차를 알 수 없을 때 정규분포된 모집단의 평균을 추정하기 위해 사용되는 확률분포이다.

 

표준 정규 분포와 비슷하지만 꼬리가 더 두껍습니다.

 

t-분포는 t-테스트 및 ANOVA를 비롯한 다양한 통계 테스트에 사용되며 신뢰 구간 및 가설 테스트에서 중요합니다.

 

연속성, 대칭성 및 표준 정규 분포로의 수렴을 포함한 속성은 통계 분석에서 유용한 도구입니다.