품질경영기사 20 : 카이제곱분포

안녕하세요, 감귤소년입니다.

 

오늘은 품질경영기사 공부의 20번째 이야기인 카이제곱분포에 대한 공부 정리 내용입니다.

 

 


카이 제곱 분포는 두 개 이상의 범주형 변수가 독립적인지 여부에 대한 가설을 테스트하기 위해 통계에서 널리 사용되는 확률 분포입니다. 

 

카이 제곱 분포는 감마 분포의 특별한 경우이며 그리스 문자 "χ²"로 표시됩니다. 이 블로그 게시물에서는 카이제곱 분포의 속성과 응용에 대해 설명합니다.


카이제곱 분포의 속성



카이 제곱 분포는 자유도라고 하는 단일 모수를 갖는 연속 확률 분포입니다. 

 

카이제곱 분포의 자유도(df)는 표본의 독립 관측치 수를 나타냅니다. 자유도는 카이제곱 분포의 형태, 위치 및 척도를 결정합니다. 카이제곱 분포를 계산하는 공식은 다음과 같습니다.

χ² = Σ (Oi - Ei)² / Ei

어디,


χ²는 카이제곱 값입니다.


Oi는 범주의 관측 빈도입니다.


Ei는 범주의 예상 빈도입니다.


Σ는 모든 범주의 합입니다.

카이 제곱 분포는 양의 방향으로 치우쳐서 오른쪽 꼬리가 길다는 의미입니다. 

 

자유도가 증가함에 따라 분포의 모양이 더 대칭이 되고 꼬리가 더 짧아집니다.


카이제곱 분포의 평균은 자유도와 같고 분산은 자유도의 두 배입니다. 따라서 자유도가 작으면 분포의 변동성이 크고 자유도가 크면 분포의 변동성이 적습니다.


카이제곱 분포의 응용



카이 제곱 분포는 가설 검정, 적합도 검정 및 독립 검정을 포함하여 통계에서 많은 응용 분야를 가지고 있습니다.


가설 검증


카이제곱 분포의 주요 응용 분야 중 하나는 가설 검정입니다. 

 

가설 검정에는 관찰된 데이터와 예상 데이터를 비교하여 두 데이터 사이에 상당한 차이가 있는지 확인하는 작업이 포함됩니다. 

 

카이제곱 검정은 관찰된 데이터와 예상 데이터 간에 차이가 없다는 귀무가설을 테스트하는 데 사용됩니다. 

 

카이 제곱 검정에는 카이 제곱 값을 계산하고 이를 카이 제곱 분포표의 임계값과 비교하는 작업이 포함됩니다. 

 

카이제곱 값이 임계값보다 크면 귀무가설을 기각하고 관측 데이터와 예상 데이터 간에 상당한 차이가 있다는 결론을 내립니다.


적합도 테스트


카이 제곱 분포의 또 다른 응용 분야는 적합도 테스트입니다. 

 

적합도 검정은 샘플이 특정 모집단 또는 분포에서 나오는지 확인하는 데 사용됩니다. 

 

카이제곱 검정은 표본이 특정 모집단 또는 분포에서 나온다는 귀무가설을 검정하는 데 사용됩니다. 

 

카이 제곱 검정에는 카이 제곱 값을 계산하고 이를 카이 제곱 분포표의 임계값과 비교하는 작업이 포함됩니다. 

 

카이제곱 값이 임계값보다 크면 귀무가설을 기각하고 표본이 특정 모집단이나 분포에서 나오지 않는다는 결론을 내립니다.


독립 테스트


카이제곱 분포는 독립 검정에도 사용됩니다. 

 

독립 검정은 두 개 이상의 범주형 변수가 독립적인지 확인하는 데 사용됩니다. 

 

카이제곱 독립성 검정은 두 범주형 변수가 독립적이라는 귀무가설을 검정하는 데 사용됩니다. 

 

카이 제곱 검정에는 카이 제곱 값을 계산하고 이를 카이 제곱 분포표의 임계값과 비교하는 작업이 포함됩니다. 

 

카이제곱 값이 임계값보다 크면 귀무가설을 기각하고 두 범주형 변수가 독립적이지 않다는 결론을 내립니다.


결론


카이 제곱 분포는 통계에서 널리 사용되는 연속 확률 분포입니다. 

 

가설을 테스트하고, 적합도를 테스트하고, 범주형 변수 간의 독립성을 테스트하는 데 사용됩니다. 

 

카이제곱 분포는 긍정적으로 치우쳐 있으며 그 모양은 자유도에 따라 결정됩니다. 자유도가 증가함에 따라 분포는 더 대칭적이고 덜 가변적입니다. 

 

카이제곱분포는 통계분석에 필수적인 도구로 그 응용분야는 다양하다.

 

카이제곱 분포의 또 다른 중요한 속성은 정규 분포와의 관계입니다. 

 

표본 크기가 크면 카이제곱 분포가 정규 분포에 가까워집니다. 이를 정규 분포에 대한 카이제곱 근사치라고 합니다. 

 

이 속성은 비율에 대한 z-테스트 및 평균에 대한 t-테스트와 같은 많은 통계 테스트에 사용됩니다.

카이제곱 분포는 가설 검정, 적합도 검정 및 독립성 검정에 적용하는 것 외에도 생물학, 물리학 및 공학을 비롯한 다양한 연구 분야에서 사용됩니다. 

 

예를 들어, 생물학에서 카이제곱 분포는 유전 실험의 데이터를 분석하고 모집단 간의 특성 분포에 대한 가설을 테스트하는 데 사용됩니다. 

 

물리학에서 카이제곱 분포는 시스템의 입자 분포를 분석하고 서로 다른 물리적 변수 간의 관계에 대한 가설을 테스트하는 데 사용됩니다. 

 

공학에서 카이제곱 분포는 시스템의 신뢰성을 테스트하고 실패 분포를 분석하는 데 사용됩니다.

카이제곱 적합도 검정, 카이제곱 독립성 검정, 카이제곱 동질성 검정 등 다양한 유형의 카이제곱 검정이 있습니다. 

 

각 테스트에는 고유한 특정 응용 프로그램이 있지만 모두 동일한 공식을 사용하여 카이제곱 값을 계산합니다. 

 

이 공식은 관찰된 빈도에서 예상 빈도를 빼고 그 차이를 제곱한 다음 결과를 예상 빈도로 나누는 것과 관련됩니다. 

 

이 모든 값의 합은 가설을 테스트하는 데 사용되는 카이제곱 값을 제공합니다.

카이제곱 분포에는 통계 테스트에 사용하기 위해 충족해야 하는 특정 가정이 있다는 점에 유의하는 것이 중요합니다. 

 

이러한 가정 중 하나는 데이터가 범주형이어야 한다는 것입니다. 즉, 값은 개별 범주 또는 클래스에 속해야 합니다. 

 

또 다른 가정은 각 범주에 대한 예상 빈도가 5 이상이어야 한다는 것입니다. 이러한 가정이 충족되지 않으면 카이제곱 검정이 유효하지 않을 수 있으므로 대체 검정을 사용해야 합니다.

결론적으로 카이 제곱 분포는 가설을 테스트하고, 데이터를 분석하고, 모집단에 대해 추론하는 데 사용되는 통계 분석의 기본 도구입니다. 

 

양의 방향으로 치우친 연속 확률 분포이며 그 모양은 자유도에 의해 결정됩니다. 

 

카이 제곱 분포는 다양한 연구 분야에서 많은 응용 분야를 가지고 있으며 통계 연구자 및 실무자에게 필수적인 도구입니다.