응용통계학 - 10장 단일 표본 가설 검정

대학공부 2018. 12. 8. 15:59

응용통계학 - 10장 단일 표본 가설 검정.docx


수업 PPT 정리 했습니다. word파일 받아주세요!


           10 단일 표본 가설 검정

LO10-1 가설 검정 과정을 설명함

LO10-2 여섯 단계의 가설검정 과정을 적용함

LO10-3 한쪽꼬리검정과 양쪽꼬리검정을 구별함

LO10-4 모집단 평균에 대한 가설검정을 수행함

LO10-5 p-값을 계산하고 해석함

LO10-6 가설 검정을 위해 t통계량 사용함

LO10-7 2종 오류 확률을 계산함

가설 검정

-       가설(Hypothesis): 검정을 전제로 하는 모집단의 모수에 대한 진술

-       가설 검정의 목표: 모집단 모수에 대한 진술이 타당한지 검증하는 것

가설 검정(Hypothesis testing): 가설이 타당성 있는 진술인지 결정하기 위해 표본 증거와 확률 이론에 기반하여 수행하는 절차 (집단의 특성에 대한 통계적 가설을 모집단으로부터 추출한 표본을 사용하여 검토하는 통계적 추론)

-       가설 검정을 체계적으로 수행하기 위한 6단계 과정

1

2

3

4

5

6

귀무가설과

대립가설을 설정

유의수준 선정

검정 통계량 선택

결정 규칙 수립

표본 추출,

결론을 내림

결과 해석

 

단계1. 귀무가설 H0, 대립가설 H1 설정

-       귀무가설(Null hypothesis) 수치 증거를 검정하기 위한 목표로 만들어진 모집단 모수 값에 대한 진술

귀무 가설은 항상 등호(=)를 포함함      ex. =, >, <

-       대립가설(Alternate hypothesis): 표본의 데이터 정보가 귀무가설이 거짓이라는 충분한 증거를 제시할 때 채택되는 진술

-       대립 가설은 등호(=)를 절대 포함하지 않음  ex. , >, <

단계2. 가설 검정의 유의수준(σ) 결정

유의수준: 귀무가설이 사실임에도 귀무가설을 기각하게 되는 확률 (통계적 검정(檢定)에서 가설을 기각(棄却)할 때, 그 가설이 옳은데도 불구하고 틀린 것으로 치고 기각하는 확률의 허용 수준. 흔히 백분율로 나타냄.)

-       유의수준 =위험수준 (귀무가설이 참임에도 기각될 위험수준을 나타내는 것이기 때문)

-       0~1 사이 어느 수준에서 결정을 내릴 수 있음

-       일반적으로

0.05 = 소비자 관련 연구

0.01 = 품질 보증

0.1 = 여론 조사

 

가설 검정에서 발생할 수 있는 오류들

1종 오류(α): 참인 귀무가설을 기각하는 것

2종 오류(β): 거짓인 귀무가설을 채택하는

                            연구자

귀무가설

H0 기각하지 않음

H0 기각

H0이 참

올바른 결정

1종 오류

H0이 거짓

2종 오류

올바른 결정

 

단계3. 검정 통계량 선택

검정 통계량: 귀무가설을 기각할 것인지를 결정하기 위해서 표본으로부터 계산된 값

모분산을 알고 있을 때, 평균을 가설검정하는 검정 통계량 z는 다음과 같음

z=

t=

이 식을 통해 차이가 통계적으로 유의한지 결정할 수 있음

단계4. 결정 규칙 수립

결정 규칙: 귀무가설이 기각될 특정 조건, 기각되지 않을 특정 조건에 대한 기술

기각 영역은 참인 귀무가설이 발생할 가능성이 거의 없도록 그 값을 아주 크거나 아주 작게 정함

임계값: 귀무가설이 기각되고 채택되는 영역 사이의 분기점

 

단계5. 결론 내리기

계산된 검정 통계량 값과 임계값을 비교해 귀무가설을 기각할 것인지 채택할 것인지 결론을 내림

단계6. 결과 해석하기

가설검정 단계 요약

1.     귀무가설(H0)과 대립가설(H1)을 설정

2.     유의수준(α) 선정

3.     적절한 검정 통계략을 선택

4.     123단계를 바탕으로 결정 규칙을 수립

5.     표본의 데이터 정보를 바탕으로 귀무가설에 대한 결론 내리기

6.     검정 결과 해석

 

한쪽꼬리검정과 양쪽꼬리검정

모표준편차()를 아는 경우, 양쪽꼬리검정

Jamestown 철강 회사는 서부 뉴욕주 여러 공장에서 책상과 다른 사무 용품들을 제조 및 조립한다. Fredonian 공장에서 A325 모델 책상의 주 생산량은 평균 200, 표준편차 16개의 표준 정규분포를 따른다. 최근에는 새로운 생산 기법이 도입되었고 신입 사원들도 고용되었다. 이 공장의 부사장은 이러한 변화들이 A325 모델 책상의 주 생산량에 변동을 가져왔는지 알고 싶었다. Fredonian 공장에서 생산되는 책상의 주 생산량은 유의수준 .01에서 평균 생산량 200개와 다를까?

단계 1: 귀무가설과 대립가설을 설정하라.

                                 H0:   = 200

                                 H1:   ≠ 200

단계 2: 유의 수준을 결정하라. 유의 수준 .01이 선택되었다.

단계 3: 검정 통계량을 선택하라.

모집단 표준 편차를 알고 있을 때 평균을 위한 검정 통계량은 z이다

단계 4: 결정 규칙을 수립하라

z의 임계값을 찾는 것으로부터 결정 규칙이 시작된다.

결정 규칙: z통계량이 -2.5762.576사이에 위치하지 않으면 귀무가설은 기각되고, -2.5762.576사이에 위치하면 귀무가설은 기각되지 않음

단계 5: 결론을 내려라

모집단에서 표본을 추출하여 z값을 계산하여 결정 규칙을 적용한 후 H0를 기각할 것인지 아니면 기각하지 않을 것인지에 대한 결론을 내림

작년(생산, 휴가를 위해 2주간 공장 휴무하여 50주 동안 운영)의 경우, 주당 평균 생산량은 203.5개였고 모집단의 표준편차는 주당 16개였다. 공식 [10-1]을 적용하여 계산한 z값은:

 =  = 1.547

결론: 1.547-2.5762.576 사이에 위치하기 때문에, 귀무가설을 기각하지 않는다.

단계 6: 결과를 해석하라

모집단 평균이 주당 200개와 다르다는 것을 보이는 것을 실패했기 때문에, 귀무가설을 기각하지 않는다.

 

}         t 분포의 주요 특징

}         t 분포는 연속형이다.

}         t 분포는 종모양의 좌우대칭형이다.

}         t 분포 기반의 그룹이 있다. 자유도가 변화할 때마다 새로운 분포가 형성된다.

}         자유도가 증가함에 따라 t 분포의 모양은 표준 정규분포의 모양에 가까워진다.

}         t 분포는 표준 정규분포보다 좀 더 평평한 모양을 가진다.

1종 오류와 제2종 오류

}         1종 오류는 유의수준은 귀무가설이 참임에도 기각될 확률임

}         1종 오류인 유의수준().05.01 수준이고 검정을 시작할 때 통계검정 연구자에 의해 설정

}         2종 오류는 귀무가설이 실제로 거짓임에도 기각되지 않는 확률임

}         2종 오류는  나타냄

}         2종 오류 확률은 표본 결과를 바탕으로 가설상의 분포와 다른 분포와의 차이로 계산할 수 있음

 


admin