응용통계학 - 11장 두 표본 가설 검정

대학공부 2018. 12. 8. 16:00

수업 PPT 정리했습니다. 워드파일 다운해주세요!


응용통계학 - 11장 두 표본 가설 검정.docx


           11 두 표본 가설 검정

LO11-1 모표준 편차를 알고 동일할 때, 두개의 독립적인 모평균이 동일하다는 가설검증을 수행한다.

LO11-2 모표준 편차를 알지못할 때, 두 개의 독립적인 모평균이 동일하다는 가설검증을 수행한다.

LO11-3    쌍체 표본 또는 종속적 표본의 관측자료를 통한 모집단 평균의 차이에 대한 가설 검정을 수행한다.

LO11-4    독립적인 표본과 종속적인 표본의 차이를 설명한다.

 

두 표본을 대상으로 하는 가설 검정

}         두 모집단 비교를 위해서, 두 표본의 차이를 살펴봄

}         모집단의 평균이 같다면 표본 평균들의 차이도 0이 됨

}         모집단의 평균에 차이가 있다면 표본 평균 간에도 차이가 있음

}         예제

}         남부 Florida에서 남성 부동산 중개인과 여성 부동산 중개인에 의해서 매매된 주거용 부동산의 평균 가격에 차이가 있는가?

}         Grabit Software사에서 고객 서비스 직원이 오전이나 오후동안 언제 응대 전화를 더 받는가?

}         Fast food사에서 21세 이하 젊은 근로자들과 60세 이상의 근로자 사이에서 평균 결근 수에 차이가 있는가?

 

두 표본을 대상으로 하는 가설 검정: 독립표본

}         아래와 같은 조건이 만족되면 검정통계량 z  (11-2)처럼 구할 수 있음

}         두 모집단은 정규 분포를 따른다.

}         두 개의 표본들은 서로 관련되어 있지 않아야 한다, , 독립적이다.

}         두 모집단의 표준편차들은 모두 알고 있다.

 

}         Z 수식에서 1- 2는 표본 평균 차이를 의미하고, 표본 평균 차이 분포의 분산을 제곱근을 하여 표준편차를 구함(11-1참고)

 

두 표본을 대상으로 하는 가설 검정: 독립표본

FoodTown 슈퍼마켓 고객은 구매한 상품 계산 방법을 선택해야 한다. 종업원이 일반적으로 계산해주는 방법과 새로운 Fast Lane 방법을 고를 수 있다.

Fast Lane 시설은 최근 Byrne Road FoodTown에 설치되었다. 이곳 점장은 일반적 계산 과정이 Fast Lane 방법보다 평균 계산 시간이 더 길게 걸리는지 알고 싶다. 고객이 줄을 서서 카트 안에 물건을 넣을 때까지의 시간을 측정하였다. 여기에 기다리는 시간 계산하는 시간이 모두 포함되었다.

단계1: 귀무가설과 대립가설을 설정하라.

H0:

H1:

단계2: 유의수준을 설정하라. 여기서는 유의수준 0.01을 사용

단계3: 검정 통계량을 결정하라.  여기서는 z분포를 사용

단계4: 결정법칙을 수립하라. z > 2.326이면 H0는 기각

단계 5: H0에 대한 결론을 내려라. FoodTown은 일반 계산 방법을 사용하는 고객 50명을 임의로 추출하여, 평균 계산 시간을 계산한 결과 5.5분이었다. Fast Lane 방법을 사용한 표본 100명의 고객은 5.3분의 평균 계산 시간이 걸렸다. 계산된 3.123은 임계값 2.326보다 크다. 그래서 귀무가설을 기각하고 대립가설을 채택한다.

단계 6: 결과를 해석하라. 평균 계산 시간의 .20분 차이는 우연히 발생하기에 너무 크다. 그래서 Fast Lane 방법을 사용하는 것이 더 빠르다고 결론 내린다.

 

}         (11-2)를 사용하기 위한 기준

}         표본들은 독립적 모집단들에서 추출된다. Fast Lane 고객들의 계산 시간은 다른 고객들의 계산 시간과 관계가 없다는 것을 의미한다. 예를 들어 Smith씨 계산 시간은 다른 고객들의 계산 시간에 영향을 미치지 않는다.

}         모든 모집단은 정규 분포를 따른다. FoodTown에서 일반적인 계산 과정과 Fast Lane 방법의 모집단 계산 시간은 정규 분포를 따른다.

}         두 모집단의 표준편차는 모두 알려져 있다. FoodTown에서 Fast Lane 모집단의 표준편차는 0.30분이다. 표준 계산 방법의 표준편차는 0.40 분이다.

 

모표준편차를 모를 경우 모평균 비교: 두 표본 통합 검정

}         독립표본 가설 검정과 두 가지 중요한 차이가 있음

}         표본의 모집단들이 같지만 알려지지 않은 표준편차를 가지고 있다고 가정한다. 이 가정 때문에 표본의 표준편차를 결합(combine)하거나 통합(pool)한다.

}         검정 통계량으로    t 분포를 이용한다.

}         검정을 위해서 다음과 같은 세 가지 요구사항이 필요

}         표본의 모집단들은 정규 분포를 따른다.

}         표본의 모집단들은 독립적이다.

}         두 모집단들의 표준편차는 동일하다.

}         t 값을 구하기 위해서 두 단계가 필요함

}         첫 단계는 표본의 표준 편차를 통합

}         투 표본을 통합검정할 때의 t값은 다음과 같음

}         검정의 자유도는 표본으로 추출된 전체 항목의 수에서 표본의 전체 수를 뺀 것임

}         이 경우 두 개의 표본이 있기 때문에 n1 + n2 - 2의 자유도를 가짐

 

Owens Lawn Care사는 미국과 캐나다로 납품되는 잔디 깎기 기계를 생산하고 조립한다. 엔진을 잔디 깎기 기계 위에 얹는 두 가지의 다른 과정이 제안되었다. 잔디 깎기 기계 위에 엔진을 얹는 평균 시간에 차이가 있는가? 첫 번째 과정은 오랜 기간 동안 Owens의 직원이었던 Herb Welles가 고안하였고, 다른 과정은 Owens의 설계 부사장인 William Atkins가 고안하였다. 다섯 명의 근로자가 표본으로 선택되어 Welles 방식으로 작업 시간이 측정되었고 Atkins 방식으로 여섯 명 근로자의 작업 시간을 측정하였다. 분으로 측정된 결과는 아래에 나타내었다. 평균 작업 시간에 차이가 있는가? 유의수준 .10을 사용하라.

 

단계1: 귀무가설과 대립가설을 설정하라.

H0:

H1:

필요한 가정들

1. Welles 표본의 관측 값들과 Atkins 표본의 관측 값들은 서로 독립적이다.

2. 두 개의 모집단들은 정규 분포를 따른다.

3. 두 개의 모집단들은 동일한 표준 편차를 가진다.

 

단계2: 유의수준을 설정하라. 여기서는 유의수준 0.10을 사용

단계3: 검정 통계량을 결정하라.  여기서는 t분포를 사용

단계4: 결정법칙을 수립하라. -1.833<t<1.833사이에 있으면 H0를 기각하지 않음

단계 5: H0에 대한 결론을 내려라.

t값 계산을 위해 세 단계 과정이 필요

1 단계:

표본의 표준편차를 계산한다.

2 단계: 표본의 분산을 통합한다 .

3단계: t값을 결정한다.

–0.622–1.8331.833 사이의 영역에 있기 때문에 귀무가설을 기각하지 않음

단계 6: 결과를 해석하라. 두 방식을 사용하는 평균 작업 시간에는 차이가 없다고 결론내린다.

모표준편차가 동일하지 않은 경우

}         모집단들이 동일한 표준편차를 가지고 있다고 가정할 수 없다면, 자유도와 검정통계량 구하는 공식이 수정됨

}         자유도는 다음 공식에 의해 계산되고 다소 복잡한 근사치 공식을 사용하여 낮게 조정됨

}         검정통계량 t값을 구하는 공식을 아래와 같음

 

소비자 시험 연구소 직원들은 종이 타월의 흡수성에 대해 평가를 하고자 한다. 몇몇 자체 브랜드 종이 타월과 비슷한 종류의 브랜드 제품을 비교하길 원한다. 각각의 브랜드에 대해 한 겹 페이퍼 타월을 액체 용기에 담가서 2분 동안 액체를 흡수하도록 하였다. 그 후 종이가 액체 용기로부터 빨아드린 액체 양을 측정했다.

 

 

 

단계1: 귀무가설과 대립가설을 설정하라.

H0:

H1:

단계2: 유의수준을 설정하라. 여기서는 유의수준 0.10을 사용

단계3: 검정 통계량을 결정하라.  여기서는 t분포를 사용

동일한 모표준편차를 가정하고 싶지 않기 때문에 식(11-6)을 이용하여 자유도를 계산

단계4: 결정법칙을 수립하라. -1.812<t<1.812사이에 있으면 H0를 기각하지 않음

단계 5: H0에 대한 결론을 내려라. 귀무가설을 기각

단계 6: 결과를 해석하라. 두 종류의 종이 타월 평균 흡수량은 같지 않다고 결론 내림

 

두 표본 검정: 종속 표본

}         종속 표본의 경우 대응되는 표본들 간 차이에 대한 분포가 평균 0이라고 가정

}         유선 표본의 차이에 대한 평균과 표준편차를 계산

}         검정 통계량을 다음 공식으로 계산

}         여기에서 n – 1의 자유도를 갖고

}          는 쌍 혹은 관계가 있는 관측치들 간 차이의 평균

}         sd는 쌍 혹은 관계가 있는 관측치들 간 차이의 표준편차

}         n 는 쌍으로 된 관측 수

 

}         차이의 표준편차 dx를 대신하는 것을 제외하고 익숙한 공식으로 구할 수 있음

}         예제

Nickel 저축 대부 회사는 채무 담보의 부동산 가치를 평가하기 위해 Schadek Appraisals사와 Bowyer Real Estate사를 고용하였다. 이 두 회사가 같은 담보 건에 대해 비슷한 평가를 내리는 것이 중요하다. 두 평가 회사들의 일관성을 제고하기 위해 Nickel사는 임의로 10채의 집을 표본으로 선택하여 Schadek사와 Bowyer사 모두 집의 가치 평가를 하도록 한다. 각각의 집에 대해서 쌍이 되는 평가 가치들이 있다. , 각각의 주택은 Schadek사와 Bowyer, 양쪽으로부터의 가치 평가액을 가지게 된다. 평가된 가치들은 선택된 주택에 종속적이거나 혹은 선택된 주택과 관련되어있다. 이것은 대응 표본(paired sample)이라고도 한다.

 

Nickel 저축 대부 회사가 주거용 주택의 가격 평가를 위해 거래하는 두 회사를 비교하길 원한다. Nickel사는 10개의 주택 표본을 선택하였고 두 회사가 평가액을 제출하도록 요구하였다. 결과는 아래와 같고 $1,000 단위로 표시되었다.

유의수준 .05에서 주택 가치에 대한 평균 감정 평가액의 차이가 있다고 결론내릴 수 있을까?

단계1: 귀무가설과 대립가설을 설정하라.

H0:

H1:

단계2: 유의수준을 설정하라. 여기서는 유의수준 0.05을 사용

단계3: 검정 통계량을 결정하라.  여기서는 t분포를 사용

단계4: 결정법칙을 수립하라. if t < -2.262 또는 t > 2.262이면 H0 를 기각

표본들 간 차이의 평균 4.6이고, 표본들 간 차이의 표준편차(sd) 4.402

(11-7)을 통해 검정 통계량 t값은 3.305

단계 5: H0에 대한 결론을 내려라. 귀무가설을 기각

단계 6: 결과를 해석하라. 주택들의 평균 평가금액에 차이가 있다고 결론 내릴 수 있음

 

두 종류의 종속 표본

}         두 가지 종류의 종속적인 표본들이 있다

}         (1) 측정, 어떤 종류의 개입, 그리고 다른 측정에 의해 특징지을 수 있는 것들

}         (2) 짝이 되거나 쌍으로 존재하는 관측값들.

}         종속적인 표본의 첫 번째 종류는 어떤 종류의 개입, 또 다른 측정을 동반하는 측정으로 특징지을 수 있다. 이것은 ‘전(before)’과 ‘후(after)’ 연구로 불린다.

}         스피커를 생산 현장에 설치하고 부드러운 음악을 들려줌으로써 생산을 증가시킬 수 있음을 살펴보길 원한다. 현재 상태에서의 근로자 표본을 선택하여 그들의 생산량을 측정한다. 그 다음 스피커가 설치하고 난 뒤 다시 같은 근로자들의 생산량을 측정한다. 여기에는 생산 현장에 스피커를 설치하기 전과 설치한 후의 두 가지 측정량이 존재한다. 개입은 생산 현장에 스피커를 설치하는 것임

}         짝이 되는 또는 대응되는 관측 값으로 특징

}         평가 대상의 주택을 선정하고 같은 주택에 대해 두 가지의 평가액을 감정

}         종속적인 표본들을 사용함으로써 표본 분포의 변동을 줄일 수 있기 때문에 독립적인 표본보다 종속적인 표본을 더 선호함

 

admin