Stata에서 Kruskal-Wallis H 테스트 (2023)

소개

Kruskal-Wallis H 검정은 연속형 또는 순서형 종속 변수에 대한 두 개 이상의 독립 변수 그룹 간에 통계적으로 유의미한 차이가 있는지 확인하는 데 사용할 수 있는 순위 기반 비모수 검정입니다. 에 대한 비모수적 대안으로 간주됩니다.일원 분산 분석(때때로 "순위에 대한 일원 분산 분석"이라고도 함), Mann-Whitney U 검정의 확장으로 두 개 이상의 독립 그룹을 비교할 수 있습니다.

예를 들어, Kruskal-Wallis H 검정을 사용하여 연속 척도로 측정된 급여가 교육 수준에 따라 다른지 여부를 이해할 수 있습니다(즉, 종속 변수는 "급여"이고 독립 변수는 "교육 수준", "학사 학위", "대학원 학위" 및 "박사 학위"의 세 가지 독립적인 그룹이 있음). 또는 Kruskal-Wallis H 테스트를 사용하여 조세 회피에 대한 태도가 순서 척도로 측정되고 직원의 회사 규모에 따라 다른지 여부를 이해할 수 있습니다(즉, 종속 변수는 "조세 회피에 대한 태도", "완전히 공정함"에서 "완전히 불공평함"까지 5점 척도로 측정되며 독립 변수는 "소형", "중형" 및 "대형"의 세 가지 독립 그룹이 있는 "회사 규모"가 됩니다.

Kruskal-Wallis H 테스트는염가 보급판 작품집통계를 테스트하고 독립 변수의 특정 그룹이 서로 통계적으로 유의미하게 다른지 알려줄 수 없습니다. 적어도 두 그룹이 다르다는 것만 알려줍니다. 연구 설계에 세 개 이상의 그룹이 있을 수 있으므로 이러한 그룹 중 서로 다른 그룹을 결정하는 것이 중요합니다. 사후 테스트를 사용하여 이를 수행할 수 있습니다.

이 "빠른 시작" 가이드는 Stata를 사용하여 Kruskal-Wallis H 테스트를 수행하는 방법과 이 테스트의 결과를 해석 및 보고하는 방법을 보여줍니다. 그러나 이 절차를 소개하기 전에 Kruskal-Wallis H 검정이 유효한 결과를 제공하기 위해 데이터가 충족해야 하는 다양한 가정을 이해해야 합니다. 다음으로 이러한 가정에 대해 논의합니다.

스타타

가정

Kruskal-Wallis H 검정을 뒷받침하는 네 가지 가정이 있습니다. 이러한 네 가지 가정 중 하나라도 충족되지 않으면 유효한 결과를 얻지 못할 수 있으므로 Kruskal-Wallis H 테스트를 사용하여 데이터를 분석하지 못할 수 있습니다. 1번, 2번, 3번 가정은 연구 설계 및 변수 선택과 관련이 있으므로 Stata를 사용하여 테스트할 수 없습니다. 그러나 계속 진행하기 전에 연구가 이러한 가정을 충족하는지 여부를 결정해야 합니다.

  • 가정 #1:두 변수는서수규모 또는마디 없는척도(즉,간격또는비율규모). 의 예서수 변수리커트 척도(예: "매우 동의함"에서 "매우 동의하지 않음"까지의 7점 척도)를 포함하고 범주 순위를 매기는 다른 방법(예: "가장 만족함"에서 "가장 만족함"에서 "가장 만족함"까지의 직무 만족도 측정을 위한 5점 척도) "최소 만족", "매우 쉬움"에서 "매우 어려움"까지 새 웹 사이트 탐색이 얼마나 쉬운지를 결정하는 4점 척도 또는 고객이 제품을 얼마나 좋아하는지 설명하는 3점 척도, "별로"에서 "예, 많이"로). 의 예연속 변수키(피트와 인치로 측정), 온도(°C로 측정), 급여(미국 달러로 측정), 수정 시간(시간으로 측정), 지능(IQ 점수를 사용하여 측정), 반응 시간(밀리초로 측정), 테스트 성능(0에서 100까지 측정), 판매(월별 거래 수로 측정) 등. 다음 기사에서 서수 및 연속 변수에 대해 자세히 알아볼 수 있습니다.변수의 종류.
  • 가정 #2:당신의독립 변수로 구성되어야 한다둘 이상의 범주,독립(비관련) 그룹. 의 예범주형 변수성별(예: 2개 그룹: 남성 및 여성), 민족(예: 3개 그룹: 백인, 아프리카계 미국인 및 히스패닉), 신체 활동 수준(예: 4개 그룹: 좌식, 낮음, 보통 및 높음) 및 직업(예: , 5개 그룹: 외과의사, 의사, 간호사, 치과의사, 치료사).
  • 가정 #3:당신은 가지고 있어야관찰의 독립성, 이는 각 그룹의 관측치 사이 또는 그룹 자체 사이에 관계가 없음을 의미합니다. 예를 들어, 각 그룹에는 서로 다른 참가자가 있어야 하며 참가자는 둘 이상의 그룹에 속하지 않아야 합니다. 관측치의 독립성이 없다면 "관련 그룹"이 있을 가능성이 높습니다. 즉, Kruskal-Wallis H 테스트 대신 Friedman 테스트를 사용해야 합니다.

Kruskal-Wallis H 검정은 정규성을 가정하지 않고 서수 데이터와 함께 사용할 수 있으며 이상값에 훨씬 덜 민감합니다. 이러한 이유로 이러한 가정이 위반되고일원 분산 분석부적절합니다. 그러나 Kruskal-Wallis H 테스트는 데이터 분포에 따라 결론을 내릴 수 있기 때문에 반드시 가정이 없는 것은 아닙니다. 이 데이터 고려 사항은가정 #4, 아래에 설명된 대로:

  • 가정 #4:Kruskal-Wallis H 검정의 결과를 해석하는 방법을 알려면분포각 그룹(즉, 독립 변수의 각 그룹에 대한 점수 분포)에서같은 모양(이는 또한동일한 가변성). 이것이 의미하는 바를 이해하려면 아래 다이어그램을 살펴보십시오.

    Stata에서 Kruskal-Wallis H 테스트 (1)

    저작권 2014. Laerd 통계


    위 왼쪽 그림에서분포"백인", "아프리카계 미국인" 및 "히스패닉" 그룹에 대한 점수의같은 모양. 한편, 위의 오른쪽 그림에서 각 그룹의 점수 분포는 다음과 같습니다.같지 않다(즉, 그들은다른 모양및 변동성).

    분포의 모양이 동일한 경우 Stata를 사용하여 Kruskal-Wallis H 테스트를 수행하여중앙값관심 있는 독립 변수의 여러 그룹(예: 독립 변수 "인종"에 대한 그룹, 백인, 아프리카계 미국인 및 히스패닉)에 대한 종속 변수(예: "참여 점수"). 그러나 배포판에다른 모양, Kruskal-Wallis H 테스트만 사용하여 비교할 수 있습니다.평균 순위. 유사한 배포판을 사용하면 간단히 사용할 수 있습니다.중앙값그룹 간의 위치 이동을 나타냅니다(위 왼쪽 그림 참조). 따라서 이 가정을 확인하는 것이 매우 중요합니다. 그렇지 않으면 결과를 잘못 해석하게 될 수 있습니다.

실제로 Kruskal-Wallis H 테스트를 수행할 때 가정 #4를 확인하는 데 상당한 시간이 소요될 것입니다. 그러나 Stata는 이를 수행하는 데 필요한 모든 도구를 제공합니다.

섹션에서Stata의 테스트 절차, 가정을 위반하지 않았다고 가정하고 Kruskal-Wallis H 테스트를 수행하는 데 필요한 Stata 절차를 설명합니다. 먼저 Stata에서 Kruskal-Wallis H 테스트 절차를 설명하기 위해 사용하는 예를 설명합니다.

스타타

온라인 소매업체는 직원들로부터 최상의 결과를 얻고 업무 경험을 개선하고자 합니다. 현재 소매업체의 주문 처리 센터 직원은 일하는 동안 어떤 종류의 유흥도 제공받지 않습니다(예: 배경 음악, TV 등 없음). 그러나 소매업체는 소수의 직원이 요청한 음악 제공이 생산성 향상으로 이어질 수 있는지, 만약 그렇다면 어느 정도인지 알고 싶어 합니다.

따라서 연구원은 직원 60명을 무작위 표본으로 모집했습니다. 60명의 참가자로 구성된 이 샘플은 각 그룹에 20명의 참가자가 있는 세 개의 독립적인 그룹으로 무작위로 나뉩니다. (a) 음악을 듣지 않는 "대조 그룹"; (b) 음악을 들었지만 무엇을 들을지 선택할 수 없는 "치료 그룹"; (c) 음악을 듣고 그들이 들은 것을 선택할 수 있는 두 번째 치료 그룹.

실험은 한 달 동안 지속되었습니다. 실험 종료 시 세 그룹의 "생산성"은 "시간당 처리되는 평균 패키지 수"로 측정되었습니다. 따라서 종속 변수는 "생산성"(1개월 실험 동안 시간당 처리된 평균 패키지 수로 측정됨)인 반면, 독립 변수는 "치료 유형"이었고 "음악 없음"이라는 세 개의 독립 그룹이 있었습니다. (대조 그룹), "음악 - 선택 없음"(처리 그룹 A) 및 "음악 - 선택"(처리 그룹 B).

일원 분산 분석이 부적절하다고 가정하고(예: 비정규 분포로 인해) Kruskal-Wallis H 테스트를 사용하여 세 개의 독립적인 그룹 간에 생산성에 통계적으로 유의미한 차이가 있는지 여부를 확인했습니다. .

메모:이 가이드에 사용된 예제와 데이터는 가상입니다. 이 가이드의 목적을 위해 방금 만들었습니다.

스타타

Stata에서 설정

Stata에서는 다음을 생성하여 분석을 위해 세 그룹을 분리했습니다.독립 변수, 라고 불리는음악, 그리고 주어진: (a) 값 "1 -- 음악 없음"를 제어 그룹에; (b) "의 값2 -- 음악 - 선택 사항 없음" 음악을 들었지만 무엇을 들을지 선택할 수 없었던 치료군에게, 그리고 (c) "3 -- 음악 - 선택" 아래와 같이 음악을 듣고 무엇을 들을지 선택할 수 있는 치료 그룹에게:

Stata에서 Kruskal-Wallis H 테스트 (2)

StataCorp LP의 서면 허가를 받아 게시되었습니다.

독립 변수에 대한 점수,음악, 그런 다음 왼쪽 열에 입력되었습니다.데이터 편집기(편집)스프레드시트, 종속 변수의 값,생산력, 아래와 같이 오른쪽 열에 입력되었습니다.

Stata에서 Kruskal-Wallis H 테스트 (3)

StataCorp LP의 서면 허가를 받아 게시되었습니다.

스타타

Stata의 테스트 절차

이 섹션에서는 이전 섹션의 네 가지 가정이가정, 위반되지 않았습니다. 다음을 사용하여 Kruskal-Wallis H 검정을 수행할 수 있습니다.암호또는 Stata의그래픽 사용자 인터페이스(GUI). 분석을 수행한 후 결과를 해석하는 방법을 보여줍니다. 먼저 사용할지 여부를 선택합니다.암호또는 Stata의그래픽 사용자 인터페이스(GUI).

스타타

암호

이 섹션에서는 Kruskal-Wallis H 테스트를 수행하는 코드를 설정합니다. 이 코드는 Stata의Stata에서 Kruskal-Wallis H 테스트 (4)상자, 아래 그림과 같이:

Stata에서 Kruskal-Wallis H 테스트 (5)

StataCorp LP의 서면 허가를 받아 게시되었습니다.


데이터에 대해 Kruskal-Wallis H 검정을 실행하는 코드는 다음과 같은 형식을 취합니다.

칼리스종속 변수, 에 의해(독립 변수)

종속 변수가 있는 예제를 사용하여생산력독립 변수는음악, 필수 코드는 다음과 같습니다.

kwallis 생산성, by(Music)

따라서 다음 코드를 입력하고 키보드의 "Return/Enter" 키를 누르십시오.

Stata에서 Kruskal-Wallis H 테스트 (6)

생성될 Stata 출력을 볼 수 있습니다.여기.

스타타

그래픽 사용자 인터페이스(GUI)

Stata에서 Kruskal-Wallis H 테스트를 수행하는 데 필요한 세 단계는 다음과 같습니다.

  1. Stata 13의 경우 클릭통계 > 비모수 분석 > 가설 검정 > Kruskal-Wallis 순위 검정아래와 같이 상단 메뉴에서

    메모:Stata 12(Stata 13에도 유효)의 경우통계 > 요약, 표 및 검정 > 가설의 비모수 검정 > Kruskal-Wallis 순위 검정메인 메뉴에서.

    Stata에서 Kruskal-Wallis H 테스트 (7)

    StataCorp LP의 서면 허가를 받아 게시되었습니다.


    당신은 다음과 같이 표시됩니다kwallis - Kruskal-Wallis 인구 평등 순위 테스트대화 상자:

    Stata에서 Kruskal-Wallis H 테스트 (8)

    StataCorp LP의 서면 허가를 받아 게시되었습니다.

  2. 종속 변수를 선택하고생산력, 내부에서결과 변수:드롭다운 상자 및 독립 변수,음악, 내부에서변수 정의 그룹:드롭다운 상자. 다음 화면이 표시됩니다.

    Stata에서 Kruskal-Wallis H 테스트 (9)

    StataCorp LP의 서면 허가를 받아 게시되었습니다.

  3. 를 클릭하십시오Stata에서 Kruskal-Wallis H 테스트 (10)단추.

생성될 Stata 출력을 볼 수 있습니다.여기.

스타타

Stata에서 Kruskal-Wallis H 테스트의 출력

가정 #4를 테스트한 후 그룹이 유사한 형태의 분포를 갖는다는 것을 발견한 경우 중앙값의 차이 측면에서 결과를 해석할 수 있습니다. 이것이 이 데이터 세트에 대해 가정할 것입니다. 위의 절차 중 하나를 실행하면 결과가 제목 아래에 표시됩니다.Kruskal-Wallis 인구 평등 순위 테스트, 아래 그림과 같이:

메모:그룹에 유사한 모양의 분포가 없으면 중앙값 대신 평균 순위의 차이로 결과를 해석합니다.

Stata에서 Kruskal-Wallis H 테스트 (11)

StataCorp LP의 서면 허가를 받아 게시되었습니다.

데이터에 동점이 있으므로 위의 빨간색 사각형으로 강조 표시된 Kruskal-Wallis H 테스트 결과를 참조하려고 합니다. 맨 윗줄(예: '관계가 있는 카이제곱 = 9.470, 2 d.f.")는 카이 제곱 값과 테스트의 자유도를 보고합니다. 이 값 아래의 줄(즉, "확률 = 0.0088")는 Kruskal-Wallis H 검정의 통계적 유의성을 나타냅니다(즉,-값). 유의 수준이 0.0088(즉,= .0088), 이는 0.05 미만이므로 세 가지 독립 변수 그룹 간의 중앙 생산성에 통계적으로 유의미한 차이가 있습니다.음악(즉, "음악 없음", "음악 - 선택 없음" 및 "음악 - 선택").

스타타

Kruskal-Wallis H 테스트 결과 보고

Kruskal-Wallis H 테스트 결과를 보고할 때 다음을 포함하는 것이 좋습니다.

  • ㅏ.수행한 분석에 대한 소개입니다.
  • 비.샘플에 대한 정보(그룹 크기가 같지 않거나 누락된 값이 있는 경우 각 그룹에 포함된 참가자 수 포함).
  • 씨.그룹 간에 통계적으로 유의미한 차이가 있는지 여부에 대한 설명(관찰된 χ 포함)2-값, 자유도 및 유의 수준(즉,-값)).

Stata 출력 기준~ 위에, 우리는 이 연구의 결과를 다음과 같이 보고할 수 있습니다.

  • 일반적인

Kruskal-Wallis H 테스트는 포장 시설의 생산성이 다음 중 하나를 듣는 세 그룹에 대해 다른지 확인하기 위해 수행되었습니다. (a) 음악 없음 (N= 20); (b) 음악, 그러나 그들이 선택하지 않은 트랙(N= 20); (c) 그들이 선택할 수 있는 트랙이 있는 음악(N= 20). Kruskal-Wallis H 테스트는 세 그룹 간의 생산성에 통계적으로 유의미한 차이가 있음을 보여주었습니다.2(2) = 9.470,= 0.0088.

위와 같이 결과를 보고하는 것 외에도 다이어그램을 사용하여 결과를 시각적으로 표시할 수 있습니다. 예를 들어 박스 플롯을 사용하여 이 작업을 수행할 수 있습니다. 이것은 다른 사람들이 당신의 결과를 더 쉽게 이해하고 Stata에서 쉽게 생성할 수 있도록 합니다.

Top Articles
Latest Posts
Article information

Author: Jamar Nader

Last Updated: 06/06/2023

Views: 5255

Rating: 4.4 / 5 (55 voted)

Reviews: 94% of readers found this page helpful

Author information

Name: Jamar Nader

Birthday: 1995-02-28

Address: Apt. 536 6162 Reichel Greens, Port Zackaryside, CT 22682-9804

Phone: +9958384818317

Job: IT Representative

Hobby: Scrapbooking, Hiking, Hunting, Kite flying, Blacksmithing, Video gaming, Foraging

Introduction: My name is Jamar Nader, I am a fine, shiny, colorful, bright, nice, perfect, curious person who loves writing and wants to share my knowledge and understanding with you.