CAFE

통계 관련 토론방

엑셀로 해보는 ANCOVA 1 - boxplot 그리기

작성자김브링이|작성시간16.04.25|조회수2,028 목록 댓글 0

ANCOVA를 엑셀로 하는 방법을 살펴보고 있습니다. 이곳이 설명이 잘 되어 있더군요.

http://www.real-statistics.com/analysis-of-covariance-ancova/basic-concepts-ancova/


엑셀에서 boxplot 그리는 것부터 설명을 해주는 것 같아서 기본 개념을 잡기에도 좋을 것 같습니다.

이론적인 내용은 김지형 선생님이 올려주신 http://blog.naver.com/kjhnav/220628220549 내용을 참고하면 좋을 것 같습니다.

--------------------------------------------------------------------------------------------------------------------


먼저 위와 같이 데이터를 엑셀에 입력합니다. 학생들의 성적에 부모님의 수입이 미치는 영향을 ANCOVA로 알아볼 것입니다.



다음으로 위와 같은 표를 입력한 데이터 아래쪽에 하나 추가로 만듭니다. Method1에는 아래와 같은 식을 사용하여 계산하고 오른쪽 3개의 열에도 마찬가지로 적용합니다.

 

최소값 = MIN(B4:B13)

제1사분위수 = PERCENTILE(B4:B13, 25%)

중앙값 = MEDIAN(B4:B13)

제3사분위수 = PERCENTILE(B4:B13, 75%)

최대값 = MAX(B4:B13)

--------------------------------------------------------------------------------------------------------------------

아래에 또 위와 같은 표를 추가합니다. 마찬가지로 Method1에는 아래와 같은 식을 사용하여 계산하고 오른쪽 3개의 열에도 마찬가지로 적용합니다.


하한값 = B21 - B19(중앙값 - 최소값)

제1사분위 = B20(제1사분위수)

중앙값 = B21 - B20(중앙값 - 제1사분위수)

제3사분위 = B22 - B21(제3사분위수 - 중앙값)

상한값 = B23 - B21(최대값 - 중앙값)

--------------------------------------------------------------------------------------------------------------------

다음으로 위와 같이 마우스로 영역을 선택하고 엑셀의 옵션에 있는 삽입 - 세로 막대형 - 누적 세로 막대형을 선택합니다.


막대 그래프가 생성된 것을 확인할 수 있습니다.


그래프가 선택된 상태에서 엑셀의 옵션에서 레이아웃 -  오차 막대 - 기타 오차 막대 옵션으로 들어갑니다.


여기서 계열2는 중앙값을 의미하는데 이것을 선택하고 확인을 누릅니다.


다음으로 나오는 창에서 오차량 - 사용자 지정 - 값 지정 버튼을 클릭합니다.


양의 오류 값에는 상한값을 선택합니다.


음의 오류 값에는 하한값을 선택합니다.



그러면 위와 같이 그래프에 오차 막대가 그려지는데 여기서 파란색 네모를 선택하고 채우기 없음을 선택합니다.


Score 데이터에 대한 boxplot이 만들어졌습니다.


--------------------------------------------------------------------------------------------------------------------

R에서는 아래와 같은 명령어로 그릴 수 있네요. 데이터들의 행의 개수가 같다면 쉽게 그릴 수 있지만 행의 개수가 다르므로 이렇게 코드가 좀 길어집니다.


# Load Graph library
library(ggplot2)


# Make individual data frames
Method1 <- data.frame(group = "Method1", value = c(12, 39, 36, 17, 25, 15, 8, 31))
Method2 <- data.frame(group = "Method2", value = c(45, 37, 13, 50, 35, 40, 33, 17))
Method3 <- data.frame(group = "Method3", value = c(20, 42, 31, 24, 15, 13, 9, 21, 31, 13))
Method4 <- data.frame(group = "Method4", value = c(12, 10, 19, 18, 14, 8, 7, 19, 25, 26))


# Combine into one long data frame
plot.data <- rbind(Method1, Method2, Method3, Method4)


# Plot
ggplot(plot.data, aes(x = group, y = value, fill = group)) + geom_boxplot()


--------------------------------------------------------------------------------------------------------------------

summary 명령어를 사용해서 엑셀에서 계산했던 값들을 R에서도 볼 수 있습니다. 모두 같은 걸 볼 수 있네요.







다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
맨위로

카페 검색

카페 검색어 입력폼