CAFE

결과분석

LISREL과 AMOS의 모델적합도 평가지표

작성자조사쟁이|작성시간10.03.29|조회수3,895 목록 댓글 0

LISREL이나 AMOS를 이용한 구조방정식모델의 적합도를 평가하는 적합지수는 크게 모델의 전반적 적합도를 평가하는 절대 적합지수(Absolute Fit Index), 기초모델에 대한 제안모델의 적합도를 비교하는 증분적합지수(Incremental Fit Index), 그리고 모델의 간명도와 관계된 간명적합지수(Parsimonious Fit Index)가 있다. 대부분의 적합지수는 0(무적합)에서 1(완벽한 적합) 사이의 값을 갖게 되며, 각 적합도의 수용기준은 상대적이다.

 

① 카이자승 검정

구조방정식모델에서 모델의 적합도에 대한 통계적인 유의성을 검증할 수 있는 유일한 통계량은 바로 이 카이자승 검정(Joreskog & Sorborn, 1993)이다. 카이자승은 기본적으로 두 집단간 비율이 차이가 있는 지를 검증하는 통계분석으로 구조방정식에서는 분석에 사용된 데이터가 구조방정식 모델 분석 후 만들어진 데이터와 얼마나 일치하는 지를 카이자승 지표를 통해 확인하게 된다. 카이자승에서는 두 집단 간 차이가 없는 경우 유의하지 않는 것으로 해석(p>0.05)하므로 구조방정식 분석 결과 카이자승의 유의확률이 0.05보다 큰 값이 나와야 모델이 적합하다(분석을 통해 만들어진 데이터가 원래 데이터와 차이가 없다)고 해석하게 된다.

 

여기서 카이자승 검정의 논리를 살펴보자. 사회과학을 포함한 모든 분야에서 과학적으로 검증이 되었다는 의미는 그것을 일반화할 수 있다는 의미이다. 그래서, 과학적 검증이 된 것은 누구나 검증된 것과 동일한 방식을 적용하면 검증 결과도 동일하게 산출된다는 것을 의미한다. 과거 황우석 박사의 줄기세포 사건에서도 문제가 된 것은 논문에서 발표한 연구결과가 조작되어 다른 학자가 동일한 방식으로 연구를 진행했을 때 동일한 결과를 산출할 수 없다는 점 때문이다. 구조방정식의 경우 모델이 검증이 되었다는 의미는 그 모델을 만든 연구자가 아닌 제 3자가 연구자와 동일한 방식으로 모델을 구성해서 분석해도 동일한 분석결과가 나온다는 것을 말한다. 따라서, 연구자가 설정한 모델이 원래 데이터와 일치하는 지를 확인하기 위해 카이자승 검정을 활용하는 것이다.

 

단, 이 카이자승 통계량은 표본의 크기에 매우 민감해서 표본크기가 200명 이상이 되면 통계적으로 유의한 차이가 없음(모델이 적합)에도 불구하고 차이가 있는 것처럼 결과를 제시하며, 표본크기가 100명 이하가 되면 실제로 통계적으로 유의한 차이가 있음(모델이 부적합)에도 차이가 없는 것처럼 결과를 제시하여 신뢰할 수 없게 된다. 그래서, 정확한 모델의 적합도를 검정하기 위한 카이자승 값을 얻기 위해서는 표본크기가 100명에서 200명 사이가 되어야 한다. 구조방정식을 이용한 대부분의 이론 연구에서 표본크기가 200명 내외인 것도 이러한 이유 때문이다.

참고로 LISREL이나 AMOS에서는 카이자승을 계산하기 위해 ML(Maximum Likelihood, 최대우도법)나 GLS(Generalized Least Square, 일반 최소자승법)를 이용해 모수추정을 해야 한다. 구조방정식 모델에서 카이자승 통계량 이외의 다른 모든 적합지수는 엄밀한 의미에서 통계적 검증은 아니기 때문에 특정 적합지수를 절대기준으로 사용하지 않으며, 여러 적합지수를 동시에 고려하여 전반적 모델적합도를 판단하게 된다. LISREL이나 AMOS에서 일반적으로 가장 널리 사용되는 전반적 모델적합도로는 카이자승 통계량, GFI, AGFI, RMR, RMSEA, TLI, NFI, CFI 등이다.

 

② 절대적합지수

구조방정식 모델이 원래 데이터를 예측하는 정도를 나타내는 적합도 지수를 의미하며, 대표적인 절대적합지수로는 GFI, RMR, RMSEA 등이 있다.

구분

의미

GFI

Goodness-of-fit-index는 원래 데이터와 분석을 통해 도출된 데이터간의 차이의 비율에 기초한 것으로 분석결과로 나타난 데이터가 원래 데이터를 설명하는 크기를 의미하며, 회귀분석에서의 R Square와 비슷한 성격을 띤다.

GFI는 ML, GLS 등의 추정방법을 통해 산출되며 보편적인 수용기준은 0.9이상이다.

RMR

Root Mean Square Residual은 구조방정식 모델이 설명할 수 없는 원래 데이터의 부분에 대한 지수로 작으면 작을수록 좋다. RMR은 변수들의 측정단위에 의해 값이 달라질 수 있으며, 일반적으로 0.05이하이면 좋은 모델인 것으로 간주된다.

RMSEA

Root Mean Square Error of Approximation은 모델을 표본이 아닌 모집단에서 추정할 때 기대되는 적합도로서 이 값이 0.10이하이면 자료를 잘 적합시키고, 0.05이하이면 매우 잘 적합시키고, 0.01이하이면 가장 좋은 적합도로서 해석한다고 한다(Steiger, 1990). RMSEA의 일반적인 수용기준은 0.08이하이다.

 

③ 증분적합지수

구조방정식 모델을 측정변수 간 관계가 전혀 존재하지 않는 기초모델(Null Model)과 비교한 적합도 지수를 말하며, TLI(NNFI), NFI, CFI 등이 있다.

구분

의미

TLI(NNFI)

Turker-Lewis Index(Non-normed Fit Index)는 분석된 구조방정식 모델과 기초모델의 비교를 바탕으로 한 지수로서 일반적으로 0.9이상이면 수용 가능한 것으로 받아들여진다.

NFI

Normed Fit Index는 분석된 구조방정식 모델이 기초모델에 비해 얼마나 향상되었는가를 나타내는 지수로서, NFI가 0.9라는 의미는 기초모델에 비해 제안모델이 90% 향상되었다는 것을 의미한다. 일반적인 수용기준은 0.9이상이다.

CFI

Comparative Fit Index는 [1- (분석된 구조방정식 모델의 카이자승통계량 – 자유도/기초모델의 카이자승통계량 – 자유도)]로서 일반적으로 0.9이상이면 수용가능한 것으로 판단한다.

 

④ 간명적합지수

모델적합도가 너무 많은 추정모수에 의해 과적합하고 있는가를 진단하는 것으로 모델의 간명도를 평가하는 적합도 지수라고 할 수 있으며, AGFI가 대표적이다. 앞서 방정식을 설명하면서 모델을 구성하는 변수의 수가 많을수록 방정식이 복잡해 진다고 언급하였는데 절대적합지수의 하나인 GFI는 모델이 복잡할수록 적합도가 높아지는 비합리적인 경향을 띠고 있어 이를 견제하기 위해 모델이 얼마나 심플한지를 평가하기 위한 지표가 바로 간명적합지수이다.

AGFI

Adjusted Goodness-of-fit-index는 절대적합지수인 GFI를 확장시킨 것으로 모델이 복잡하고 추정모수가 많을수록 적합도가 높아지는 경향이 있는 GFI 값에 Penalty Function을 적용하여 추정모수의 수가 많아짐에 따라 GFI 값을 하향 조정한 적합지수로 일반적인 권장수용기준은 0.90이상이다.

 

⑤ 구조모델의 평가

이제는 잠재변수간의 관계를 나타내는 구조모델에 대한 평가지표들을 살펴보자. 구조모델을 평가하는 지표로는 크게 구조모델간의 경로계수가 통계적으로 유의한지를 검증하는 것과 구조모델 자체의 평가지표라고 할 수 있는 R Square가 있다.

구분

의미

경로계수의 유의성 검증

t값을 기준으로 평가하며, 화살표의 방향이 미리 정해진 경우라면 단측검정(t>1.645), 화살표의 방향을 사전에 설정하지 않았다면 양측검정(t>1.96)으로 계수의 유의성을 검증하면 된다. 또한, 계수의 부호가 사전에 설정한 것과 동일한 지도 검증해야 한다.

R Square

회귀분석의 R Square와 유사한 것으로 독립변수에 의해 설명되는 종속변수의 분산의 양을 의미하며, R Square가 높을수록 구조모델이 잘 수립되었다고 볼 수 있다. 구조방정식모델에서는 각 종속변수별로 R Square가 각각 계산되며, 수용기준은 특별히 없으므로 회귀분석에서와 같이 해석하면 무리가 없을 것으로 판단된다.

다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
맨위로

카페 검색

카페 검색어 입력폼