SPSS를 사용한 경험이 있으면(다른 프로그램도 마찬가지) 변수에 대한 설명을 붙일 수 있다. 이렇게 되면 분석할 때 데이터셋이 어떤 정보를 담는지 알 수 있어 편리하다.
STATA에서도 역시 가능하다.
*여기서부터는 스벤 율 저, 황승식외 2명, "의학 보건학 연구자를 위한 Stata입문" 을 거의 그대로 쓴 것이니 가급적 스크랩이나 복사를 하지 않고 보셨으면 합니다.
데이터 자체에 설명 붙이기
예를 들어 use 명령으로 불러온 데이터나 input 등으로 입력한 데이터에 간단한 설명을 붙이고자 한다면 다음과 같이 할 수 있다.
label data "[데이터설명]"
만약 2010년 12월에 정리된 2002년부터 2006년까지의 사망률 자료라면
label data "mortality rate 2002-2006 ,dec2010"
변수에도 같이 붙일 수 있다. 이때는 변수명 전에 variable이라고 써 주어야 한다.
label variable var1 "SMR for men"
**범주형 변수에 값 라벨 붙이기
값 라벨을 붙이는 경우는 두 단계가 필요하다. 일단 예를 들어보겠다.
성별을 나타내느 범주형 변수 var2가 남자는 1, 여자느 2로 코딩하고 조사과정에서 성별이 누락된 케이스를 9로 코딩했다고 하면 다음과 같이 할 수 있다.
label define sexlabel 1 male 2 female 9 "sex unknown"
앗, 여기에 var2는 없다 그러면 어떻게 된 것인가?
label values var2 sexlabel
이렇게 하면 sexlabel이라는 범주 정의가 var2에 적용된다.
정리하면,
label define [범주라벨] [값] 범주설명 [값] 범주설명 [값] "사이가 띄어진 설명"
label values [변수] [범주라벨]
처럼 하면 된다.
이 명령어의 장점은 여러 변수에 같은 형태의 범주 정의가 있을 경우 적용하기 쉽다는 데 있다.
예를 들어 1이 yes, 2가 no인 설문조사 과정을 통한 변수가 var1에서 var20까지 있다고 하자.
label define yesno 1 yes 2 no
label values var1-var20 yesno
이거면 된다.
만약 범주설명이 잘못되어 수정하거나 새로운 라벨을 추가하고자 한다면 modify 옵션을 사용한다.
앞에서 정의된 sexlabel이라는 성별 정의에서 9값에 해당하는 자료를 조사했더니 어린아이였다고 한다면
label define sexlabel 9 "child", modify
자, 이렇게 하면 brows 같은 명령어로 변수를 살펴볼 때 1,2 같은 값이 안나오고 male, female, child 같은 값이 나올 것이다. 푸른색 글씨로
tab2 [열변수] [행변수] 로 교차표를 만들면 라벨값만 나오는데 ,nolabel 이라고 옵션을 주면 라벨값이 아닌 코딩된 숫자가 나온다. 그런데 둘 다 보고 싶다면 tab2를 쓰기 전에 다음 명령어를 입력한다.
numlabel [라벨정의목록들], add
--코드북(라벨 정의) 보기
어떤 데이터를 불렀는데, 다른 사람이 이 데이터에 라벨를 붙여 정보를 표시했다. 이를 보고자 한다면
codebook 명령어를 쓰면 된다. 이 때 길게 정보가 나올 수 있으므로 .compact 옵션을 주면 간단히 볼 수 있다.
use [데이터], clear
codebook, compact
describe 명령어를 쓰면 좀더 자세한 파일 포맷 등 정보도 얻을 수 있다.
label list를 치면 데이터에 있는 라벨정의와 그 값에 대한 정보가 주루룩 나온다.
*그림을 일일이 넣으려니 시간도 오래 걸리고 문제는 5mb 이상 올리기 힘들어서 일단 명령어 중심으로 했습니다. 차후 그림을 더 넣고 보기 쉽게 수정하고자 합니다.