CAFE

묻고 답하기

콕스비례위험모형, 로지스틱회귀분석 질문입니다.

작성자3025|작성시간13.11.23|조회수5,042 목록 댓글 5

카페와 책 너무나 잘 보고 있습니다. 감사합니다.

저는 SPSS로 조금씩 통계 돌리다가 그래프의 한계를 느껴서 R을 공부하기 시작했습니다.

근데 기본적인 개념정리가 되지 않아 궁금한게 있어서 질문드립니다.


1.

콕스비례위험모형과 로지스틱회귀분석의 차이가 무엇인지 헷갈립니다.

둘다 어떤 결과에 미치는 요인을 찾아내는 것 아닙니까?

다만 콕스에는 어떤 결과(event)가 나오기까지 걸린 시간이 추가되는 것이 차이인가요?

어떨때 콕스를 쓰고 언제는 로지스틱을 쓰는지 궁금합니다. 


예를 들어 암의 재발에 영향미치는 인자를 찾고자 할때, 여러 요인과 재발까지 걸린 시간을 조사했습니다. 당연히 콕스를 이용하는게 맞겠지만, 로지스틱회귀분석을 해도 통계는 돌려지더라구요. 이렇게 재발에 미칠 것으로 생각되는 여러 인자 중 유의한 것을 찾으려면 어떤 통계방법을 이용하는게 맞나요? 


2. 

암의 재발(recurrence)과 진행(progression)에 미칠 것으로 생각하는 여러 인자와 실제로 재발, 진행한 기간을 조사했습니다. 

단변량 분석(univariate analysis)을 구해봤는데, 제가 시행한 방법이 맞는지 불안합니다.

성별과 재발을 콕스로 이용해서 HR(95%CI), p-value를 구했고, 또 다시 통계돌려서 나이와 재발을 돌려보고...

이런식으로 여러 인자를 하나씩 돌려서 노가다로 표를 만들었습니다. 이게 단변량 분석 맞죠?


또 다변량 분석(multivariate analysis)를 콕스로 구했는데, 이번에는 제가 영향을 줄것이라고 조사한 인자들을 한꺼번에 다 넣고 재발을 event로 해서 콕스를 돌렸습니다. 이게 다변량 분석 맞나요? 

SPSS를 돌려 유의한 인자들은 HR와 95%CI가 나오는데, 유의한 결과가 안나온 인자들은 HR과 95%CI를 어디서 확인할 수 있을까요? (R로는 구할 수 있나요?)


3.

제가 궁금한 것들을 찾으려고 인터넷 여기저기 다니다가 univariate(단변량), univariable(단변수), multivariate(다변량), multivariable(다변수) 분석의 개념을 새로 알게 됐습니다. 

재발(1개의 종속변수)에 대해 성별, 나이, 기저질환(여러개의 독립변수) 분석하는 것을 multivariable(다변수) 분석.

재발, 진행(여러개의 종속변수)에 대해 성별, 나이, 기저질환(여러개의 독립변수) 분석하는 것을 multivariate(다변량) 분석.

여러개의 독립변수를 분석하는 것을 다변수분석, 여러개의 종속변수를 분석하는 것을 다변량분석이라고 한다는데요, uni-에 대해서도 마찬가지라 하고요.


2번에서 질문 드렸듯이 재발을 event로 넣고 콕스돌리고, 진행을 event로 넣고 콕스 돌려서 하나의 표를 multivariate analysis라고 해서 만들었는데... 혹시 다변량 분석과 다변수 분석을 구하는 법이 따로 있습니까? 엄밀히 말하면 저는 다변수 분석을 2번(재발과 진행에 대해) 시행한게 되는 게 아닙니까?



제가 너무 초보라 장황하게 질문을 많이 드려서 죄송합니다. 대부분 제가 알고 있는 내용이 맞는 지 확인하는 거라서 만약 위에 내용이 맞다면 답변 주시기는 그리 어렵지 않을 것같다는 생각이 듭니다. (주변에 통계 잘 아는 사람도 없고, 책도 여러권 샀는데 제가 궁금한 내용을 찾기가 힘들어 절박한 심정에 질문드립니다. ㅜㅜ) 긴글 읽어주셔서 감사하고 답변 주시면 정말 감사하겠습니다. 



다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
  • 작성자안재형 | 작성시간 13.11.25 재발했는지(1) 안해쓴지(0)를 종속변수로 하면 logistic regression이고, 재발까지 걸린 시간을 종속변수로 하면 cox regression입니다.
  • 작성자안재형 | 작성시간 13.11.25 다변량, 다변량은 독립변수의 수가 2개 이상이 아니라 종속변수의 수가 2개 이상인 경우입니다. 독립변수가 2개 이상이면 "multivariate"대신 "multiple"이라고 용어를 사용합니다. multivariable이란 용어는 처음 듣습니다. 2번은 multiple입니다.
  • 작성자안재형 | 작성시간 13.11.25 2. 제책 p218에 보시듯 R에서 harzard ratio와 95% CI를 쉽게 구할수 있습니다. SPSS는 해본적 없습니다.
  • 작성자3025 작성자 본인 여부 작성자 | 작성시간 13.12.02 친절한 답변 너무 감사합니다~ ^^
  • 작성자양원희 | 작성시간 13.12.26 제가 이해하기로는, 사건(여기선 암발생이겠죠?)의 발생을 분석할 때 로지시틱 모형을 쓰고, 사건의 발생까지 걸리는 시간을 분석할때도 로지스틱을 이용할 수가 있는데, 콕스 아저씨가 사건의 발생까지 걸리는 시간을 계산할때 일반적으로 사용하는 가정, 즉, 모든 사건의 발생은 일정시간동안 균일하게 발생할 확율을 갖는다는 가정을 깨고 분석할수 있는 모형을 하나 만드셨는데, 그게 콕스의 비례위험 모형인걸로 알고 있습니다. 즉 순간발생율(=순간 위험율)이 상수가 아닌 경우에도 콕스모델은 쓸수 있는거죠. 맞을려나?
댓글 전체보기
맨위로

카페 검색

카페 검색어 입력폼