댓글 리스트
-
작성자 강성찬 작성시간13.05.21 AIC, BIC, ML, REML 같은 개념은 통계학과 출신이라도 쉽게 설명하기 어려운 것들입니다. 너무 조급해하시기보다 차근차근 분석 경험을 쌓으시면 어느 순간에 이해가 되실 텐데요. ML(최대가능도)는 모집단에 어떤 분포를 줄 때 이를 결정하는 값(모수)를 구하는 방법인데 확률분포함수가 모수의 함수가 되면 가능도라고 부릅니다. 이 값을 최대로 하는 모수값을 찾는 것이지요. 베이지안 방법은 사실 어떻게 보면 결국 같은 방향이지만 사전분포를 설정하는 게 다릅니다.
-
작성자 강성찬 작성시간13.05.21 저도 내공이 딸리다 보니 설명하기 힘드네요. 가능도 추정 중 가장 쉬운 예를 들어보면 속이 안보이는 항아리에 빨간공, 파란공, 노란공이 수없이 많이 들어가 있다고 할 때 임의로 한번에 10개 정도 뽑아보니 빨간 공이 7개 파란 공이 2개 노란 공이 1개 있다고 하죠. 그럼 다음에 공 하나를 임의로 꺼낸다고 하면 그 공 색깔이 어떤 색이 될 가능성이 제일 높을까요? 아마 대부분 빨간색이 될 거라고 생각하시겠지요. 이때 10개 뽑은 것이 표본이라고 하고 항아리 안에 있는 공의 색 분포가 확률분포 또는 여기서 가능도라고 할 때 이 값이 가장 큰 걸 선택하는 방법입니다.
-
답댓글 작성자 안재형 작성시간13.05.21 평균 mu이고 분산이 1인 정규분포를 가정했을때, 관찰된 값이 단 하나인 70이면 mu의 MLE는 70입니다. 종이에 평행선을 하나 긋고, 70에 점을 찍으시고, 종모양의 정규분포를 평행선위에 횡으로 움직여보세요. x일때 분포의 높이를 f(x)라고 할때 mu=70인 정규분포가 f(x=70)이 최대값을 갖습니다. 값이 하나일때 likelihood는 f(x=70)이고 둘(70, 80)일때는 f(70)*f(80)입니다. 둘일때도 70, 80 두 점을 찍고 종모양의 분포를 횡으로 움직이시면 mu가 두값의 평균이 75일때 f(70)*f(80)이 최대값을 갖습니다. 이런 식의 아이디어가 MLE입니다. 글로 설명하기 힘들어서 이해가 되실지 모르겠네요...
-
작성자 안재형 작성시간13.05.21 아... 그리고 공분산행렬의 구조는 중요할수 있습니다. 두 점 y1, y2가 관찰되었을때 왠만한 통계량은 보통 y1, y2의 선형결합니다. 분산을 구해야, "통계치/표준오차"로 t-검정도 할수 있습니다. 그런데 여기서 공분산행렬의 구조는 상당히 중요한 문제입니다.
통계치=y1+y2 라면 var(통계치) = var(y1) + var(y2) + 2*cov(y1,y2) 입니다. 공분산 행렬의 구조가 diagonal 즉 독립이어서 공분산이 모두 0라면 cov(y1,y2)가 0이 되겠고, 양수가 될수도 있고, 음수가 될수도 있습니다. 그러면 "통계치/표준오차"의 값이 달라지고 해당되는 p-value가 달라집니다. 그래서 상당히 중요한 문제일수 있습니다.