통계학적 기초지식이 없이 무작정 "책"을 따라서 읽으며 R을 익히다보니,
진도가 나갈수록 제 지식의 허술함을 느끼고 있습니다.
이 카페 인기글인 안재형님의 p-value의미에 대한 글을 읽긴 했습니다만,
다중회귀분석에서 F값, Pr(>F)이 의미하는 바는 무엇인지 궁금합니다.
- F값은 전혀 감이 없고요.
- 어렴풋이 Pr에 제 생각을 적어보면...
(귀무가설- 특정 독립변수의 변화(혹은 존재)여부가 종속변수에 미치는 영향이 매우 낮다)
이를 지지하는 확률인 Pr값이 충분히 크면(0.05이상), 해당 독립변수는 제거할 수 있다.
대충 이정도입니다. 맞는지...
근데 왜 Pr안에 >F은 왜 있는지?
쉬운 설명이 가능하면 고수분께서 글을 올려주시거나, 혹은 이를 잘 표현한 자료나 책이 있으면 추천해주시면 고맙겠습니다.
감사합니다.
다음검색
댓글
댓글 리스트-
작성자안재형 작성시간 17.07.06 어떤 독립변수들이 종속변수에 얼마나 중요한 영향을 주는지 알기위해, 회귀식에서 그 독립변수들의 계수가 모두 0인지 검정합니다. 0에 가까우면 영향력이 없는거죠. F값이 이걸 측정하는 검정통계량으로 0에서 크면 클수록 계수들이 0에서 멀어집니다. p-value는 그 F-값이 0에서 얼마나 가까운지 확률적으로 측정한것입니다. 가까울수록 p-value는 커지고 독립변수들은 영향력이 없고, 멀어질수록 p-value는 작아지고 독립변수들이 영향력이 크다는 결론을 내리게 됩니다.
-
작성자김동호 작성자 본인 여부 작성자 작성시간 17.07.07 쉬운 설명 감사합니다. 수학적으로 F-값이 어떻게 정의되고 계산되는지 확인해보면, 더욱 이해도가 올라갈 것 같습니다. 고맙습니다. 안재형님.
-
작성자문학 작성시간 17.07.23 F분포를 이해하기 위해서는 카이제곱분포를 먼저 알아야 합니다.
카이제곱분포를 따르는 V1,V2가 서로 독립이고 각각 k1,k2 의 자유도를 가질 떄, (V1/k1)/(V2/K2) = F 의 분포를
자유도(K1,K2)인 F분포라고 정의합니다.
카이제곱은 독립성 검정할때 나옵니다.