다중회귀분석에서 F value와 Pr(>F)의 의미.

작성자김동호|작성시간17.07.06|조회수7,927 목록 댓글 3

통계학적 기초지식이 없이 무작정 "책"을 따라서 읽으며 R을 익히다보니,

진도가 나갈수록 제 지식의 허술함을 느끼고 있습니다.


이 카페 인기글인 안재형님의 p-value의미에 대한 글을 읽긴 했습니다만,

다중회귀분석에서 F값, Pr(>F)이 의미하는 바는 무엇인지 궁금합니다.

- F값은 전혀 감이 없고요.

- 어렴풋이 Pr에 제 생각을 적어보면...

  (귀무가설- 특정 독립변수의 변화(혹은 존재)여부가 종속변수에 미치는 영향이 매우 낮다) 

  이를 지지하는 확률인 Pr값이 충분히 크면(0.05이상), 해당 독립변수는 제거할 수 있다.

  대충 이정도입니다. 맞는지...

  근데 왜 Pr안에 >F은 왜 있는지?


쉬운 설명이 가능하면 고수분께서 글을 올려주시거나, 혹은 이를 잘 표현한 자료나 책이 있으면 추천해주시면 고맙겠습니다.


감사합니다.

다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
  • 작성자안재형 | 작성시간 17.07.06 어떤 독립변수들이 종속변수에 얼마나 중요한 영향을 주는지 알기위해, 회귀식에서 그 독립변수들의 계수가 모두 0인지 검정합니다. 0에 가까우면 영향력이 없는거죠. F값이 이걸 측정하는 검정통계량으로 0에서 크면 클수록 계수들이 0에서 멀어집니다. p-value는 그 F-값이 0에서 얼마나 가까운지 확률적으로 측정한것입니다. 가까울수록 p-value는 커지고 독립변수들은 영향력이 없고, 멀어질수록 p-value는 작아지고 독립변수들이 영향력이 크다는 결론을 내리게 됩니다.
  • 작성자김동호 작성자 본인 여부 작성자 | 작성시간 17.07.07 쉬운 설명 감사합니다. 수학적으로 F-값이 어떻게 정의되고 계산되는지 확인해보면, 더욱 이해도가 올라갈 것 같습니다. 고맙습니다. 안재형님.
  • 작성자문학 | 작성시간 17.07.23 F분포를 이해하기 위해서는 카이제곱분포를 먼저 알아야 합니다.
    카이제곱분포를 따르는 V1,V2가 서로 독립이고 각각 k1,k2 의 자유도를 가질 떄, (V1/k1)/(V2/K2) = F 의 분포를
    자유도(K1,K2)인 F분포라고 정의합니다.
    카이제곱은 독립성 검정할때 나옵니다.
댓글 전체보기
맨위로

카페 검색

카페 검색어 입력폼