통계학의 역사
Statistics(통계학)의 어원은 State Arithmetic(국가산술)에서 유래한다. 과거 징세를 목적으로 인구수조사와 지가계산에서부터 통계학은 시작하였다. 통계학은 17, 18세기에는 물리와 천문학의 발달과 함께 무게와 거리와 같은 물리량의 정확한 측정이 중요하게 되면서 발전하게 되었다. 이때 천문학자와 측량기술자는 측정값의 변이성, 즉 동일한 대상을 반복 측정할 때 측정값이 일정하지 않는 사실에 직면하게 되어 이의 해결책으로 여러 가지 통계적 방법이 개발되었다.
19세기 들어 통계학의 영역은 농업과 생명과학으로 확대된다. 농작물 재배에서 신품종이 기존 품종보다 수확량이 더 많은가? 또 어떤 조건(비료, 기후, 토질 등)에서 그런가? 부모와 자식의 키에는 어떤 관계가 있는가? 이와 같은 문제를 해결하기 위해 실험과 관측을 통해 얻은 자료에 의존하게 되면서 효과적인 통계적 방법이 개발되었다.
과학의 한 분야로서 통계학이 정립된 것은 20세기 들어서이다. 자료를 수집 분석하는 기법이 복잡 다양해지면서 여러 과학분야에 산재되어 있던 통계적 방법이 모여 하나의 학문으로 자리잡게 된다.
오늘날 통계학이 이용되는 분야는 헤아릴 수가 없을 정도이다. 일 예로, 일기예보, 여론조사, 품질향상, 흡연의 유해성 분석 등이 있다.
통계학의 정의
연구 목적에 필요한 자료 및 정보를 최적한 방법으로 수집하고, 수집한 자료를 과학적이고 논리적인 이론에 의하여 정리 분석하는 학문. 통계용어사전, 한국통계학회(1987), 자유아카데미.
집단 현상을 수량적으로 관찰, 파악하여 통계자료를 처리, 분석하는 방법에 관한 학문으로, 사회 통계, 이론 통계, 응용 통계의 셋으로 나눌 수 있다. 한국세계대백과사전.
<사회 통계학> 사회제도로서의 통계를 대상으로 하는 분야. 보통 정부에 의해 작성됨(정부통계라고도 함). 통계의 의의, 통계조사법, 통계제도, 통계체제, 통계의 역사 등을 연구대상으로 함. 사회집단을 대상으로 하여 대량관찰, 결과를 수량적으로 표현. 사회적 요청에 부응하기 위해 작성했으므로 사회의 발전단계를 반영. 한계 정부와 국민의 협력과 대항 관계에서 작성되는 것이므로 통계 작성자의 의도와 조사 대상자의 논리도 반영됨.
<이론 통계학> 관청통계뿐 아니라 집단 현상에 관한 숫자 데이터를 다루는 방법을 고찰하는 것(수리통계라고도 함). 수학적 논리에 그치지 않고 숫자 데이터의 본질과 그 의의 등을 방법론적으로 음미함. 기술 통계학과 추측통계학으로 나누어져 있음.
<응용 통계학> 통계학을 여러 다른 학문에 응용한 것을 말함. 주로 의학이나 농생물학, 경제· 사회 등 대부분의 분야에서 통계학을 응용함. 세계대백과사전, 학원출판공사.
통계학 - 이 부분에서 취급하는 문제는 2종류로 나눌 수 있다. 제1종의 문제는, 수집된 자료를 정리하고 그 내용을 특정 짓는 몇 가지의 수값을 산정해서, 전체의 모습을 파악하고자 하는 것이다. 구체적으로 말하면, 상가평균, 산포도 측정, 상관계수의 지수 등 여러 가지 수값에 의하여 자료중에 포함되어 있는 본질적 내용을 적절하게 유도하는 일이다. 제2종의 문제는 손이 미치는 범위에 있는 자료를 모집단이라는 하나의 도수 분포에서 얻어낸 임의의 표본이라고 보고 그 수값에서 모집단의 돗수분포를 특정 짓는 수값을 추계 하려는 것이다. 이것을 추계론이라 한다. 수학대백과, 한국사전연구회.
통계학은 관심의 대상에 대한 관련된 자료를 수집하고, 그 자료를 요약 정리하여 해석하며, 이로부터 불확실한 사실에 대한 결론이나 일반성 등을 이끌어 내는데 필요한 이론과 방법을 제시하여 주는 학문. 통계학-원리와 방법, 구자홍,김진경,이재준,전홍석,최지현, 자유아카데미(1992).
과학적인 이론에 근거하여 우리의 관심사에 대한 정확한 대상이 선정되어야 하며, 연구 목적에 필요한 자료와 정보가 경제성과 정밀도를 고려하여 최적한 방법으로 수집되고 수집된 자료를 과학적인 이론에 의하여 정리·분석되어야 한다. 이러한 방법을 제시해 주는 것이 바로 통계학이다. 현대통계학, 박홍래외 7명, 영지문화사.
현대 통계학은 실험을 계획하는 것으로부터 시작하여 얻어진 자료를 정리, 분석하여 상황을 설명해주며 실험에서 관측된 일부 즉, 표본을 통하여 관측되지 않은 것을 포함한 전체 즉,모집단에 관한 특성을 추측하게 되는데 이때 범할수 있는 오류를 확률이라는 객관적 척도를 사용하여 불확실한 정도를 나타내주고 있다. 불확실한 상태에서 수량적인 자료를 어떻게 수집하고, 분석하고, 해석할 수 있는 가의 이론이나 방법을 개발하고 응용함으로써, 부분적인 정보를 주는 자료에서 얻은 결론이 얼마나 믿을 수 있는 가를 확률이론을 통해서 객관적으로 평가하는 학문이다. 최신통계학, 이재창, 법경출판사(1985).
사회과학의 통계학이란 사회현상을 객관적이고 과학적으로 기술하고 설명하며 예측하므로 써 의사결정과 정책결정에 도움을 주기 위한 학문이라고 할 수 있으며 구체적으로 표현하면 정치 행정 사회의 현상에 관한 자료를 수집하고 정리하여 간단명료하게 표현하며 계량적으로 분석하는 절차와 방법의 체계를 의미한다. 사회과학 통계분석, 김호정, 삼영사(1993).
어떤 타당한 결론을 도출해내고, 합리적인 의사 결정을 하기 위하여 자료를 수집, 정리, 요약, 표현, 분석하기 위한 학문이다. 근대에 이르러 통계학은 단순한 사실의 기술에서 어떤 이론이나 가설로 붙어 장래의 현상에 대한 추론과 예측을 하여 불확실한 상황하에서 의사 결정을 하는 방법으로도 활용이 된다. 통계학, 송정길-전형석. 대림출판사(1992).
통계학이란 무엇인가?
매우 다양한 분야의 연구에서 주어진 문제에 대하여 적절한 정보(자료, data)를 수집하고 분석하여 해답을 구하는 과정은 아주 중요하다. 이런 방법을 연구하는 과학의 한 분야가 통계학이다. 통계학을 필요로 하는 연구분야는 농업, 생명과학, 환경과학, 산업연구, 품질보증, 시장조사 등 매우 많다. 또한 이러한 연구방식은 기업체와 정부의 의사결정과정에서 현저하게 나타난다. 주어진 문제에 대하여 필요한 자료의 형태, 자료를 수집하는 방법, 문제에 대한 최선의 답을 구하기 위한 분석방법을 결정하는 것이 통계학자의 역할이다.
자료는 어떤 특정한 현상(주제, 사실)을 조사하기 위하여 설계된 계획된 실험으로부터 얻을 수 있다. 이런 종류의 자료, 즉 실험자료는 농업연구와 같은 분야에서 흔히 있는 것이다. 통계학자들은 이미 얻어진 실험자료를 분석하는데 만 관심이 있는 것이 아니라, 자원을 효과적으로 사용하고 주어진 문제를 실험으로 해결하기 위하여 처음부터 실험을 계획하는데 관심이 있다.
또 다른 형태의 자료가 관측으로부터 얻어진다. 조사자들은 연구실 밖으로 나가서 실제로 존재하는 것을 조사한다. 이런 예로는 인구 및 주택센서스와 같은 전수조사, 여론조사, 교통량조사 등등이 있다. 이 경우 조사방법과 설문지 작성은 매우 중요한 문제가 된다.
모집단과 표본
어떤 보험회사에서 새로운 상품을 개발할 때 그 상품에 대한 소비자의 선호도를 미리 알 필요가 있을 것이다. 이 때 모든 소비자를 대상으로 선호도를 조사한다는 것은 경제적인 면에서나 시간적인 면에서 바람직하지 못하다. 또한 이런 방대한 집단을 대상으로 조사를 할 경우에, 조사원의 불성실이나 집계 과정에서의 사무적 착오 등으로 인한 조사결과의 비정확성을 무시하지 않을 수 없다. 따라서 전체 가구 중 일부분을 뽑아서 정확히 조사하여, 전체 소비자의 선호도를 파악하는 것이 효율적이다. 이처럼 관심의 대상을 모두 다 조사하지 않고 그 중 일부분을 뽑아서 통계적 처리를 한다는 것이다. 이 때 관심의 대상이 되는 모든 개체의 관측값의 집합을 모집단(population)이라 하며, 통계적 처리를 위하여 모집단에서 실제로 추출한 관측값이나 측정값의 집합을 표본(sample)이라 한다. 또 모집단은 그것을 구성하는 원소의 수에 따라서 유한모집단(finite population)과 무한모집단(infinite population)으로 나뉘어진다. 유한모집단은 원소의 수가 유한개일 경우를 가리키며, 무한모집단은 원소의 수가 무한개일 경우를 가리킨다.
기술통계학과 추측통계학
자료의 양이 방대한 경우 이 때 우리는 자료의 전반적인 내용을 쉽게 파악하기 위하여 자료를 정리, 요약해야 할 필요성이 있음을 알 수 있다. 이와 같이 자료를 수집하고 표나 그림 또는 대표값, 변동의 크기 등을 통하여 수집된 자료의 특성을 쉽게 파악할 수 있도록 자료를 정리, 요약하는 방법을 다루는 분야를 기술통계학(descriptive statistics)이라 한다. 또 모집단의 일부분으로서 실제로 관측된 표본을 이용하여 모집단의 특성에 대하여 추측을 할 때 통계적인 방법이 이용됨을 알았다. 이와 같이 표본에 내포된 정보를 분석하여 모집단의 여러 가지 특성에 대하여 과학적으로 추론하는 방법을 다루는 분야가 추측통계학(inferential statistics)이다. 추측 통계학은 오늘날의 통계학에서 핵심이 되는 분야이다.
기술통계학에서 다루는 자료들은 그 자체가 모집단이거나 또는 모집단의 일부분으로서 표본일 수도 있다. 전자의 경우는 기술통계학의 분석방법으로부터 얻은 결과로써 모집단의 특성에 대한 결론을 내릴 수 있다. 반면, 후자의 경우는 표본으로부터 얻은 결과를 토대로 추측통계학의 방법을 이용하여 통계적 추론을 하게 된다.
통계기초용어
모집단(population)
: 수집 가능한 모든 특성값들을 모아 놓은 집단.
일반적으로는 추출단위를 모아 놓은 집단을 모집단으로 간주한다.
특성값(관측값)
: 각각의 추출단위(조사의 대상)의 특성을 나타내는 값.
표본(sample)
: 실제로 수집되는 모집단의 일부인 특성값들을 모아 놓은 집단.
통계적 추론(statistical inference)
: 모집단에 대해 추측 또는 결정하는 과정.
대립가설(alterna-tive hypothesis)
: 표본으로부터 확실한 근거에 의하여 입증하고자 하는 가설로서, 흔히 으로 나타낸다.
귀무가설(null hypothesis)
: 대립가설이 참이라는 확실한 근거가 없을 때 받아들이며 대립가설과 상반되는 가설로서, 흔히 로 나타낸다.
검점통계량
: 귀무가설과 대립가설 중에서 하나를 선택하는 데 사용하는 통계량
기각역
: 귀무가설 를 기각시키는 검정통계량의 관측값의 영역
오류(잘못된 결정)의 종류
① 귀무가설이 사실일 때 귀무가설을 기각하지 않을 경우 --- 참
② 대립가설이 사실일 때 귀무가설을 기각할 경우 --- 참
③ 귀무가설이 사실일 때 귀무가설을 기각할 경우 --- 제 1종 오류(α)
④ 대립가설이 사실일 때 귀무가설을 기각하지 않을 경우 --- 제 2종 오류(β)
※ 두 종류의 오류를 동시에 줄일 수는 없고, 제 1종 오류가 더 심각한 오류이기 때문에
제 1종 오류의 최대허용한계를 정해 놓고, 제 2종 오류를 최소로 하는 검정방법을 선택한다.
유의수준(significance level)
: 귀무가설 가 참일 때 대립가설 을 채택하는 오류를 범할 확률의 최대 허용한계이다. 즉, 제1종 오류를 범할 확률의 최대 허용한계
유의확률
: 검정통계량의 관측값으로 귀무가설을 기각하려 할 때, 요구되는 유의수준의 최소값.
유의확률이 작을수록 귀무가설에 대한 반증이 강함을 뜻한다.
다음검색
댓글
댓글 리스트-
작성자품질/주/정보통계3/안이환 작성시간 03.11.06 유의확률 < 유의수준 : 귀무가설을 기각하고 유의확률 > 유의수준 : 귀무가설을 기각할 충분한 근거거 없음 이것은 통계학적 관점에서 보는 것입니다. 유의확률과 유의수준이 어떤것인지 개념을 잡으셔야 이해가 될것입니다. ^^
-
작성자품질/야/통계3/정백현 작성시간 03.11.06 통계 분석 패키지를 이용하여 분석하실때 보면은요...p-value(p값=유의확률)라는 값이 나옵니다. 그 값을 이용하여 가설검정을 하는데요(일단 검정통계량이니 뭐니 그런건 일단 넘어가고요^^).. 그 값이 유의수준(보통 0.05 사용)보다 작을 때 귀무가설을 기각하게 됩니다. 쉽게 말하자면 유의수준은은 기준점이 되는것이고
-
작성자품질/야/통계3/정백현 작성시간 03.11.06 유의확률은 그 유의수준을 기준으로 작으면 귀무가설 기각, 크며은 귀무가설 채택을 하게 되는 것이지요. 그리고 귀무가설이 기각된다는 것은 유의수준(보통 5%) 하에서 귀무가설을 참이라고 할 수 있는 충분한 증거가 없다는 것입니다. ^^쉽게 설명드릴려고 말씀드렸는데..더 헷갈리지나 아느셨나 모르겠네요..그럼..^^
-
작성자품질/야/경영3/정서정 작성시간 03.11.08 유의 확률과 귀무가설의 기각, 채택 여부..오늘강의 시간에 배웠던 내용이네요..^^ 다시 한번 복습해 봐야 겠어요..^^
-
작성자품질/야/경영3/서정명 작성시간 03.11.09 주국진님에 대한 답 : "대립가설이 아니면 귀무가설이다." 젤 쉽게 말하면 서로 상반되는 가설이니까 그렇죠 저도 아직 통계부분은 약해서......넘 간단한 대답인가욤...