1. 데이터 마다의 기준에 의해서 구분이 된 것이 집단이기에 해당 집단의 특성이 녹아있는 데이터를 사용해야 합니다.
경우에 따라서는 데이터의 갯수가 작아지는 경우가 생길수도 있지만, 데이터의 집단을 합칠때는 예를 들어서
20대, 30대, 40대, 50대가 있다면, 20대~30대를 합쳐 30대 이하, 40대와 50대를 합쳐 40대 이상과 같이 어느정도의 표본수에 맞춰
진행해야 합니다.
2. 어떤부분인지 정확히 설명부탁드립니다.
3. 통계적인방법이 다르기에 결과가 다르게 나타납니다. 하다못해 t-test의 경우 등분산 가정과 가정하지 않은 경우의
t값과 유의확률은 엄연히 다르게 계산됩니다.
4. 등분산 가정은 집단간 비교에서 사용하는 가정이며, 회귀동질성 가정은 정확한 말씀은 없지만 오차가 정규분포를 따라야 한다는 가정을 말씀해 주신 것으로 판단되며, 둘의 가정은 결국 같은 의미로 사용됩니다. 오차의 등분산에 대한 가정이 levene의 검정입니다.
도움이 되시길...
다음검색