회귀분석을 공부하다보면 다중공선성(Multicollinearity)에 대해서 배우게 된다. 다중공선성은 회귀모형에서 설명변수들 간의 상관성이 클때, 그 설명변수의 회귀 계수의 불확실성, 즉 표준오차(Standard Error)가 필요 이상으로 커짐을 의미한다. 이것은 좀 더 쉽게 얘기하면, 회귀계수가 실제로 유의하지만 유의하지 않게 될 가능성이 커짐을 의미한다. 즉, 모형 자체가 너무 보수적으로 되는것이다. 나는 문득 다중공선성이 신뢰구간의 기능 자체를 깨뜨리는건 아닌가 하고 생각하게 되었다. 즉, 다중공선성으로 인해 본래 신뢰구간의 기능인 같은 데이터 발생 상황에서 100번 중에 95번은 신뢰구간이 모수값을 포함한다는 그 기능 자체가 망가지는 건 아닌가 하고 생각해보게 되었다. 그런데, 분명 내가 회귀..