최소 제곱 근사 (Least Squares Approximation)
한 실험자가 측정값 을 시간 에서 수집한다고 하자.
데이터 이 평면상의 점으로 표시되어 있다고 가정하자. 우리는 와 사이에 본질적으로 선형적인 관계가 존재한다고 느낀다.
와 같은 관계가 존재한다고 가정하고, 이 방정식에서 상수 와 를 찾아서 주어진 데이터에 대해 최적의 적합(fit)을 이루는 직선을 구하고자 한다.
이러한 적합도를 평가하는 한 가지 방법은, 데이터 점들로부터 직선까지의 수직 거리의 제곱합을 나타내는 오차 를 계산하는 것이다.
이제 행렬 표현을 도입하자.
라고 하면, 오차는 다음과 같이 표현할 수 있다.
우리는 이제 일반적인 방법을 사용하여 를 최소화하는 명시적인 벡터 을 찾고자 한다. 즉, 주어진 행렬 에 대해,
가 모든 벡터 에 대해 성립하는 을 찾는다.
최소제곱 해를 찾는 방법
를 행렬, 를 의 원소로 두고, 집합
를 정의하자. 즉, 는 에 의해 생성된 열 공간(column space) 이다.
벡터 가 행렬 의 열공간 에 속하지 않는 경우, 에 가장 가까운 벡터가 안에 유일하게 존재한다. 이 벡터를 라 하자. 여기서 는 의 원소이다.
그러면
가 성립한다. 즉, 는
를 최소화하는 성질을 갖는다. 이제 이러한 를 찾는 실용적인 방법을 개발하고자 한다.
가 성립하므로,
이 된다. 내적의 성질1에 의해
즉,
이 된다. 결국, 우리는 다음 방정식을 만족하는 를 찾으면 된다.
추가로, 의 랭크가 이라고 가정2하면,
를 얻는다. 이제 이 내용을 다음의 정리로 요약할 수 있다.
정리
및 에 대하여, 다음을 만족하는 이 존재한다.
또한,
가 성립한다.
추가적으로, 만약 이라면,
이 성립한다.
활용
수집한 데이터가 다음과 같다고 가정하자.
이 데이터를 행렬 형태로 나타내면,
따라서,
이제, 를 구하면,
따라서, 최소제곱 해 는 다음과 같이 계산된다.
이를 계산하면,
즉, 최소제곱 직선은
가 된다.
또한, 최소제곱 오차 는 다음과 같이 계산된다.
의 구조
는 의 켤레전치행렬이므로,
이를 와 곱하면,
이므로,
즉, 행렬의 각 성분은 다음과 같이 해석할 수 있다.
일반화 공식
이므로, 일반적인 최소제곱 직선의 해는 다음과 같다.
위의 식을 전개하면,
이고,
이다.
Footnotes
-
임의의 행렬 , 벡터 , 에 대해 와 의 내적은 와 의 내적과 같다. 즉, 이 성립한다. 이는 선형 변환을 적용한 후의 내적이 전치 연산을 통해 변환될 수 있음을 의미한다. 이를 증명하기 위해 내적의 성질을 사용하면, 가 되고, 행렬 곱셈의 결합 법칙을 적용하면 가 된다. 여기서 는 와 같으므로, 최종적으로 이 성립한다. 따라서 원래 명제가 참임을 알 수 있다. ↩
-
행렬 의 랭크는 의 랭크와 같다. 즉, 가 성립한다. 이를 증명하기 위해 차원 정리를 사용하면, 영공간(null space)의 차원이 같으면 랭크의 차원도 같기에 이 과 동치임을 보이면 된다. 먼저, 이면 명백히 이므로 성립한다. 반대로, 이라고 가정하면, 내적의 성질을 이용하여 이 성립한다. 이므로, 이고 이 성립한다. 결국, 의 영공간과 의 영공간이 동일하다는 결론을 얻을 수 있고, 이를 통해 와 의 랭크가 동일함을 보일 수 있다. 행렬 가 행렬이며 이면, 는 가역 행렬이다. 가 성립하므로, 만약 가 풀랭크(full-rank)라면 도 풀랭크가 되어 가역 행렬이 됨을 의미한다. 이 성질은 최소제곱 해를 구하는 공식 가 유일한 해를 갖도록 보장하는 중요한 역할을 한다. ↩