최소 제곱 근사 (Least Squares Approximation)

한 실험자가 측정값 을 시간 에서 수집한다고 하자.

데이터 이 평면상의 점으로 표시되어 있다고 가정하자. 우리는 사이에 본질적으로 선형적인 관계가 존재한다고 느낀다.

와 같은 관계가 존재한다고 가정하고, 이 방정식에서 상수 를 찾아서 주어진 데이터에 대해 최적의 적합(fit)을 이루는 직선을 구하고자 한다.

이러한 적합도를 평가하는 한 가지 방법은, 데이터 점들로부터 직선까지의 수직 거리의 제곱합을 나타내는 오차 를 계산하는 것이다.

이제 행렬 표현을 도입하자.

라고 하면, 오차는 다음과 같이 표현할 수 있다.

우리는 이제 일반적인 방법을 사용하여 를 최소화하는 명시적인 벡터 을 찾고자 한다. 즉, 주어진 행렬 에 대해,

가 모든 벡터 에 대해 성립하는 을 찾는다.

최소제곱 해를 찾는 방법

행렬, 의 원소로 두고, 집합

를 정의하자. 즉, 에 의해 생성된 열 공간(column space) 이다.

벡터 가 행렬 의 열공간 에 속하지 않는 경우, 에 가장 가까운 벡터가 안에 유일하게 존재한다. 이 벡터를 라 하자. 여기서 의 원소이다.

그러면

가 성립한다. 즉,

를 최소화하는 성질을 갖는다. 이제 이러한 를 찾는 실용적인 방법을 개발하고자 한다.

가 성립하므로,

이 된다. 내적의 성질1에 의해

즉,

이 된다. 결국, 우리는 다음 방정식을 만족하는 를 찾으면 된다.

추가로, 의 랭크가 이라고 가정2하면,

를 얻는다. 이제 이 내용을 다음의 정리로 요약할 수 있다.

정리

에 대하여, 다음을 만족하는 이 존재한다.

또한,

가 성립한다.

추가적으로, 만약 이라면,

이 성립한다.

활용

수집한 데이터가 다음과 같다고 가정하자.

이 데이터를 행렬 형태로 나타내면,

따라서,

이제, 를 구하면,

따라서, 최소제곱 해 는 다음과 같이 계산된다.

이를 계산하면,

즉, 최소제곱 직선은

가 된다.

또한, 최소제곱 오차 는 다음과 같이 계산된다.

의 구조

의 켤레전치행렬이므로,

이를 와 곱하면,

이므로,

즉, 행렬의 각 성분은 다음과 같이 해석할 수 있다.

일반화 공식

이므로, 일반적인 최소제곱 직선의 해는 다음과 같다.

위의 식을 전개하면,

이고,

이다.

Footnotes

  1. 임의의 행렬 , 벡터 , 에 대해 의 내적은 의 내적과 같다. 즉, 이 성립한다. 이는 선형 변환을 적용한 후의 내적이 전치 연산을 통해 변환될 수 있음을 의미한다. 이를 증명하기 위해 내적의 성질을 사용하면, 가 되고, 행렬 곱셈의 결합 법칙을 적용하면 가 된다. 여기서 와 같으므로, 최종적으로 이 성립한다. 따라서 원래 명제가 참임을 알 수 있다.

  2. 행렬 의 랭크는 의 랭크와 같다. 즉, 가 성립한다. 이를 증명하기 위해 차원 정리를 사용하면, 영공간(null space)의 차원이 같으면 랭크의 차원도 같기에 과 동치임을 보이면 된다. 먼저, 이면 명백히 이므로 성립한다. 반대로, 이라고 가정하면, 내적의 성질을 이용하여 이 성립한다. 이므로, 이고 이 성립한다. 결국, 의 영공간과 의 영공간이 동일하다는 결론을 얻을 수 있고, 이를 통해 의 랭크가 동일함을 보일 수 있다. 행렬 행렬이며 이면, 는 가역 행렬이다. 가 성립하므로, 만약 가 풀랭크(full-rank)라면 도 풀랭크가 되어 가역 행렬이 됨을 의미한다. 이 성질은 최소제곱 해를 구하는 공식 가 유일한 해를 갖도록 보장하는 중요한 역할을 한다.