본문으로 바로가기



베이지안 통계 with R - 1. 베타분포(Beta dist.)의 확률밀도함수(pdf)에 대하여

category Statistics/Bayesian stat. 2017.07.18 09:13
베이지안 통계 with R - 1. 베타분포(Beta dist.)의 확률밀도함수(pdf)에 대하여

갑자기 재미있는 베이지안 문제를 발견하여 시리즈를 시작하게 되었다. 이 문제를 풀기에 앞서 먼저 베타분포의 pdf에 대하여 알아보도록 하자. 우리는 이 베타분포를 이 후 포스팅에서 사전 확률분포를 정의하는데에 사용하도록 할 것이다.

연속형 확률분포 중에 하나인 베타분포의 가장 큰 특징은 확률변수의 값이 0에서부터 1사이의 값을 갖는다는 것이다. 즉, 밀도함의 관점에서는 0에서 1까지만 양의 값을 갖고 나머지는 0의 값을 갖는 것이다. 이와 같은 분포 중 가장 유명한 분포는 0에서 1사이의 값을 동일한 확률로 갖는 균등분포가 있다. 베타분포는 균등분포를 일반화 시킨 분포라고 이해하면 좋다.

확률밀도 함수(probability distribution)

베타분포는 두 개의 모수, \(\alpha > 0\)\(\beta > 0\),를 갖는 분포이다. 이 분포의 확률밀도한수(pdf)는 다음과 같다.

\[ f\left(x;\alpha,\beta\right)=\begin{cases} \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha,\beta)}\! & x\in\left[0,1\right]\\ 0 & otherwise \end{cases} \] 위의 식에서 \(B\) 함수는 베타함수를 의미한다. 베타함수의 정의를 살펴보면 이것을 사용해서 pdf의 적분값이 1이 나오도록 하는 역할을 하고있다는 것을 알 수 있다. 베타함수에 관한 좀 더 자세한 정보는 링크를 참고하도록 하자.

\[ {\displaystyle \mathrm {B} (\alpha,\beta)=\int _{0}^{1}t^{\alpha-1}(1-t)^{\beta-1}\,dt} \]

기대값, 분산, 그리고 최빈값

기대값과 분산, 그리고 최빈값은 다음과 같다. 아래의 식을 참고하면서 포스팅의 내용을 이해하면 도움이 될 것이라 생각한다.

\[ \operatorname{E}[X] = \frac{\alpha}{\alpha+\beta}\! \]

\[ \operatorname{var}[X] = \frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}\! \]

\(\alpha, \beta > 1\) 일 때의 최빈값은 다음과 같이 계산할 수 있다.

\[ \frac{\alpha-1}{\alpha+\beta-2}\! \]

\(\alpha\)에 따른 밀도함수의 움직임

\(\alpha\)가 1보다 클 경우

아래의 그래프에서 알 수 있듯, 알파의 값이 1보다 클 경우, 알파값이 커짐에 따라서 밀도함수의 오른쪽 끝부분이 올라가는 것을 알 수 있다. 이와 동시에 왼쪽 부분은 0에서 시작해서 점점 x축과 가까워 지는데, 이것은 당연한 결과이다. 왜냐하면 적분값이 1이 되어야 하는 확률밀도함수 조건 상 어느 한쪽을 들어올리면, 대응되는 반대부분은 넓이 1을 맞추기위해 당연히 내려가야 한다.

\(\alpha\)가 1보다 작을 경우

앞서 살펴본 것과는 반대로, 알파값이 1보다 작을 경우, 알파값이 작아짐 따라서 밀도함수의 오른쪽 끝부분이 내려가는 것을 알 수 있다. 이에 대응하여 왼쪽 끝값은 증가함과 동시에 점점 y축과 가까워진다.

앞선 두 그래프를 통하여 우리는 베타분포의 모수 \(\alpha\)는 밀도함수의 오른쪽 값을 조절하는 버튼 역할을 한다는 것을 알 수 있었다. 하지만 베타함수를 잘 이해하기 위해서는 반대쪽 꼬리방향의 움직임을 잘 기억해두면 좋다. 즉, 위의 그래프에서 주목해야하는 것은 다음과 같다.

  1. 알파값이 1을 기점으로 증가하면, 왼쪽 꼬리는 0으로 떨어지고, 알파값이 커짐에 따라서 점점 x축과 가까워진다.
  2. 알파값이 1을 기점으로 감소하면, 왼쪽 꼬리는 위로 솟아오르며, 알파값이 작아집에 따라서 점점 y축과 가까워진다.

\(\beta\)에 따른 밀도함수의 움직임

베타 모수의 값에 따른 밀도함수의 움직임은 알파 모수와 정확히 반대되는 역할을 한다는 것을 짐작할 수 있다. 왜냐하면 알파와 엮여있는 항은 \(x\)항이고, 베타와 엮여있는 항은 \((1-x)\)이므로 알파 모수에 대응되는 현상이 정확히 0.5를 기준으로 대칭되어 발생한다는 것을 알 수 있다. 따라서 아래의 두 경우에 대한 설명은 생략하도록 하겠다.

\(\beta\)가 1보다 큰 경우

\(\beta\)가 1보다 작을 경우

위의 두 그래프에서 주목해야하는 것은 다음과 같다.

  1. 베타값이 1을 기점으로 증가하면, 오른쪽 꼬리는 0으로 떨어지고, 베타값이 커짐에 따라서 점점 x축과 가까워진다.
  2. 베타값이 1을 기점으로 감소하면, 오른쪽 꼬리는 위로 솟아오르며, 베타값이 작아집에 따라서 점점 y축과 가까워진다.

응용하기

먼저 위의 그래프에서 알파와 베타값이 모두 1인 경우, 베타분포는 균등분포 \((0, 1)\)과 동일하다는 것을 알 수 있다. 앞에서 알아본 모수의 값에 반응하는 pdf의 움직임을 생각하면 다음을 유추해 볼 수 있다.

  1. 동그란 모양의 베타분포 pdf를 그리기 위해서는 양끝 꼬리가 0이 되어야하고, x축과 멀리 떨어져있어야 하므로, 알파와 베타값이 1보다 살짝만 높으면 된다. (알파 2, 베타 2의 빨간색 그래프)

  2. 종모양의 베타분포 pdf를 만들기 위해서는 알파, 베타값이 커서 꼬리가 x축으로 붙게 만들어줘야 한다. (알파 5, 베타 5의 파란색 그래프)

  3. 두 모수의 크기 조정을 통해서 한쪽으로 치우치는 그래프를 만들 수 있다. (알파 5, 베타 2의 초록색 그래프)

  4. 두 모수값이 1보다 작아지면 양끝은 위로 올라간다. (알파 0.5, 베타 0.5의 노란색 그래프)


Reference

[1] Wikipedia Beta distribution: https://en.wikipedia.org/wiki/Beta_distribution


SHARE TO



티스토리 툴바