-
누적 분포 함수(Cumulative Distribution Function, CDF)는 확률 변수의 분포를 설명하는 함수 중 하나로, 주어진 확률 변수가 특정 값 이하가 될 확률을 나타냅니다. CDF는 연속 확률 변수와 이산 확률 변수 모두에 대해 정의될 수 있으며, 각각의 경우에 따라 다르게 표현됩니다.
CDF의 정의
CDF는 일반적으로 \(F(x)\)로 표시되며, 확률 변수 \(X\)가 특정 값 \(x\) 이하가 될 확률을 나타냅니다. 수학적으로는 다음과 같이 표현됩니다:
\[ F(x) = P(X \leq x) \]
여기서 \(P(X \leq x)\)는 확률 변수 \(X\)가 \(x\) 이하의 값을 가질 확률입니다.
### 연속 확률 변수의 CDF
연속 확률 변수의 경우, CDF는 확률 밀도 함수(Probability Density Function, PDF)를 이용해 다음과 같이 나타낼 수 있습니다:
\[ F(x) = \int_{-\infty}^{x} f(t) \, dt \]
여기서 \(f(t)\)는 확률 변수 \(X\)의 확률 밀도 함수입니다. 이 표현은 \(X\)의 값이 \(-\infty\)에서 \(x\)까지의 구간에 대한 확률 밀도의 적분으로, \(X\)가 \(x\) 이하의 값을 가질 확률을 나타냅니다.
### 이산 확률 변수의 CDF
이산 확률 변수의 경우, CDF는 확률 질량 함수(Probability Mass Function, PMF)의 누적 합으로 표현됩니다:
\[ F(x) = \sum_{t \leq x} p(t) \]
여기서 \(p(t)\)는 확률 변수 \(X\)가 특정 값 \(t\)를 취할 확률을 나타내는 함수입니다.
### CDF의 성질
CDF는 다음과 같은 중요한 성질을 가집니다:
1. **비감소성**: \(x_1 < x_2\)인 경우, \(F(x_1) \leq F(x_2)\)입니다. 즉, CDF는 결코 감소하지 않습니다.
2. **정규화**: \(F(-\infty) = 0\)이고 \(F(\infty) = 1\)입니다. 즉, 확률 변수가 무한대로 갈 때 CDF의 값은 1에 수렴합니다.
3. **연속성**: 연속 확률 변수의 CDF는 모든 지점에서 연속입니다. 이산 확률 변수의 경우, 점프가 있을 수 있으나 오른쪽 연속성을 유지합니다.
4. **극한값**: 모든 확률 변수에 대해 \(x\)가 \(-\infty\)로 갈 때 \(F(x)\)의 값은 0에 수렴하고, \(x\)가 \(+\infty\)로 갈 때 \(F(x)\)의 값은 1에 수렴합니다.
CDF는 확률 분포를 완전히 설명할 수 있으며, 확률 변수의 분포, 중앙값, 분산 등을 분석하는 데 사용될 수 있습니다.'확률과 통계' 카테고리의 다른 글
What is probability theory? (1) 2024.03.10 Introduction to probability (0) 2024.03.03