교육과정 2022 개정 중학교 1~3학년 수학 · 확률과 통계

📊 확률과 통계 완벽 정리

이전 개념 기하
지금 여기 통계
다음 개념 미적분 →
📚 중등·고등 수학 🎯 핵심 개념: 대표값, 산포도, 확률, 분포 📋 수학Ⅰ · 2022 개정 교육과정 🎯 수능 출제 범위
2022 개정 · 수학 검토: 2026.04 오류 신고
탄생 배경

통계학은 17세기 런던 역병 사망자 기록에서 시작되었습니다. 존 그런트가 사망 기록을 분석해 패턴을 찾아낸 것이 인구 통계학의 시초이며, 이후 보험·의학·국가 행정의 필수 도구로 성장했습니다.

개념 여정 방정식 함수 확률·통계 추론통계 데이터 과학
📌 이 단원을 마치면
🌱 왜 확률과 통계를 배우는가?

우리는 매일 불확실한 정보를 판단합니다 — 날씨 예보, 약의 효과, 선거 결과 예측. 통계는 데이터에서 패턴을 발견하고, 확률은 미래의 불확실성을 수치화하는 도구입니다. AI와 머신러닝의 핵심이 통계학이며, 의학 연구·금융 리스크 분석·여론 조사 모두 이 단원의 개념을 직접 사용합니다. 정규분포 하나만 이해해도 세상의 수많은 현상을 새로운 시각으로 볼 수 있습니다.

💡 이걸로 이해하면 됩니다
평균 = 키 맞추기 게임

5명의 키를 모두 똑같이 맞추려면? 모두의 키를 합쳐서 5로 나누면 된다 — 이게 평균이다. 분산은 "키가 평균에서 얼마나 떨어져 있나"를 수치화한 것. 키가 모두 170cm면 분산=0, 들쑥날쑥하면 분산이 커진다.

⚡ 핵심 30초 요약
📊 수능 출제 포인트
학습자 질문

평균이 항상 적절한 대표값인가요?

아닙니다. 연봉 9명이 3000만 원, 1명이 1억이면 평균은 3700만 원 — 90%의 현실과 거리가 있습니다. 이럴 때는 중앙값이 더 대표적입니다. 평균은 극단값에 민감하므로 분포를 먼저 확인해야 합니다.

1. 대표값 (Measures of Central Tendency) [12수I04-01]

자료 전체의 특징을 하나의 값으로 나타내는 값을 대표값이라 합니다.

평균 (Mean)

\[ \bar{x} = \frac{x_1 + x_2 + \cdots + x_n}{n} = \frac{1}{n}\sum_{i=1}^{n} x_i \]
예제: 자료 [4, 7, 3, 9, 2]의 평균 구하기
\(\bar{x} = \dfrac{4+7+3+9+2}{5} = \dfrac{25}{5} = 5\)

중앙값 (Median)

자료를 크기 순서로 배열했을 때 가운데 위치하는 값입니다.

예제: 자료 [4, 7, 3, 9, 2]의 중앙값
정렬: 2, 3, 4, 7, 9 (n=5, 홀수)
3번째 값 = 4

최빈값 (Mode)

자료 중 가장 많이 나타나는 값입니다. 최빈값은 여러 개일 수도 있습니다.

예제: [2, 3, 3, 5, 7, 3, 8]의 최빈값 = 3 (3이 3번으로 가장 많음)

2. 산포도 (Measures of Dispersion) [12수I04-02]

자료가 평균으로부터 얼마나 퍼져 있는지를 나타내는 값입니다.

편차 (Deviation)

\[ \text{편차}_i = x_i - \bar{x} \]

편차의 합은 항상 0입니다: \(\displaystyle\sum_{i=1}^{n}(x_i - \bar{x}) = 0\)

분산 (Variance)

\[ \sigma^2 = \frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n} = \frac{1}{n}\sum_{i=1}^{n}x_i^2 - \bar{x}^2 \]

표준편차 (Standard Deviation)

\[ \sigma = \sqrt{\sigma^2} = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n}} \]
예제: 자료 [2, 4, 4, 6, 4]의 분산과 표준편차 구하기
평균: \(\bar{x} = \dfrac{2+4+4+6+4}{5} = \dfrac{20}{5} = 4\)

편차: −2, 0, 0, 2, 0
편차의 제곱: 4, 0, 0, 4, 0

분산: \(\sigma^2 = \dfrac{4+0+0+4+0}{5} = \dfrac{8}{5} = 1.6\)
표준편차: \(\sigma = \sqrt{1.6} \approx 1.265\)

3. 확률의 기초 [12수I05-01]

확률(probability)은 어떤 사건이 일어날 가능성을 수로 나타낸 것입니다.

수학적 확률 (Classical Probability) \[ P(A) = \frac{\text{사건 A가 일어나는 경우의 수}}{\text{전체 경우의 수}} \]
예제: 주사위 한 번 던질 때 홀수 눈이 나올 확률
전체 경우의 수: 6 (1, 2, 3, 4, 5, 6)
홀수인 경우의 수: 3 (1, 3, 5)
\(P(\text{홀수}) = \dfrac{3}{6} = \dfrac{1}{2}\)

여사건 (Complementary Event)

\[ P(A^c) = P(\bar{A}) = 1 - P(A) \]

4. 확률의 덧셈정리 [12수I05-02]

\[ P(A \cup B) = P(A) + P(B) - P(A \cap B) \]
배반사건 (Mutually Exclusive Events)

두 사건 A와 B가 동시에 일어날 수 없을 때 (\(A \cap B = \varnothing\)):

\[ P(A \cup B) = P(A) + P(B) \]
예제: 주사위에서 3의 배수 또는 2의 배수가 나올 확률
A = {3의 배수} = {3, 6} → P(A) = 2/6
B = {2의 배수} = {2, 4, 6} → P(B) = 3/6
A ∩ B = {6} → P(A ∩ B) = 1/6
\(P(A \cup B) = \dfrac{2}{6} + \dfrac{3}{6} - \dfrac{1}{6} = \dfrac{4}{6} = \dfrac{2}{3}\)

5. 조건부 확률과 곱셈정리 [12수I05-03]

조건부 확률

사건 B가 일어났다는 조건 하에서 사건 A가 일어날 확률입니다.

\[ P(A | B) = \frac{P(A \cap B)}{P(B)} \quad (P(B) > 0) \]

곱셈정리

\[ P(A \cap B) = P(B) \cdot P(A | B) = P(A) \cdot P(B | A) \]

독립사건

두 사건 A, B가 독립이면 (서로 영향을 주지 않으면):

\[ P(A \cap B) = P(A) \cdot P(B) \] \[ P(A | B) = P(A), \quad P(B | A) = P(B) \]
❌ 흔한 실수 — 독립 vs 배반
두 사건이 배반이면 독립이다 두 사건이 배반이면 대부분 종속이다 (A 발생 시 B 불가 → 서로 영향)
배반: \(A \cap B = \emptyset\) → 동시에 일어날 수 없음. 독립: \(P(A \cap B) = P(A)P(B)\) → 서로 영향 없음. 두 사건이 배반이면 한 사건의 발생이 다른 사건의 확률을 0으로 만들므로, \(P(A) > 0, P(B) > 0\)이면 오히려 종속입니다.
예제: 동전을 두 번 던질 때, 첫 번째 앞면이 나온 후 두 번째도 앞면이 나올 확률
두 사건은 독립:
\(P(\text{앞앞}) = P(\text{앞}) \times P(\text{앞}) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4}\)

6. 이항분포 (Binomial Distribution) [12수I05-04]

같은 조건 아래 독립적으로 반복되는 실험에서, 각 시행의 성공 확률이 \(p\)일 때 \(n\)번 시행 중 성공 횟수 X의 분포입니다.

\[ X \sim B(n, p) \] \[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} \quad (k = 0, 1, 2, \ldots, n) \]
이항분포의 평균과 분산 \[ E(X) = np \qquad \text{(평균)} \] \[ V(X) = np(1-p) \qquad \text{(분산)} \] \[ \sigma(X) = \sqrt{np(1-p)} \qquad \text{(표준편차)} \]
예제: 동전을 10번 던질 때 앞면이 나오는 횟수 X의 평균과 분산
\(X \sim B(10, \frac{1}{2})\)
평균: \(E(X) = 10 \times \dfrac{1}{2} = 5\)
분산: \(V(X) = 10 \times \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{10}{4} = 2.5\)
표준편차: \(\sigma = \sqrt{2.5} \approx 1.58\)

7. 정규분포 (Normal Distribution) [12수I05-05]

평균 \(\mu\), 표준편차 \(\sigma\)를 가지는 연속 확률 분포입니다. 자연과 사회의 많은 현상이 정규분포를 따릅니다.

\[ X \sim N(\mu,\ \sigma^2) \]

확률밀도함수: \(f(x) = \dfrac{1}{\sqrt{2\pi}\,\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)

정규분포의 특징

표준 정규분포

\[ Z = \frac{X - \mu}{\sigma} \sim N(0, 1) \]

정규분포를 표준화하면 평균 0, 표준편차 1인 표준 정규분포로 변환됩니다.

표준 정규분포 주요 확률
🔎 이 공식은 어디서 왔나?
표준편차 공식이 나온 이유
단순히 "평균에서 얼마나 떨어졌나" 측정 시도:
편차 합 = (x₁−μ)+(x₂−μ)+… = 0 (항상 0 → 의미 없음!)
해결책 1: 절댓값 → 계산 불편
해결책 2: 제곱해서 더함 → 분산(σ²)
단위를 원래대로 복원: √분산 = 표준편차 σ = √(Σ(xᵢ−μ)²/n)
🧠 암기 포인트

평균·중앙값·최빈값: 평균=전체 합÷개수, 중앙값=정렬 후 가운데, 최빈값=가장 자주 등장

분산 vs 표준편차: 분산 = (편차)²의 평균 → 표준편차 = √분산 (단위가 원래 데이터와 같아짐)

확률 덧셈법칙: P(A∪B) = P(A) + P(B) − P(A∩B) — 겹치는 부분을 빼야 두 번 세지 않음!

출제 패턴 ★★★★☆
  • 평균·분산 계산
  • 확률 덧셈법칙
  • 조건부 확률
  • 정규분포 해석

여사건 확률(1-P)을 놓치거나, 독립사건과 배반사건의 조건을 혼동하는 것이 고빈도 오류입니다.

핵심 연습

직접 풀어봐야 기억에 남습니다. 먼저 스스로 풀어보고, 정답을 확인하세요.

8. 연습 문제

★☆☆ 기본

Q1. 자료 [6, 8, 5, 9, 7]의 평균, 중앙값, 최빈값을 구하시오.

▶ 정답 확인
평균: \(\dfrac{35}{5} = 7\)   정렬: 5,6,7,8,9 → 중앙값: 7   최빈값: 없음(모두 1회)
★★☆ 중급

Q2. 자료 [3, 5, 7, 5, 5]의 분산과 표준편차를 구하시오.

▶ 정답 확인
평균 \(\bar{x} = 5\), 편차²: 4, 0, 4, 0, 0
분산 = \(\dfrac{8}{5} = 1.6\)   표준편차 = \(\sqrt{1.6} \approx \mathbf{1.26}\)
★★☆ 중급

Q3. \(P(A) = 0.5\), \(P(B) = 0.4\), \(P(A \cap B) = 0.2\)일 때, \(P(A \cup B)\)를 구하시오.

▶ 정답 확인
\(P(A \cup B) = 0.5 + 0.4 - 0.2 = \mathbf{0.7}\)
★★☆ 중급

Q4. A와 B가 독립 사건이고 \(P(A) = 0.6\), \(P(B) = 0.5\)일 때, \(P(A \cap B)\)를 구하시오.

▶ 정답 확인
독립이면 \(P(A \cap B) = P(A) \times P(B) = 0.6 \times 0.5 = \mathbf{0.3}\)
★★★ 심화

Q5. 서로 다른 카드 5장 중 2장을 뽑을 때, 특정 카드 A가 뽑힐 확률을 구하시오.

▶ 정답 확인
A 포함 경우의 수: 나머지 4장 중 1장 = 4가지
전체 경우의 수: \(\binom{5}{2} = 10\)
\(P = \dfrac{4}{10} = \mathbf{\dfrac{2}{5}}\)
⚠ 흔한 실수

표본 표준편차와 모 표준편차 혼동 — 표본에서 편차 제곱의 평균을 구할 때 n으로 나누는지 (n−1)로 나누는지를 혼동합니다. 추정 통계에서는 불편추정량 확보를 위해 (n−1)을 사용합니다. 수식의 분모를 반드시 확인하세요.

🔗 다음으로 가는 다리

키·몸무게처럼 연속적인 데이터의 확률은 어떻게 구할까?

이산 확률은 경우의 수로 세지만, 연속 확률분포의 확률은 곡선 아래 넓이다. 이것이 미적분(적분)이 통계와 만나는 지점이다.

미적분으로 이동
🔓 이 개념을 마스터하면 해금됩니다
미적분 — 연속 확률분포·정규분포 적분 삼각함수 + 통계 — 주기성 데이터 분석

통계는 현대 데이터 과학의 기초입니다. 평균과 분산을 이해한 지금, 미적분과 결합해 정규분포·확률밀도함수까지 나아갈 준비가 됐습니다.

시험 직전 5분 체크리스트
🧠
에빙하우스 복습 권장

방금 배운 내용을 오래 기억하려면 간격을 두고 복습하세요.

내일 3일 후 7일 후 30일 후
다음 단원
미적분

변화율을 수학으로 — 미적분은 뉴턴이 물리학 문제를 풀기 위해 만든 도구입니다.

다음 단원으로
암기법 스토리

평균의 함정: 빌 게이츠가 식당에 들어오면 그 식당 손님의 "평균 자산"은 억 단위로 뛰어오릅니다. 이처럼 극단값이 있을 때는 중앙값이 더 정직한 대표값입니다.

자가진단
연습 문제

1자료 {3, 7, 5, 12, 8, 5, 2}의 평균, 중앙값, 최빈값을 구하세요.

정답 보기

평균: 42/7=6. 정렬: {2,3,5,5,7,8,12}, 중앙값: 5, 최빈값: 5

2자료 {2, 3, 4, 5, 100}에서 평균과 중앙값 중 어느 것이 대표값으로 더 적합한가요?

정답 보기

중앙값(4)이 더 적합. 극단값 100이 평균(22.8)을 크게 왜곡함

3분산과 표준편차의 차이를 설명하고, 왜 표준편차를 더 많이 쓰는지 설명하세요.

정답 보기

분산 = 편차의 제곱 평균, 표준편차 = 분산의 제곱근. 단위가 원래 데이터와 같아서 해석이 직관적

실생활
시험 팁

이상치가 있으면 중앙값을, 가장 빈번한 값이 중요하면 최빈값을 씁니다. 표준편차 = 데이터 퍼진 정도.

수학 학습 과정
10/12
다음 개념으로

통계의 평균과 분산 개념은 미적분의 적분 평균과 바로 연결됩니다

미적분은 순간의 변화율과 누적된 양을 계산하는 수학의 핵심 분야입니다

이럴 때는 다르다
이 질문, 지금 답할 수 있나요?

변화하는 양의 순간 속도를 수식으로 나타낼 수 있을까요?

미적분 배우기
기하 미적분 방정식
 📋 고등 수학 · 2022 개정 교육과정 ✓ 수학 I·II 교과서 수록 🔍 2026.04 검토 완료 오류 발견? 알려주세요
🏠 🔢수학 📖국어 📝영어 🔬과학