📊 概率与统计完全讲解
为什么要学?
统计学帮助我们从数据中找到真相,从医学研究到选举预测都离不开统计。
直觉理解
统计是从数据中寻找真相的过程。平均值受极端值影响很大,中位数往往更能反映真实情况。不要只看平均值。
常见误解
误解: 平均值总是最好的代表值。
事实: 当数据有极端值时,中位数更具代表性。根据数据特征选择合适的统计量。
学习前必须了解
- 基础计算
- 分数·比例
1. 数据的代表值
- 平均数:所有数据之和除以数据个数
\(\bar{x} = \dfrac{x_1 + x_2 + \cdots + x_n}{n}\) - 中位数:将数据从小到大排列,位于中间的数(偶数个时取中间两数的平均值)
- 众数:出现次数最多的数据
例题:数据 3, 7, 5, 7, 2, 8,求平均数、中位数和众数
排序:2, 3, 5, 7, 7, 8
平均数:(3+7+5+7+2+8)/6 = 32/6 ≈ 5.3
中位数:(5+7)/2 = 6
众数:7(出现2次)
2. 方差与标准差 高考
衡量数据的离散程度(波动大小)。
\[ S^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2 \quad \text{(方差)}\]
\[ S = \sqrt{S^2} \quad \text{(标准差)}\]
方差越小,数据越集中;方差越大,数据越分散。
3. 概率 高考
\[ P(A) = \frac{\text{事件A的有利结果数}}{\text{所有可能结果总数}} \]
- 概率范围:0 ≤ P(A) ≤ 1
- 必然事件:P = 1;不可能事件:P = 0
- 互补事件:P(A) + P(Ā) = 1
- 独立事件的乘法:P(A且B) = P(A) × P(B)
❌ 常见错误 — 独立事件与互斥事件混淆
不能同时发生的两个事件(互斥)一定是独立的
互斥事件(P(A∩B)=0)实际上是相关的 — 知道A发生,就能断定B未发生
独立:P(A|B) = P(A)。互斥:P(A|B) = 0。两者含义完全相反。
4. 排列与组合
- 排列(顺序有关):\(A_n^m = \dfrac{n!}{(n-m)!}\)
- 组合(顺序无关):\(C_n^m = \dfrac{n!}{m!(n-m)!}\)
例题:从5人中选3人参加比赛,有多少种选法?
\(C_5^3 = \dfrac{5!}{3! \times 2!} = \dfrac{120}{6 \times 2} = 10\)(种)
5. 练习题
- 数据:4, 6, 8, 6, 10,求平均数、中位数、众数
- 掷一枚骰子,求出现3的概率
- 从4本不同的书中选2本,有多少种选法?
答案
- 平均数 = 34/5 = 6.8;中位数 = 6;众数 = 6
- P = 1/6
- C(4,2) = 4!/(2!×2!) = 6(种)
🔓 掌握本概念后将解锁
统计是数据科学和科学推理的基础。掌握均值、方差和概率之后,结合微积分便能进阶到正态分布、概率密度函数等高级内容。
考前5分钟检查清单
- 方差=偏差²的均值 / 标准差=√方差
- P(A∪B)=P(A)+P(B)−P(A∩B)
- 独立事件:P(A∩B)=P(A)×P(B)
- 均值对异常值敏感·中位数更稳健
艾宾浩斯遗忘曲线复习建议
通过间隔重复,将刚学的内容牢固地存入长期记忆。
明天
3天后
1周后
1个月后