
资料内容:
1.2 机器学习的应用实例
本节覆盖机器学习五大核心应用场景,每个场景均提供完整可运行 Python 代码(含详细注释)、效果对比可视化(同窗口展示),并适配 matplotlib 中文显示,直接复制即可运行。
通用前置配置
所有案例均基于以下环境和前置代码,提前安装依赖:
通用导入 + 中文显示配置(每个案例均需包含):
1 # 通用导入
2 import numpy as np
3 import pandas as pd
4 import matplotlib.pyplot as plt
5 from sklearn import datasets
6 from sklearn.model_selection import train_test_split
7 from sklearn.preprocessing import StandardScaler
8 from sklearn.metrics import accuracy_score, mean_squared_error
9
10 # Matplotlib中文显示配置(解决中文乱码、负号显示问题)
11 plt.rcParams['font.sans-serif'] = ['SimHei', 'DejaVu Sans'] # 支持中文
12 plt.rcParams['axes.unicode_minus'] = False # 支持负号
13 plt.rcParams['font.family'] = 'sans-serif
1.2.1 学习关联性
核心概念
学习关联性(关联规则学习)是从海量数据中挖掘特征之间、样本之间的潜在关联关系,核心是发现 “哪些特征经常一起出现”,典型应用:电商购物篮分析(买 A 的人 80% 会买
B)、推荐系统、用户行为分析。
核心原理
最经典的算法是Apriori,核心指标:
支持度:某特征组合出现的频率,反映组合的普遍性;
置信度:在 A 出现的前提下 B 出现的概率,反映关联的可靠性;
提升度:A 出现时 B 的概率 / B 单独出现的概率,提升度 > 1 表示有效关联。