LASSO(L1 正则化)
嵌入式特征选择是将特征选择过程与学习器训练过程融为一体,两者在同一优化过程中完成。
给定数据集
简单的线性回归模型优化目标为
当样本特征很多,而样本数较少,容易过拟合,为缓解此问题,引入正则化项,正则化参数
范数正则化,LASSO(Least Absolute Shrinkage and Selection Operator): 范数正则化,岭回归(ridge regression):
从图中可以看出,采用
正则化求解
令
若
再考虑正则化项,于是进一步的梯度下降迭代为
Python code
1 | from sklearn.linear_model import LassoCV |
https://scikit-learn.org/stable/modules/linear_model.html#lasso