关于我们
![]() ![]() |
基于信息度量的高维数据特征选择模型和方法
高维数据特征选择是数据挖掘的重要组成部分,可广泛应用于生物信息学、统计学及图像处理等领域。有效选择信息特征可显著提高学习精度和结果的可解释性。为提高分类精度,许多现有特征选择方法通过去除数据中的冗余和不相关特征来识别信息特征。由于特征维数随数据规模的增大而增加,易出现维数灾难和过拟合问题;数据高维性不仅增加算法的时间和空间复杂度,也会降低算法的求解精度。针对高维数据特征选择所存在的问题,本书通过引入互信息、联合互信息、条件互信息等信息度量,设计合理有效的特征选择模型和方法来降低数据维度、保留数据的重要特征。本书主要包括自适应结构稀疏回归模型、多项式自适应稀疏组Lasso模型、最大相关性和最小监督冗余准则、加权广义组Lasso模型等内容。
你还可能感兴趣
我要评论
|