基于张量数据的机器学习方法近年来一直是机器学习领域的前沿课题,在错误诊断、人脸识别、入侵检测、文本分类等领域,我们经常会遇到单分类问题。以单分类支持向量机为代表的传统单分类算法使用向量作为输入数据,当输入数据为张量时有一定的局限。近年来,直接使用张量作为输入数据的机器学习算法得到了研究者的广泛关注。因此,《单分类支持张量机模型及算法研究》作者陈艳燕在查阅大量相关文献的基础上,对基于张量数据的单分类问题进行了研究,选题具有重要的理论意义和实用价值。
在错误诊断、人脸识别、入侵检测、文本分类等领域,我们经常会遇到单分类问题。以单分类支持向量机为代表的传统单分类算法使用向量作为输入数据,当输入数据为张量时有一定的局限性。近年来,直接使用张量作为输入数据的机器学习算法得到了研究者的广泛关注,并取得了一定的成果,直接使用张量作为输入数据,能够有效地保持数据的结构信息,从而能够充分利用数据所蕴含的信息以提高识别效果;同时,以张量为输入数据的相关模型和算法,可以有效地降低优化问题中待求解的决策变量个数,从而可以避免传统的向量模型在学习过程中容易出现的过拟合等问题,这使得张量算法尤其适合高维小样本问题。因此,本书主要研究基于张量理论的单分类模型和算法,研究工作包括以下几部分内容:
1.线性单分类支持张量机模型。本书第2章从2阶张量入手,给出基于2阶张量的线性单分类支持张量机模型和算法,并在公开的向量数据集上进行了实验。实验的结果说明了所提算法能够有效地提高对目标类的识别,并讨论了参数v对张量分类器的作用。第2章还讨论了将2阶张量模型推广至高阶张量模型和算法,并讨论了算法的计算复杂度。在向量数据集和张量数据集的实验中,所提算法在保证分类器性能的情况下,均能大幅提高分类器对目标类的识别。
2.线性支持张量数据描述模型,作为单分类问题的另一经典向量模型:支持向量数据描述模型,本书第3章将探讨如何将向量模型推广至张量空间模型。首先,从2阶张量的线性数据描述模型入手,将支持向量数据描述模型推广至2阶张量空间,并最终推广至高阶张量模型。模型的求解依然基于交替投影思想,并给出了计算复杂度分析和收敛性证明,数据实验采取高维小样本的向量数据集,来展示张量算法对于高维小样本数据的分类性能以及参数分析;并以人脸数据集和步态数据集来验证所提算法在张量数据集的分类性能。
3.对于非线性可分问题,与传统向量分类算法类似,核方法是一个很好的选择,关于张量核方法的研究是近年来的一个热点问题,也出现了一些张量空间的核函数,并取得了一定的理论和应用的突破,本书在第4章探讨利用2阶张量核矩阵简单、易于计算的优势,将上述两个线性单分类张量模型,推广至非线性分类问题。为了验证两个新的非线性张量算法的分类性能,并重点关注张量模型在高维小样本问题的分类性能、张量算法和向量算法在过拟合问题的表现,并最终给出将向量数据转化为张量数据的基本原则,第4章最后还分析了两种单分类张量算法的等价条件,数值实验结果也验证了在高斯核矩阵下,两种算法的分类结果是一样的。
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 单分类支持向量机的研究进展
1.2.2 支持张量机的研究进展
1.3 预备知识
1.3.1 支持向量机理论
1.3.2 单分类支持向量机
1.3.3 张量理论
第2章 基于超平面的线性单分类支持张量机
2.1 基于2阶张量的LOCSTM模型及其算法
2.1.1 基于2阶张量的LOCSTM模型
2.1.2 算法实现
2.1.3 数值实验
2.2 基于高阶张量的LOCSTM模型及其算法
2.2.1 基于高阶张量的LOCSTM模型
2.2.2 算法实现
2.2.3 数据实验
第3章 基于超球的单分类支持张量机
3.1 基于2阶张量的LSTDD模型及算法
3.1.1 基于2阶张量的LSTDD模型
3.1.2 算法实现
3.2 高阶张量的LSTDD模型及其算法
3.2.1 高阶张量的LSTDD模型
3.2.2 算法实现
3.3 数值实验
3.3.1 向量数据实验
3.3.2 张量数据实验
第4章 非线性单分类支持张量机
4.1 2阶张量核矩阵
4.2 基于超平面的非线性单分类支持张量机
4.2.1 基于超平面的非线性单分类支持张量机模型
4.2.2 算法实现
4.3 基于超球的非线性单分类支持张量机
4.3.1 基于超球的非线性单分类支持张量机模型
4.3.2 算法实现
4.4 OCSTM与STDD模型的等价条件分析
4.5 OCSTM数值实验
4.5.1 向量数据实验
4.5.2 张量数据实验
4.6 STDD数值实验
4.6.1 向量数据实验
4.6.2 张量数据实验
参考文献
后记