• 7.36 MB
  • 57页

流形算法及其水电机组噪声源检测

  • 57页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
硕士学位论文论文题目:流形算法及其水电机组噪声源检测作者姓名陈昱昊指导教师王万良教授、郑建炜讲师学科专业计算机应用技术所在学院计算机科学与技术学院提交日期年月日 浙江工业大学硕士学位论文流形算法及其水电机组噪声源检测作者姓名:陈旻昊指导教师:王万良教授、郑建炜讲师浙江工业大学计算机科学与技术学院年月 ManifoldLearningandItsApplicationinHydroelectricGeneratingUnitNoiseSourceDetectionCandidate:MinhaoChenAdvisor:WanliangWang,JianweiZhengCollegeofComputerScienceandTechnologyZhejiangUniversityofTechnologyOct2012 学位论文原创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。作者签名:日期二年乂月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于、保密□在年解密后适用本授权书。、不保密请在以上相应方框内打“”作者签名日期年月日导师签名曰期:刈读月曰 浙江工业大学硕士学位论文流形算法及其水电机组噪声源识别摘要小水电作为清洁的可再生能源,是国家能源发展的重点战略方向。但是目前大多数的水电站对水电机组的异常噪声和故障诊断主要采用人工判断方式,不仅速度慢而且还会影响判断的准确性,因此需要研究基于机器学习的识别方法。流形学习具有探索数据集内在规律的能力,如何将流形学习算法应用于水电机组噪声源识别中具有研究价值。本文分析了水电机组噪声信号的特点以及流形学习方法应用在水电机组噪声源识别上所面临的问题,设计了针对性的流形学习方法。主要工作如下:分析了造成水电机组异常振动的原因以及水电机组振动噪声的特点,并详细介绍水电机组振动噪声去噪方法。提出了基于分解的增量式类内局部保持降维算法。该算法是针对线性可分问题的特征降维算法,具有增量计算能力和良好的局部空间结构保持能力,能够对类内聚簇数据进行有效分类。提出基于分解的增量式核判别分析法。该算法在的基础上,引入核方法,以使其适用于水电机组这样的复杂非线性设备。由于水电机组异常振动噪声样本难以获取,导致训练初期训练样本不足而需要在线学习。算法能够有效地降低在线学习过程中核矩阵的构造开销以及核矩阵的存储空间,提升在线学习的效率。将算法应用于水电机组噪声源在线检测中。通过噪声源在线检测实验验证了在水电机组噪声源识别上的有效性。关键词:水电机组,噪声源识别,在线学习,流形学习,核方法 浙江工业大学硕士学位论文 浙江工业大学硕士学位论文目录摘要第章绪论水电机组噪声源检测的意义流形学习与故障检测流形学习的概念流形学习方法在故障检测上的研究状况流形学习在水电机组噪声源检测中的应用潜力研究内容与结构安排第章水电机组噪声源信号提取及其去噪方法水电机组噪声源噪声信号分析水电机组振动噪声信号特点分析水电机组异常振动噪声产生原因分析基于小波分析理论的去噪方法傅立叶变换小波变换小波去噪本章小结第章适于线性系统在线学习的流形学习算法研究几种代表性的流形学习算法主成分分析判别分析类内特性保持的判别分析法基于分解的线性判别分析法在线学习问题基于分解的降维算法的描述增量式类内局部保持降维算法增量式类内局部保持降维算法的描述增量式类内局部保持降维算法复杂度分析算法性能仿真实验 浙江工业大学硕士学位论文分类性能实验增量方法与其批量方法在线学习性能比较第章适于非线性系统在线学习的流形学习算法研究核空间方法研究及应用核空间理论核判别分析法基于分解的核判别分析法基于分解的增量式核判别分析法基于分解的增量式核判别分析法算法描述基于分解的增量式核判别分析法复杂度分析算法性能仿真实验分类性能实验增量方法与其批量方法在线学习性能比较第章流形学习在水电机组噪声源检测中的应用水电机组噪声源类型分析水电机组噪声源在线检测实验水电机组噪声源在线检测步骤信号构建及预处理水电机组噪声源在线检测实验小结第章总结和展望总结展望詩翅攻读学位期间的科研成果 浙江工业大学硕士学位论文第章绪论本章介绍水电机组噪声源检测的意义,并总结流形学习方法在设备故障检测上的研究状况。同时本章还分析了流形学习方法在水电机组噪声源检测上应用的可行性,并提出了流形学习方法在水电机组噪声源检测上需要解决的关键问题。最后介绍论文的总体结构和章节安排。水电机组噪声源检测的意义水能资源是我国当前具备大规模幵发条件的第二大能源和第一大可再生资源,是未来年我国能源发展的重点战略方向。小水电作为清洁的可再生能源,具有很大的公益性,也是我国新农村建设的重要内容,是国家政策扶持的“六小工程”之一。小水电站根据容量大小的不同,在不同时期的小水电概念也有所不同。我国现在采用欧洲小水电协会、欧盟委员会以及国际发电业与配电业联盟的定义:小水电是指任何规模的装机容量在以下的水电站。小水电容量虽小,但分散布点、易于开发,对小规模水利发电发挥着重要的作用。依靠小水电建设,我国建成了上千个农村电气化县,解决了多万人口的用电问题,治理了上千上万条河流,建设改造了乡村道路,同时促进了当地的工农业产业发展以及文化、教育等社会事业的进步⑴。小水电的蓬勃发展为中国特色农村电气化的建设、新农村建设和发展以及解决“三农”问题做出了极大的贡献。但是目前大多数的水电站对水电机组的异常噪声主要采用人工操表、分析判断的处理方法。当水电机组出现异常噪声时需要经过分析、推理,对各类数据做出比较和分析,除了依据现有的规则和标准外,还要凭借专家的经验对异常振动噪声源产生的部位进行推理和判断。这种方式不但速度慢,而且还会影响噪声源判断的准确性。同时,现在国内大中型水电站的控制以及检测系统以引进国外成套系统为主。然而小水电站常常因为资金、技术缺乏无法实现这一点。由于水电机组具有构造复杂,机组运行具有季节性,异常振动诱发原因多等特点,要使机组安全可靠运行,必须及时地对异常噪声源进行判别。因此对于小水电站水电机组状态的异常噪声源检测方法进行从人力到机器学习方面的改进,减少资金人力成本,提高响应速度和精度是很有必要的。丨 浙江工业大学硕士学位论文流形学习与故障检测流形学习的概念随着信息技术持续蓬勃地发展,人们获取以及存储数据的能力都大大提升了。同时,人们处理数据的类别与复杂程度也大幅度地增加。比如,在机器视觉、图像处理、计算生物学等应用中,人们获取的数据是往往具有很高的特征维度。对于这类高维数据集,通常不能直接感知其内在规律,必须借助于各种数据分析与降维方法来帮助人们更好地理解数据。在流形学习方法近几年的研究中,对于流形学习的概念范围有着不同的理解。有的研究者将线性方法、人工神经网络方法、主曲线方法和核变换方法等统称为流形学习方法。而有些研究者将流形学习特指为基于局部线性的流形学习方法本文所提及的流形学习概念均指前者,是一个笼统的范畴。线性方法是机器学习方法中最经典的方法。线性模型一般假定观测数据集具有全局线性结构,即各观测变量是独立无关的,所以可以应用全局线性的欧氏空间作为观测空间。在此假设的基础上,已经提出了众多线性方法,如主成份分析,、判别分析、独立成分分析忙八等,都获得了广泛的应用。然而,全局线性假设对于现实中的许多模型并不是总成立的,现实中的模型样本并非每个特征因素各自变化之后的线性叠加。此时,全局线性假设将不再适用,线性方法往往无法探寻到数据内部的非线性规律。局部线性的流形学习方法就是在上诉问题的背景下产生的,它是一种非线性的维数约简方法,为寻求非线性分布数据的内在结构提供了一种行之有效的解决方法。局部线性的流形学习方法从高维采样数据中获取低维的流形结构,主要目的是寻找原始数据集的内在规律,即从观测现象中去寻找现象的本质,找到嵌入在高维釆样数据空间中的低维光滑流形,并求出对应的嵌入映射,以实现维数约简或特征提取另一方面,随着核变换方法在机器学习领域中快速地发展,使得运用传统的线性方法解决非线性问题成为可能。核方法的本质是通过核函数把数据从低维的样本原始空间映射到高维特征空间,使原始空间中线性不可分的数据,在维数更高的特征空间中变得线性可分。核变换方法作为一种打破线性和非线性阻隔的方法,并不是一门新的技术,其起源于上个世纪初期发表的论文,其在模式识别领域中的应用可追溯到年。然而对于核方法的研究是在支持向量机成为研究热点之后才逐渐被重视的。借助于核方法, 浙江工业大学硕士学位论文原来线性假设下的模式识别方法可扩展到高维线性空间用于处理非线性问题。流形学习方法在故障检测上的研究状况故障检测的实质是了解并掌握设备在运行过程中的性能状态,评估、预测设备的稳定性和可靠性,发现故障噪声并对其噪声位置源以及破坏程度等信息进行判别和分析,估计故障的可能发展趋势,并针对具体情况做出相应决策。它主要包含了三个方面的内容:一是对设备运行的状态进行及时监控;二是在发现异常噪声信号后对设备的故障源进行诊断;三是对确定的故障从噪声位置源以及破坏程度进行研究并及时采取相应措施。在故障检测的过程中特征提取是最关键的一步,即发现异常噪声信号后对设备的故障源进行诊断这一环节,好的特征提取手段能够给出设备实时运作状态的精确描述,使得后续的诊断环节能够获得更好的精度和速度。因此对于故障检测方法的研究主要是对故障信号特征提取方法的研究。现有的故障检测技术主要分为二大类,一是基于解析模型的故障诊断技术,,二是基于信号处理的故障诊断技术。基于解析模型的故障诊断技术运用系统的体系结构、行为功能等方面的知识对目标系统进行分析诊断,以控制方法为理论基础,把系统或过程当作一个具有输入输出关系的动态系统来看待,依据系统的输入输出关系建立过程模型,最后对过程模型进行故障诊断但是基于解析模型的故障诊断技术由于使用了系统仿真模型,需要建立复杂庞大的模型,诊断速度慢,并且对于复杂的非线性系统很难准确地建模。同时,不同的领域的系统仿真模型千差万别,很难获取统一的模型。基于信号处理的故障诊断技术将故障信号在时域、频域或者时频域空间上进行描述,通过提取信号的各种有效特征来进行故障诊断。基于信号处理的诊断方法避免了基于解析模型的故障诊断技术建立对象系统数学模型的困难,具很强的适应性。随着流形学习方法的出现和发展,基于信号处理的故障诊断技术为解决复杂故障检测问题提供较好的解决途径。目前流形学习方法在故障检测上的技术主要可分为类:基于核函数主元分析的故障检测技术主元分析是一种经典的特征提取方法,它可以从模式的矢量空间中提取出模式特征子空间,进而获得所需要的主特征矢量。主元分析的本质是在数据空间中找出个最大可能地表示数据方差的正交矢量,以便将数据从《维原始空间中映射到由这些正交矢量组成的维子向量上,从而完成实现从《维到维的降维,其中但是由于原始输入样 浙江工业大学硕士学位论文本的变化通常会改变主元特征值的选取的结果,对于模式识别中具有复杂边界的情形会导致特征提取计算复杂。复杂系统设备运行中出现的故障往往表出非线性行为,对于这样的故障信号需要利用非线性主元分析进行分析判别。线性主元分析是由原始数据的线性组合而成,而在非线性主元分析法中,需要通过一个非线性函数将原始数据映射到非线性主元上。并且线性主元分析法使数据到它所代表的直线的距离之和最小,而非线性主元分析法则使数据到它所代表的曲线或者曲面的距离之和最小。核函数主元分析法是等人在研究支持向量分类算法时提出的一种非线性主元分析法该方法通过事先选择的某种非线性映射关系将输入数据集映射到一个高维特征空间,使得输入样本数据更具有可分性,然后在特征空间中的对映射后的数据进行线性主元分析。求取数据的线性主元相比于其他非线性主元分析,只需要求解一个矩阵特征值问题,不需要解决具体的优化问题,因此在提取数据的非线性特征上更有优势。核函数主元分析目前在计算机视觉、语音识别、文字识别等领域已经实现了很多成功的应用,但在机械设备故障检测中的应用还远远落后与理论研究水平。目前国内外将核函数主元分析法应用于故障检测技术方面已经取得了一些研究成果。比如,等人在年提出一种新的用于故障诊断的特征提取方法—发展的核,该方法是将与一种渐进提升的优化算法相结合,能够高效地从真实的机械运作数据中提取其非线性最优特征。在年,等人将核化的方法和核化的独立分量分析(用于非线性系统的故障特征映射中。等人在年将核化地独立分量分析(用于非线性过程的故障检测,当不同的独立分量的数量相同时,其特征提取效果能够达到最好。基于核函数的判别分析方法的故障检测技术线性判别分析(—是最常用的一种特征提取方法之一,在统计分析、人脸识别、数据分析中已经得到大量地应用。常用的判别准则函数有判别准则,感知判别准则,最小错分样本数判别准则,最小平方误差判别准则和最小错误率线性判别函数判别准则等。由于复杂系统设备具有非线性数据或行为以及环境噪声的干扰,使得线性判别分析对于设备故障信号的产生和演变难以识别。受到核函数主元分析研究的启发,等人根据核方法的思路将判别推广到非线性领域,即通过核函数将原始样本数据映射到高维特征空间,然后在高维特征空间运用线性判别对样本进行分类等人又在此基础上,提出了基于核的广义判别分析方法来处理线性不可分的情况。 浙江工业大学硕士学位论文基于核函数的判别分析方法在故障检测技术方面也已经取得了一些研究成果。等人在年提出了将,以及近段支持向量机(结合的方法,解决了多故障类型诊断分类问题。年,李巍华等人提出将传统的线性降维方法与核方法结合的非线性方法用于对机械故障的分类问题。祝志博等人于年将基于判别分析的特征提取、线性分类和基于支持向量数据描述的非线性核空间模式分类方法组合,构造了基于的串级和混联融合方式,克服多了多变量统计过程控制在故障分离上的缺陷。年,王广斌等人将核方法和正交向量的思想弓丨入到局部判别分析中,提出基于核的正交局部判别的流形学习方法,算法保证了数据降维时重构误差最小,提高了故障诊断效果。基于局部线性流形学习方法的故障检测技术局部线性流形学习的目的是根据观测的现象找到事物的本质,从而找到产生数据的内在规律,即从高维采样数据中恢复低维的流形结构,并求出对应的嵌入映射,以实现数据降维。局部线性流形学习不仅仅只是从数据集的几何形态的方向提出的假设,它和人类的认知方式也有着密切的关系。等于年在上发表的文章指出了人类认知模型的特点,即高维信息通常存在于一个低维流形之中,而人类的认知过程很大程度上就是依靠分析这种低维流形来对各种进行事物识别的。如果将人对外界的感知结果表示成高维空间中的数据集,那么在几何学上,这些感知输入之间的统计相关性就表现为数据点分布在一个低维光滑流形之上或者分布在低维光滑流形附近。因此流形学习和人类的认知方式有着紧密的关系。在故障检测方面,局部线性流形学习方法最初只是用于信号的降噪。如年,阳建宏等人将局部切空间变换(用于机械系统的非线性时间序列降噪克服了现有非线性降噪方法仅在局部区域内进行降噪的不足丨。但是由于局部线性流形学习在非线性维数约减方面出色的表现,使得越来越多的学者将其用于故障信号的特征提取上。年,蒋全胜等人运用基于拉普拉斯特征映射的非线性降维算法直接对原始故障信号进行学习,提取数据内在的流形特征,极大地保留了信号中内含的整体几何结构信息。年,张育林等人将改进的流形学习算法引入到数据聚类中,提出了一种结合自适应局部线性嵌入和递归调用规范融合的新方法,克服了传统方法对数据集的依赖性,并将其有效地应用在故障模式识别上。年,等人提出了一种监督的局部线性嵌入算法并将其用于故障检测中,该方法能有效提取不同故障模型嵌入在高维空间中固有的流形特征。等人于年提出了一种正交局部保持投影对旋转机械进行高准确率的故障诊断。 浙江工业大学硕士学位论文流形学习在水电机组噪声源检测中的应用潜力流形学习在水电机组噪声源检测上的应用是一个典型的模式识别问题,其本质就是水电机组异常振动噪声来源的分类识别问题】。目前,虽然故障诊断技术已获得了很大发展,在工业现场也得到了广泛应用,但是对于水电机组这样复杂的大型非线性工业设备,其运行工况受到各种因素的干扰,难以准确地识别出具体的故障原因。然而水电机组故障的产生往往会导致机组相应部位产生异常振动噪声,及时、准确地发现机组异常振动噪声源对具体的故障原因检测有重要的帮助。水电机组的振动噪声信号往往呈现出强烈的非线性以及非稳态特征,对这样的数据运用流形学习算法还存在着不少有待改进的问题。首先,常见的主成分分析和判别分析等方法对线性结构和满足高斯分布的数据有着较好的处理效果,但在处理水电机组这类复杂的非线性机械设备时,这些方法往往效果欠佳。其次,为了全面获取水电机组的状态信息,通常要通过各种监测传感器采样大量的设备状态信号数据,如振动、压力、温度等来构成海量的状态特征数据集。虽然设备的这些状态信息有利于更加准确地对设备进行诊断,但会使得在诊断过程中获得的信息数据特征维数不断增大,导致“维数灾难”问题出现。最后对于实际运行的水电机组设备的噪声源检测面临着在线学习的问题。因为实际应用场合中,一般很难一次性获得大量的设备样本,随着时间的推移会不断出现新的训练样本,而大多数的故障诊断方法都是批处理方法,需要将新获得的故障样本与原有的训练样本一起重新进行一次训练,这个过程包含太多冗余的计算,会浪费大量时间。为了解决水电机组噪声源检测面临的上述问题,需要寻求一种高效的异常噪声源诊断新方法,通过对设备状态信息学习,能从中发现潜在有用的模式和规律,进而形成并掌握相应的新的判别知识,进一步拓展诊断能力,能对未知的设备异常状态和噪声故障源做出更准确的识别。新方法同时应具备下列要求:一是具有非线性处理能力;二是能够快速有效地处理高维数据,减少海量高维数据的存储空间;三是具有增量计算的能力,以解决训练初期训练样本不足而需要在线学习的问题。流形学习具备了实现上述要求的可能性。首先,由于核方法的研究和发展,使得流形学习方法釆用线性的方式来描述非线性问题成为可能。对于复杂的非线性数据,运用核函数将其映射到高维特征空间中,学习数据集中内在的几何结构可以有效地解决这一问题。其次,流形学习具有强大的高维数据特征提取能力,能够有效解决“维数灾难”问题,且在低维空间中便于对数据进行分析。同时,从数据集的几何性质角度分析,流形学习方法能够挖掘数据空间的内在结构信息以及蕴含的几何规律,并能将提取到的特征信息应用于水 浙江工业大学硕士学位论文电机组的噪声源模式识别,为异常噪声源分类提供可靠的依据,从而为后续的噪声源分析和故障处理打下基础。最后对于在线学习问题,已经有一些增量式流形学习算法致力于解决这个问题,使得对传统批量式学习方法的增量式改进成为可能。研究内容与结构安排本文研究内容主要是针对水电机组噪声源识别问题,研究并设计了适合水电机组噪声源检测的流形学习算法。主要包括:水电机组设备异常噪声分析、振动噪声提取、小波去噪、流形学习在线学习问题研究、非线性流形学习方法研究以及水电机组噪声源检测实验。本文的主要贡献如下:深入分析流形学习算法的特点以及在线学习的要求,提出针对线性系统的增量式流形学习算法,有效应用于人脸数据库和图形数据库上。针对实际应用的复杂非线性问题,设计增量式非线性流形学习算法,同时有效地提升了流形学习算法在线学习的计算效率,并且降低了存储空间的需求,使得流形学习算法应用于水电机组噪声源检测成为可能。将改进的流形学习算法应用于水电机组噪声源检测上,为小水电站故障检测的难题提供了一个有效的选择。本文共分为章,具体文章结构安排如下:第一章是绪论,首先介绍了水电机组噪声源检测的意义,并总结流形学习方法在设备故障检测上的研究状况。然后分析了流形学习方法应用于水电机组噪声源检测上的可行性,以及需要解决的关键性问题。最后介绍论文的总体结构和章节安排。第二章主要研究水电机组噪声信号提取及去噪问题。首先分析了水电机组振动噪声信号的特点。紧接着介绍了水电机组噪声源判别的方法以及造成异常振动噪声的原因。接着针对信号去噪问题,介绍了傅立叶变化以及小波分析理论。第三章主要针对线性系统中流形学习的在线学习问题展开研究。首先介绍了具有代表性的流形学习方法、、。然后介绍了一种基于分解的特征提取方法并引进增量思想提出了基于分解的增量式判别分析法,并在人脸数据库以及图像数据上验证了算法的有效性。第四章在第三章的基础上针对线性不可分问题设计了适用于非线性系统的增量式流形学习算法—基于分解的增量式核判别分析法,同时从理论角度分析了该算法的在时间和空间复杂度上的优越性,最后在过程数据库上验证了该算法的有效性。第五章主要将基于分解的增量式核判别分析法应用于水电机组噪声源在线检测 浙江工业大学硕士学位论文上,包括了检测步骤、信号构造及去噪、实验设计以及实验结果分析等几方面内容。论文最后一章总结了本文所做的工作,指出了所提各方法的优缺点,并且探讨了将来的研究方向、预期目标等。 浙江工业大学硕士学位论文第章水电机组噪声源信号提取及其去噪方法流形学习算法是一种数据分析和降维方法,运用流形学习算法对水电机组噪声源进行识别之前最重要的一步就是对水电机组噪声信号进行有效提取以及恰当的预处理措施,为后续的数据分析做准备。振动噪声信号是水电机组这类旋转机械设备最主要的一种噪声形式,因此分析导致水电机组异常振动噪声产生的各方面因素,选择正确的信号分析方法至关重要。另一方面,实际采集的信号数据往往含有噪声、随机干扰,如果直接对这样的数据进行噪声源判别分析,识别错误的可能性会大大增加。小波变换在信号的处理上具有出色的时频局部化特性、良好的去噪能力和易于提取弱信号的优点,为水电机组振动噪声信号的去噪问题提供了一个有效的方法。水电机组噪声源噪声信号分析水电机组振动噪声信号特点分析水电机组是一种典型的旋转机械设备,其运行工况会受到机械、电气和水力等多个方面的因素影响。因此水电机组运行过程中的故障噪声类型往往具有多样性,而水电机组的振动噪声在各种噪声形式中最具有代表性。据统计,有的水电机噪声源或事故都能在其振动信号中体现出来丨。另一方面,异常的振动也经常是导致水电机组设备损坏的原因,因此对水电机组振动信号状态进行监控以及对异常振动噪声产生的源头进行分析诊断具有重要的意义。振动噪声是水电机组最常见也是最主要的噪声形式,而振动信号本身也是一般设备诊断中最常用的数据信号形式。振动噪声的特征信息往往能反映出系统或设备的整体及部分的变化规律。设备运行的异常往往会伴随着振动幅度、频率增大,振动性质改变等现象,通过对振动噪声的分析就可以在不影响设备日常使用的情况下,对故障性质有所了解,来判定噪声源头、故障原因、受损程度等。相比于其他旋转机械设备的转速,水电机组的转速明显偏低,因此水电机组故障的通常是渐变性或损耗性振动故障,而突发的恶性故障比较少,比如水轮机组因空化或泥沙磨损等外部噪声源而导致的机械振动变化】。由于水电机组振动故障的发展是一个从量变到质变的渐变过程,一般不具有突发性,因此利用流形学习方法对故障征兆分析、对导致噪声的源头进行识别、对故障趋势发展进行预估成为了可能。水电机组振动信号的监测与噪声源判别分析过程主要包括三个部分:实时监测、信号 浙江工业大学硕士学位论文分析、噪声源判别。实时监测实时监测包括测点的选择和布置、数据的采集传输。测点的选择必须选取最能反映出异常噪声导致的振动变化的检测点,即要求该检测点能够监测机组最大的振幅部位,同时对于特定的噪声源还要布置对应的检测点。有时对于能够反映机组工况的模拟环境量,也需要进行实时检测。信号分析振动分析:主要包括时域、频域、时差域以及相位分析方法等。时域分析:对指定类型的实时数据进行统计,比如振动摆度的峰峰值、均值、方差等,并显示实时数据随时间变化。频域信号分析:频域分析是以傅立叶变换(为核心的经典信号处理分析,对整周期采集的时域信号运用快速变换转换成频域信号,频域分析能够分离出信号不同频率的因素,如低频的水力因素,高频的电气因素等。有时还可以借助频谱细化技术对需要的频段进行局部分辨率放大,以提取有用的特征频率。时差域的相关分析:描述了两个量之间相关变化的情况,依次找出不同因素对振动摆度的联合影响程度,从而在一定程度上反映噪声来源。相位分析:主要指某个振动信号的相位随时间变化的情况或者不同振动测点之间的相位差。振动噪声信号的特征通常都表现在信号的频域上,因此在水电机组信号预处理中主要工作是将采样到的时域信号转换到频域上。噪声源判别噪声源判别是运用一定的判别分析法对样本信号进行处理,分析判断引起该异常振动噪声的噪声源位于水电机组设备的部位。水电机组异常振动噪声产生原因分析影响水电机组运行过程的因素有很多,会引起噪声源异常振动噪声的原因也是多方面的,大致有机械因素、水力因素、电气因素这三个主要因素。机械因素引起的振动噪声机械碰撞摩擦是直接导致旋转机械设备异常振动的原因之一,水电机组在运行过程中,由于机组转动部件质量不平衡等原因,可能导致动静件间的非常态碰撞摩擦。机械因素引发的振动噪声出现前,一般设备先出现局部摩擦现象。通常在水电机组制造和组装的 浙江工业大学硕士学位论文过程中,水轮机的转轮和发电机转子这些主要部件往往不可避免的存在质量不均、加工和组装偏差等缺陷,由于水电机是一个统一协调的整体,即使这些缺陷很微小,但在长期的高负载运作下,也会造成较大的质量偏心,导致非常态的摩擦,引起振动噪声。当机组运行时,部件质量偏心使得旋转转子会产生离心惯性力,引起机组产生振动噪声。机械因素引发的振动噪声信号往往具有丰富的频谱特征,除含有工频及工频倍频的高频成分外,还可能含有分频成分。水力因素引起的振动噪声水电机组在非预设工况下运行时,在转轮的出口处容易受到旋转水流、脱流旋祸和汽烛等水力因素的影响,这些水流导致水轮机尾水管内产生低频压力脉动,从而引起尾水管壁、转轮、压力管道等部位产生振动噪声。另一方面,由于机组结构设计、加工偏差或水流状况的变化,水轮机锅壳、转轮及尾水管等过流部件在异常水流流过时会形成水流脱流或不对称的水流作用力矩问题。此外,由于水电机组中水轮机转子转速低,而水轮机的转轮在导叶附近,对水轮机转轮的影响较大,不均勻水流冲击导叶时就会引起振动噪声,且其振动信号随机组运行的工况变化而变化当水流在机组内部经过绕流圆柱体或其它形状的部件时,由于压力场的突然变化,其受力大小和方向都随着时间周期性变化,这些变化的压力作用于水轮机的导叶叶片上,也会产生振动噪声。电气因素引起的振动噪声在周期性的不平衡磁拉力分量、定子和转子气隙的不均勻所引起的作用力或转子线圈短路时引起的不平衡力的作用下,可能会引起发电机在转子的振动噪声。这些不平衡力通常来自于水电机组的定子铁芯与定子机座组合后没有间隙,在机组运行时铁芯的温度上升速度快于机座,在热胀冷缩的作用下,铁芯产生了内应力。随着水电机组日常运停的交替,热膨胀作用会反复出现,经过长年运行以后,铁芯和机座组合面就会形成间隙。由上可知,由于水电机组的振动噪声是由机械、水力、电气三方面,甚至是多方面因素的親合作用引起的,这就导致了水电机组振动信号的复杂性和线性不可分性,但是通常不同因素所引起的振动信号频率特征不同,所以可以在信号分析阶段选择频域分析,将不同测点产生的振动信号分离,然后配合小波去噪和流形学习算法对噪声源进行判别分析。基于小波分析理论的去噪方法小波分析属于时频分析的一种,是傅里叶分析发展史上最具里程碑式意义的进展。傅里叶变换是传统的信号分析的基础,其时域分析和频域分析一般相对独立,是一种全局性的变换,要么完全在频域展开,要么完全在时域展幵,因此无法表述信号的时频局域性。 浙江工业大学硕士学位论文然而,在现实生活中大多数的信号的频率成分是随时间变化而变化的非平稳信号,如语音信号、机械设备的振动噪声信号等,为了处理非平稳信号,人们对傅里叶变换进行了很多改革,小波变换就是其中一种应用广泛的时间尺度分析方法。傅立叶变换傅立叶分析是由法国数学家在世纪初创立发展的学科,它包括傅立叶级数与傅立叶变换个主要方向。经过多年的发展,傅立叶变换分析是理论分析和工程应用领域的一种重要工具。傅里叶变换本质上是一种特殊的积分变换。它将满足约定条件的某个函数根据连续或离散情况,表示成正弦基函数的积分组合或者线性组合,即将时域信号:;的波形分解成很多不同频率的正弦波的叠加。连续傅立叶变换设函数满足傅立叶变换的条件,函数〈的连续傅立叶变化可表示为傅立叶逆变换可定义为:厂广①频域函数尸是时域函数利用正交函数族展开的系数或者权值。在频率处的大小是由如在」展开式中的大小决定的。离散傅立叶变换设给定离散时间序列,,,且该序列绝对值可以相加,则序列的离散傅立叶变换为:,序列的离散傅立叶逆变换为:吵《,,…,可以看到,傅立叶变化和其反变化就是将信号在频域和时域之间互相转化,以将信号从一种不太容易处理的形式变换成另一种易于处理的形式。快速傅立叶变换在水电机组的噪声源识别这样的实际应用中,采集到的振动信号都是离散的信号,但是由于离散傅立叶变换的计算量太大,很难实现实时的信号处理。快速傅立叶变换是 浙江工业大学硕士学位论文和与年提出的一种快速计算离散傅立叶变换的有效算法,其运算时间比传统的离散傅立叶变换减少了一到二个数量级。长度为的有限长序列尤幻离散傅立叶变换为:,其中是一个的矩阵。但是由于具有周期性,其中只有个独立值,且其中有部分的值取极简单的值,如,和正是巧妙地利用了矩阵的特性有效地减少了傅立叶变换中的乘法次数。小波变换信号分析的本质是寻找一种有效的信号变换方法,使信号所包含的主要特征能显示出来。对于平稳信号而言,各种基于傅立叶变换的信号分析方法都能取得良好的效果。但是由于水电机组的振动噪声源信号受到多方面因素以及环境、工况等外部因素的影响,其信号特征是非线性的,傅立叶变换对这样的信号是无效的。同时,实际采集的信号数据往往含有噪声、随机干扰,如果直接对这样的数据进行噪声源判别分析,识别错误的可能性会大大增加。小波变换在信号的处理上具有出色的时频局部化特性、良好的去噪能力和易于提取弱信号的优点,在研究复杂非线性问题时,有着很好的效果。设傅立叶变换满足条件:厂⑵①丨叫其中平方可积的的函数是一个基本小波或小波母函数,是对时域函数的傅立叶变换。对进行平移伸缩形成小波函数如下:—¥’笑,’称式为参数,的连续小波。则对于一个有限能量信号,其连续小波变换的定义为,从式中可以看到,对信号小波变换就是。与小波函数族的内积。虽然连续小波变便于理论分析,但在实际应用中需要把离散的小波变换化才能进行实 浙江工业大学硕士学位论文际的数值计算。一种常用的离散化方法是将尺度按幂级数进行离散化。。】,〉则有小波函数,¥最后对时间变量按幂级数进行离散化,得到离散时间小波变换:小波去噪对采集的时域信号运用离散小波变换时,使用滤波器对离散化的序列进行处理,离散小波变换的原理框图如图所示。其中为低通滤波器,为高通滤波器,输入表示原始输入信号的离散化初始序列。对;进行级分解,产生和¢两种小波系数,表示尺度下的低频离散概貌信号,《表示高频的离散细节信号。:】一“图离散小波分解图通常噪声信号部分都包含在高频中,小波去噪的过程即是对高频的离散细节信号进行非线性阈值处理。非线性小波变换阈值去噪方法的关键步骤就是如何选择阈值以及如何进行门限阈值处理,可以选择软阈值处理方法或硬阈值处理方法。由于硬阈值方法比软阈值方法处理后的信号粗糖,而水电机组检测中的振动信号需要用于后续的分析处理,因此应该选择软阈值法。软阈值法就是把含噪声信号的小波系数的绝对值与所选定的阈值碰行比较,大于阈值的点缩小成该点与阈值施差,小于阈值的系数变为,公式如下;其中;为高频小波系数,为所选定的阈值。小波去噪后,根据小波分解的第层低频系数和经过软阈值法处理后的层高频系数进行小波重构,得到原始信号估计值。恢复重建原理框图如下图所示。 浙江工业大学硕士学位论文;。丄;丄。图离散小波重构图本章小结本章主要对水电机组振动噪声信号特点以及振动信号去噪两方面展开研究。振动噪声在各种噪声形式中最具有代表性。影响水电机组运行过程的因素主要有机械因素、水力因素、电气因素这三个主要因素,因此其振动信号具有复杂性和线性不可分性的特点。小波变换是处理这类信号的有效方法,同时小波变换具有良好的去噪能力,能解决水电机组振动噪声信号去噪问题。 浙江工业大学硕士学位论文第章适于线性系统在线学习的流形学习算法研究在流形学习方法近几年的研究中,对于流形学习的概念范围有着不同的理解。本文所提及的流形学习是对线性方法、人工神经网络方法、主曲线方法和核变换方法等探究数据内在规律方法的统称【。本章分析了适于线性系统的线性学习方法以及局部线性学习方法的特性,同时针对水电机组噪声源检测中训练初期训练样本不足,需要流形学习算法具有快速在线学习能力的问题,提出了增量式类内局部保持降维算法。本章研究线性问题中的增量式流形学习算法是为下一章将算法推广到复杂的非线性系统做理论准备。几种代表性的流形学习算法主成分分析主成分分析法是模式识别中最常用的一种线性映射降维方法,该方法根据样本点在多维模式空间中的分布位置,以样本在空间中变化最大方向为目标,即将使得样本方差最大的方向作为判别矢量,来达到数据的特征提取与数据压缩的目的。而主成分就是原始数据的《个变量经线性组合变换得到的变量,这一变化使得变换后的变量方差为最大。设训练样本,,且有的均值为即其中¢为训练样本的维度,表示为维单位向量,则在上的投影为:产其中向量满足约束条件。接着寻找一个使得表达式的值最大的向量根据线性代数的理论,求取满足式的等同于求解下式的特征分解:…即使得上述式子最大化的是矩阵的最大的特征值所对应的特征向量。选择最大、〈个特征值所对应的作为特征向量构成投影矩阵,即是最佳变换投影矩阵。判别分析判别分析(,的基本思想是寻找一个最优的投影矩阵使得样本数据在投影子空间中的样本具有最大的类间距离和最小的类内距离 浙江工业大学硕士学位论文。设训练样本,,乂是对应的类别标签,其中为训练样本的维度,为训练样本总数,为类别总数。训练样本的类间散度矩阵而和类内散度矩阵定义如下:爪】其中叫是第类的训练样本总数,灘类样本的平均值,为所有训练样本的平均值。这两个散度矩阵的迹的计算方式如下:讲’公式反映了同类样本之间空间距离的接近程度,公式反映了不同类样本之间空间距离的远离程度,因此一个最佳投影矩阵声是使得最大最小的矩阵。根据如下公式计算当类内散度矩阵为非奇异矩阵时,最佳投影矩阵的列向量恰为矩阵的个最大的特征值所对应的特征向量。类内特性保持旳判别分析法训练样本为类内聚簇时,采用或方法会产生不可预期的降维结,局部保持的判别分析算法(结合了和局部保持投影的思想,使得属于不同类别的样本在构造出的特征空间内更具可分离性,能够有效地维持原始数据的局部空间结构信息,克服了、的局限性,在非高斯分布、类内分簇等数据上都具有适用性〕。类内特性保持的判别分析法(,在算法的基础上考虑了全局投影与局部保持的优劣性,相比算法能够更好地保持同类别样本之间的类内特征空间结构,在样本数据不足的情况下能达到更好的特征降维效果。保持原判别分析法的类间 浙江工业大学硕士学位论文散度矩阵不变,将类内散度矩阵的形式调整如下:将亲合因子融入类内散度矩阵,其形式改变为:平了一文人,乂”其中为亲和系数,用于调整同类样本中数据对对类内散度矩阵的作用,减少同类样本中远距离数据对对类内散度矩阵的影响力,突出近邻数据对的影响力,即保持类内特性。当’的值都为时,类内特性保持的判别将退化为传统的方法。将改变后的应用于判别准则就可求得最佳投影矩阵。亲和矩阵用于描述同类样本两两之间的空间紧密度,通常根据数据对的欧式距离来选取亲和系数的值,采用的计算方法为:丨丨丨丨、广、’其中!是可调参数,影响亲和系数為的变化速度。另一种亲和系数的取值方法是采用欧式近邻法,为样本中相近邻的个点指定对应的亲和力值,而非近邻点的亲和力值取零,凸显近邻样本对的作用。在线学习过程中,随着新的训练样本插入,空间样本近邻关系可能发生改变,但是数据对之间的欧式空间距离是不变的,而增量式计算中后一次计算的结果依赖于前一次计算的结果,所以应采用第一种亲和系数不变的取值法。基于分解的线性判别分析法在线学习问题上述的算法虽然在训练样本完备的理想条件下能取得不错的降维效果,但在实际应用中,采集一组完整且有代表性的数据经常是昂贵和费时的。在很多应用的初始阶段只有少量可供使用的样本数据,而随着时间的推移,新增样本会陆续呈现,这时就需根据新的训练数据及时更新最佳投影矩阵。但传统降维方法局限于每次训练都需对所有样本数据进行一次完整的降维操作,该过程包含很多冗余的计算,影响求取最佳投影矩阵的效率。因此,对于这种在线学习问题需要设计对应的增量式流形学习算法。基于分解的线性判别分析法算法( 浙江工业大学硕士学位论文是由等人提出的一种求取降维投影矩阵的算法该算法在对数据特征提取的过程中巧妙地运用了矩阵分解,将判别分析法中计算量较大特征分解步骤放在一个低维空间中进行,降低特征分解的规模。增量式计算方法的特点是每次一次计算都需要利用前一次计算的结果,而在降维过程中利用了一个低维空间,有利于减少矩阵规模和计算规模,因此对该方法适合进行增量式的改造来解决在线学习问题。基于分解的降维算法旳描述基于分解的降维算法是由等人提出的一种求取降维投影矩阵的算法,其利用分解将原始样本空间投影到一个使类间距离最大的低维子空间,然后以类内距离最小为目标在子空间中进一步降维,求得低维子空间的最佳投影矩阵,最后利用分解特性进一步获得原始空间最佳的降维投影矩阵。求取使得样本类间距离最大的投影矩阵等同于求解如下最优问题:、根据正交质心法(,,以上最优问题可通过对质心矩阵进行分解解决,其中为:求解式过程如下:设是一个维的矩阵,的第列为:…,為,,《。其中为第类数据的样本数量,加号左边的向量长度为,第位的值为其他位置的值为,则有:丁丁其中左及、、为质心矩阵的分解结果,’—,每一列两两正交;,是一个上三角矩阵。对于任意正交矩阵有:由此可见幻是、的上界,设为任意的正交矩阵,则根据迹的特性以及矩阵中列的两两正交性有:—因此是使得式取得上界的投影矩阵,问题从求取最优的(变成求取矩阵 浙江工业大学硕士学位论文。因为有令,则求取的问题转化为求取以矩阵忍为类间散度矩阵,矩阵为类内散度矩阵的最佳投影矩阵。在这里放宽的限制从任意正交矩阵到任意矩阵,这样做不会改变式迹的值,但不能保证本。为了解决奇异问题,采用正规化方法求取的问题就等同于求解的特征值问题,是一个大于的常量。最后根据即可求得原始空间的最佳投影矩阵。由于规模的『、的维度远小于规模的维度,因此这个特征分解问题比中的特征分解规模小很多。増量式类内局部保持降维算法增量式学习的特征提取效果依赖于上一次特征提取的效果,因此在线学习中初始训练样本较少时获得较好的特征提取效果十分重要。在节中,通过在人脸数据库以及图像数据库上的仿真实验,比较了,,,的特征提取性能,实验结果反映了在训练样本较少时相比其他几个算法有明显的优势,所以将对局部空间结构信息保持的能力结合到增量式计算中,有利于提升算法在在线学习中性能。增量式类内局部保持降维算法借鉴了基于分解的降维算法的优点,在增量学习中有效地提高更新投影矩阵的速度,减少冗余计算。同时结合算法的类内局部结构保持特性,较好地保持了原始样本空间的局部结构特征,并对类内分簇、重叠的样本都能进行有效地分类投影。增量式类内局部保持降维算法的描述由上可知,基于分解的降维算法一次降维过程主要由两部分组成,第一是对质心矩阵乍分解,第二是在低维子空间中求解一个特征方程。对于第一部分,增量式地更新矩阵是十分简单的,而对于第二部分,通常情况下类别数远小于维度因此这个方法能有效的降低求解特征值的计算规模,而且在增量式计算问题中利用低维空间保存前一次的计算结果也有助于降低内存空间的占用。由于在基于分解的降维算法的第一阶段,我们把原始空间降维到一个使得类间散度矩阵最大的低维子空间,过分强调了类间散度矩阵的作用,容易使得降维后的空间中同类数据过于聚拢重叠导致失去了类内数据对之间的局部空间结构,不利于达到好的分类效果。因此为了在增量式计算中提高其局部空间结构保持能力,弥补该算法的不足,我们釆 浙江工业大学硕士学位论文用式中具有类内局部保持特性的类内散度矩阵形式。增量式类内局部保持降维算法的算法过程是在新的数据样本插入原有样本空间后更新原有的质心矩阵,散度矩阵、,然后在一个低维空间中求取低维空间的最佳投影矩阵最后根据式(,求得原始空间的最佳投影矩阵。对于任意变量;,当新的样本数据插入后,将更新后记为更新质心矩阵设新插入的样本数据属于第类,么因此有其中巧‘。为第〖类数据的样本数量,然后对更新后的进行分解,得到更新的、注意对维度为的质心矩阵做分解,通常是一个办的方阵,是一个办矩阵,但是为了首先将样本空间降维到低维子空间,我们这里对矩阵做的分解使得为的矩阵,为的方阵。更新类内散度矩阵在数据空间中插入新数据后,与同类的数据就会和形成新的类内局部空间结构关系,而原有的同类数据对之间的空间结构关系也会产生改变,因此更新类内散度矩阵需要重新计算两部分:新插入的样本与原有同类数据之间的空间关系;调节与同类的数据对之间空间关系的影响力。更新方式如下:文文丄女—————丁记——为“其中为插入新样本之前的保局类内散度矩阵,部分反映了新样本与同类样本之间的局部空间结构对类内散度矩阵的影响,部分是由于新样本插入而对与同类的样本 浙江工业大学硕士学位论文之间的局部空间关系的调整。为与同类样本之间的亲和系数。由式可以看出以增量的方式计算类内散度矩阵,只需更新与同类样本的类内局部空间结构,不影响其他类别的类内局部空间结构,因此无需对其他类的类内空间关系重新计算。获得更新后的保局类内散度矩阵,即可得到更新后低维子空间中的类内散度矩阵:更新低维类间散度矩阵基于分解的降维算法的第一步即将原始空间投影到使得类间散度矩阵最大的低维子空间,经前面证明这个使得类间散度矩阵最大的投影矩阵就是质心矩阵经分解后的矩阵。该投影降维过程并不依赖类间散度矩阵的形式,因此我们选择直接更新低维空间中的类间散度矩阵凡而不去更新原始空间中高维的。这样低维的类间散度矩阵只需占用的空间,相比原来矩阵占用的空间显著减少哀丁其中…,为以每类样本数为值的对角阵,”…为样本总数。于是有更新后的低维类间散度矩阵「十及办“丄其中为样本总数,从上式可知,更新后的只与质心矩阵进行分解后的及矩阵以及每个类型的样本数量有关,其中及在更新矩阵时已求得,因此更新只需更新和中的与新插入样本对应类型的样本数量即可。表总结了的算法流程。增量式类内局部保持降维算法复杂度分析与其批量形式在算法性能上的差别主要体现在类内矩阵和低维类间矩阵的更新方式上,增量式方法更新的方法如公式,其时间复杂度为’批量的计算方法如公式,其时间复杂度为。其中为样本维度,《为所有训练样本的数量,为每类数据的样本个数。很明显是一个比《小很多的值,因为增量式计算中与新插入样本不同类的数据对之间的空间关系无需重复计算,比批量式方 浙江工业大学硕士学位论文法减少很大的计算量;增量式方法更新低维度类间矩阵的方法如公式,其时间复杂度为,批量式算法计算的方法如公式其时间复杂度为通常样本的维度要远大于样本的类别数,因此增量式方法在更新类间散度矩阵方面也比批量式方法具有优势。表增量式类内局部保持算法算法流程输入:质心矩阵前一次增量计算中的散度矩阵、每类样本的数量新插入的样本输出:最佳投影矩阵¢更新质心矩阵对进行分解,得到、更新类内散度矩阵更新低维类内散度矩阵:?一更新低维类间散度矩阵:舍一先」卜—计算低维最佳投影矩阵■抓叩‘计算更新后的最佳投影矩阵算法性能仿真实验分类性能实验本实验采用人脸数据库和图像数据库测试算法的降维性能,选用欧式近邻法作为分类算法,并与经典的降维算法、以及具有局部保持特性的降维算法、比较。人脸数据库有个不同年龄、不同性别和不同种族的对象,每个对象幅图像共计幅灰度图像组成。数据库共有个类别的物体图像,每个图像都包括具有不同旋转角度的个样本。图、是降维维度不同时几种算法在人脸数据库和图像数据库上的降维性能比较。对于人脸数据库,我们进行组实验,每组实验的样本分别降维到、、、维,从每类样本数据中选取个共个作为训练样本,重复次该实验,取次结果的平均值作为最后结果。通过交叉验证法确定亲和系数中参数为。对于图像数据库,我们同样进行组实验,每组实验的样本分别降维到、、、维,从每类样本数据中选取个共个作为训练样本。同样通过交叉验证法确定亲和参数为。图、是训练样本数不同时几种算法在人脸数据库和图像数据库上 浙江工业大学硕士学位论文的降维性能比较。对于人脸数据库,每组实验中每类数据的训练样本分别是、、、个,降维维度为。对于图像数据库,每组实验中每类数据的训练样本分别是、、、个,降维维度为其他实验方法和参数选择都与图、的实验相同。从图中可以看出,当每类数据的训练样本数量为、个时,类内局部保持算法比局部保持算法有更低的识别错误率,而每类数据的训练样本数量为、个时算法和算法的识别错误率几乎相当。同样,从图中可以看出对于数据库,较之算法也有更低的识别错误率。因此算法比算法在训练样本数量较少时有着更好的局部特征保持效果,而在在线学习的过程中,后一次投影矩阵计算结果依赖于前一次的增量式计算结果,选取在较少训练样本下识别正确率高的降维算法,能够更好地在之后的增量式计算过程中保持分类降维效果。所以选择在的基础上进行增量式的改造。——一■‘■运届降维维度降维维度图不同降维维度图不同降维维度—“■■■■—每类样本量每类样本量图不同训练样本数图不同训练样本数为了实现增量式更新目标的同时减少时间和空间的幵销,选择在低维空间中求取特征值,牺牲了一定的有效特征信息,但从图、中可以看出,的识别率错误率接近以及这些具有局部保持特性的降维算法的识别率,而且相比和有着识别性能上的明显优势,表明了其在特征降维上的有效性。 浙江工业大学硕士学位论文增量方法与其批量方法在线学习性能比较这一部分将增量式类内局部保持算法和其批量形式的算法进行识别效率和时间开销两方面的比较。对于人脸数据库,选取个训练样本作为首次训练样本,每类有个样本;接着随机选取个数据作为增量插入的训练样本,每类有个样本,将剩下的个样本作为测试数据。每插入个样本(每类插入一个新样本,一共类),记录一次识别率和时间花费,实验重复次,取次的平均值作为最终结果。实验结果如图、(所示。对于数据库,选取个样本作为首次训练样本,每类有个样本,然后随机选取个样本作为新增的训练样本,每个类别有个,将余下的个样本作为测试数据。每插入个样本,记录一次识别率和时间花费。实验结果如图、(所示。增量乂、■一批量式—!°云■一—增量式批量式:、■样本总量样本总量图识别性能比较图时间开销比较—‘—‘——‘—‘—‘—■丨丨——■—■—‘一“增量式。批量式卜::。々〇增量样本总量样本总量图识别性能比较图时间开销比较从图、(中可以看出,和它的批量形式有着同样的识别正确率,这证明了算法在增量式计算过程中对样本空间特性的有效保持,没有在逐次更新的过程中相比进行完整降维计算的批量式方法损失更多的信息。另一方面,从图、中可以看出随着新插入的样本数量增多,算法的时间开销一直维持在一个较低水平,而批量式方法每次计算投影矩阵的时间花费快速递增。表、(记录了插入新的训练样本后计算投影矩阵所增加的时间开销,从中可以看出每次插入新的样本,批量式方法比增量式方法要增加更多的时间开销。比如在数据库上,当训练样本数量从增加到时, 浙江工业大学硕士学位论文更新投影矩阵的时间比前一次增加了秒,而其批量式方法的时间开销增加了秒。随着训练规模的增大,两者时间花费增量速度的差距也越来越大,因此在处理在线学习的问题时有着极大的优势,随着更多新样本的插入这种速度上的优势越来越显著。表时间开销增加(秒)样本变化————增量式批量式表时间开销增加(秒)样本变化———————增量式批量式小结本章首先主要介绍了、、、等流形学习方法并研究分析了其优劣特性。为了解决水电机组噪声源检测中训练初期训练样本不足的问题,要求流形学习算法具有快速在线学习的能力,本章在的基础上提出了增量式的局部保持的线性判别分析法,在人脸数据库以及图形数据库上的实验表明其特征提取和增量计算有有效性。 浙江工业大学硕士学位论文第章适于非线性系统在线学习的流形学习算法研究第章针对线性系统提出了增量式的流形学习算法在的算法设计中体现出增量式计算方法在减少冗余计算上的优势。由于水电机组设备是一种复杂的非线性系统,因此需要研究针对非线性系统的增量流形学习方法。核方法是一种有效的非线性数据处理技术,但是在在线学习过程中,传统批量方法需反复构造核矩阵,效率低下。本章在上一章的基础上设计了一种能够有效降低核矩阵构造开销的增量式核判别分析法,使得流形学习方法在水电机组噪声源识别上的应用成为可能。核空间方法研究及应用核空间理论核方法是连接线性到非线性的一种有效桥梁,统计学习理论以及支持向量机的提出,使核方法引起了人们广泛的关注。核方法研究在非线性特征提取、模式分类泛化能力等方面的优良性能表现也引起机器学习领域的关注,成为当前研究的热点。核方法可以看作是一系列的非线性数据处理技术的统称,这些非线性数据处理技术共同特征是在数据处理过程中都应用了核映射。核方法首先利用非线性映射将数据由原始空间映射到高维特征空间,然后在高维空间进行相应的线性数据处理。根据模式可分性理论,在原始空间中线性不可分的数据在更高维的空间将会变得线性可分。核这一概念就是高效的非线性数据映射算法,通过选定核函数的非线性映射,原始空间中数据可以映射到任意高维特征空间中。设代表输入数据,’为原始输入空间,在此空间中线性不可分,通过寻找一个合适的非线性映射函数,可以将原始空间数据映射到一个高维特征空间,使得中的数据集变得线性可分。可以是任意维度的高维空间,而这个非线性映射函数¢即使核函数。通过核函数不必知道非线性变换的具体表达式,只需利用核函数内积运算替代即可。根据核方法的原理,设计合适的核方法有两个关键问题:一是如何选择核函数、设计核函数以及合适的相关参数。二是在特征空间中采用何种学习算法。采用不同的学习算法可能匹配不同的核函数,构成不同的核方法。核判别分析法核判别分析法是线性判别分析法的核方法改造。设¢¢是原始输入空间 浙江工业大学硕士学位论文到某个高维特征空间的非线性映射,要在中找到线性判别则需最大化这里,和是中相应的散度矩阵,艮口:“其中¢为了将数据映射到高维特征空间,需要得到只以输入数据的点积形式表示、的表达式,然后用合适的核函数来替代点积运算,其中任何必位于所有数据在空间中的张集,因此可有的一个展开式,利用展开和,并用核函数代表点积,于是有,其中似》广利用的定义式和式,重写式中的分子,其中利用式及式中类似的变换,替换式中的分母有,其中足是第类的核矩阵足丄尤,,,《,所,是单位矩阵,是所有元素为的矩阵。把式和代入式可得到特征空间的线性判别,即最大化如下判别准则 浙江工业大学硕士学位论文丁因为要从个样本数据中估计维的协方差结构,而高维特征空间的维数高于训练样本数目因此需要利用正则化技巧解决矩阵非适定问题。正则化技巧是给加上一个单位阵的倍数或分数,用矩阵代替矩阵则有,基于分解的核判别分析法基于分解的核判别分析法首先以核空间中类间散度矩阵最大为目标,将和;映射到一个低维空间。设映射将数据从原始空间映射到更高维的核空间中,记位于高维空间中的原始样本为于是有核空间中的质心矩阵为:;¢于是有,其中为对质心矩阵进行分解后的矩阵。它。,五是一个的矩阵,其第列为:…其中为样本类别数,为第类样本的样本个数,为样本总数。对于任意正交矩阵有:⑷由此可见〖左)是、的上界,根据迹的特性以及矩阵中列的两两正交性有可以看到当矩阵取时,因此可以以作为投影矩阵将和映射到一个以类间散度矩阵最大为目标的低维空间,则有低维空间的类间散度矩阵和低维空间总体散度矩阵广设矩阵,,贝丨有其中是一个《矩阵,其第列为长度《的向量丄,…,丄,,、设为核矩阵,其中¢ 浙江工业大学硕士学位论文于是有对于核空间中的类间散度矩阵;有,其中的第列为…”,了—」,于是有,丁、丁、其中为对进行分解的矩阵,可以通过对进行分解得到。同样的,对于总体散度矩阵有其中丄于是有:对广特征分解得到个特征向量。设;,于是最终的投影矩阵(?可以按如下公式计算:广对于一个给定的样本,其进行投影降维后有¢厂及■—其中。基于分解的増量式核判别分析法基于分解的增量式核判别分析法算法描述对于在线学习问题,传统降维方法局限于每次训练都需对所有样本数据进行一次完整的降维操作,该过程包含很多冗余的计算,影响求取最佳投影矩阵的效率。增量计算的思想是直接根据新的样本,对前一次的降维结果进行更新。根据公式和可以看到,矩阵、都是的矩阵,而;和都是的矩阵,是样本在核空间中的维度,一般远大于。在增量式训练过程中,反复的更新和是费时的,因此在增量式方法中我们选择直接在低维空间中对矩阵忍“、进行更新。算法过程就是在新的数据样本插入原有样本空间后采用更高效的方法更新核矩阵:以及低维空间中的类间散度矩阵和总体散度矩阵。我们约定对于任意 浙江工业大学硕士学位论文变量当新的样本数据插入后,将更新后的记为。更新类间散度矩阵根据公式有?及,我们选择直接更新其中左分部分,而不是重新构造核矩阵。记“》为,对于矩阵有,‘¢丄¢)“产;丄⑶…可以看到是一个的矩阵,设为矩阵中的第行第列的对应项,则为第类样本与第类样本核关系的和。设新插入的样本数据属于第类,么随着新的样本数据到来,原始样本空间结构产生了种改变:一是原始空间中的样本与新的样本形成新的核空间关系二是影响了第类样本的类内空间结构。因此求取更新后的包括个步骤:更新中非类样本与类样本的核关系¢其中;女,且更新中类样本的类内关系¢¢⑷由公式、(可以看到和是前一次增量计算的结果,更新需要重新计算的部分只有新插入的样本与原始样本之间的核空间关系,避免了大量的重复计算。同时根据公式,对运用丫分解即可求得更新后的及更新总体散度矩阵根据公式有左『及,其中£丄、同样地我们也选择直接更新对于有: 浙江工业大学硕士学位论文丄…丄!…丄是一个《矩阵,其中为第个样本与第类样本核关系的和。因此随着新的样本到来,矩阵也产生了种改变:一是每个样本与类样本的核空间关系;二是插入代表新样本与每类样本核空间关系的向量。更新每个样本与?类样本的核关系根据公式,需要更新中的,对。)‘‘严插入代表新样本核空间关系向量计算新样本与每类样本的核关系,并插入矩阵中,则有:…,了¢;……可以看到更新后的是一个…的矩阵,插入的向量¢即为样本与每类样本的核空间关系。通常在方法中构造核矩阵计算量非常大,在从公式、(中可以看到,算法只需要在第一次计算投影矩阵是构造完整的核矩阵,在之后的增量计算中只需更新个规模小得多的矩阵,而且在第一次计算中训练样本数较少,需要构造的核矩阵规模并不大。表总结了的算法流程。基于分解的增量式核判别分析法复杂度分析与在算法性能上的差距主要体现在更新核矩阵的方式上,直接构造核矩阵后再计算矩阵以及矩阵了其算法复杂度为,其中为样本类别数,《为样本总数。直接根据新样本调整矩阵以及矩阵其算法复杂度为。因为增量式计算中与新插入样本不同类的数据对之间的核空间关系无需重复计算,比批量式方法减少很多的计算。对于空间复杂度要存储完整的核矩阵尼需要一个的矩阵。而 浙江工业大学硕士学位论文需要存储矩阵—以及矩阵,需要一个的矩阵。通常样本总数《要远大于样本的类别数,因此增量式方法减少存储空间方面比批量式方法也更有优势。表增量式核判别分析算法算法流程输入:前一次增量计算中的矩阵,每类样本的数量《新插入的样本输出:最佳投影矩阵更新矩阵更新矩阵?更新低维类间散度矩阵更新矩阵更新低维总体散度矩阵丨丁计算低维最佳投影矩阵。:了‘叩丨』计算更新后的最佳投影矩阵算法性能仿真实验过程模拟器是由化学公司开发的一实际工业过程的仿真平台。近年来过程数据被广泛应用于检验各种故障识别与诊断方法的有效性,是目前国际上通用的标准仿真模型。过程包括个主要操作单元、类气体进料、个气液放热反应生成的类主产品、个衍生放热反应生成类副产品等,其过程的机理复杂、变量较多,并且包括了阶跃、随机变化、慢漂移、粘滞和恒定位置等多种数据故障类型。。过程的仿真数据可以从下载得到。仿真数据包括组不同类别的故障数据,每组故障数据包含个样本和种故障测量值,构成的数据集。在仿真实验中,首先利用小波变换软阈值法对样本数据进行小波去噪,这里采用三层小波分解,并将小波重构后的信号作为原始样本输入算法。分类性能实验分类性能实验选择算法以及算法在不同数量的训练数据下比较特征提取效果,以反映在线学习问题中训练样本数量的变化对算法性能的影响。从每类样本中选择、、个样本,作为组实验的训练样本,并选择每类,共个样本作为测试数据。核函数分别选用高斯核函数以及多项式核函数。经过基于交叉验证的网格搜索方法确定核参数选择,为,为。选用欧式近邻法作为分类算法,每组实验各进行次,取平均值作为结果。实验结果如图,(所示。 浙江工业大学硕士学位论文■■■‘“■丨■。。■每类训练样本数每类训练样本数图高斯核分类性能实验结果图多项式核分类性能实验结果从图,(中可以看到,对于种不同的核函数,相比都有着更好的降维效果。随着训练样本的增多,的降维效果慢慢接近,但是在训练样本较少时的优势明显。这一优势特别适用于在线学习中初始训练样本较少的情况,由于本章提出的每一次更新投影矩阵的计算都建立在前一次计算的效果上,初始的训练效果会影响到后续的增量结果,所以适合增量化。增量方法与其批量方法在线学习性能比较在线学习问题的特点是初始训练数据较少,随着训练过程的进行会有新的样本到来,因此我们从每类样本中选取个,共个作为初始训练样本,同时选取每类个样本,共个作为待插入样本。核函数选择高斯核函数,其他数值都和前一个实验一致,将个样本依次插入训练样本,实验结果如图,(所示。—增量式增量式批量式‘——批量式::。°‘训练样本数训练样本数图特征提取效果比较图训练时间比较从图中可以看到,增量式算法相比批量式算法有着相近的识别正确率,这证明了算法在非线性系统在线学习过程中对样本空间特性的有效保持,没有在逐次更新的过程中相比进行完整降维计算的批量式方法损失更多的信息。另一方面,从图中可以看出随着新插入的样本数量增多,算法的时间开销一直维持在一个较低水平,而批量式方法每次计算投影矩阵的时间花费快速递增,并且随着 浙江工业大学硕士学位论文训练样本的增加,增量式方法在速度上的优势越来越显著。为了更好反映出在计算效率上的优越性,表记录了插入新的训练样本后训练时间开销的变化。可以看到,当插入个样本时,两者训练时间的差距只有秒,而当插入个样本时,者训练时间的差距达到了秒。表过程训练时间变化表样本数量式一石——飞量式小结本章首先介绍了核空间方法、核判别分析法以及基于分解的核判别分析法,并且分析了其特性。接着以减少核矩阵构造开销以及引入增量式计算方法为目标,提出了基于分解的增量式核判别分析法,在过程上的实验表明了该算法的有效性,使得流形学习算法在水电机组噪声检测上的应用成为可能。 浙江工业大学硕士学位论文第章流形学习在水电机组噪声源检测中的应用水电机组噪声源类型分析引起水电机组运行过程异常振动噪声的因素主要有机械因素、水力因素和电气因素三个主要因素。水电机组结构复杂,诱发振动异常的振动噪声源很多,但在实际应用过程中,只有几种噪声源最易发生异常振动,为了更好地展现流形学习算法在水电机组噪声源检测中的应用的过程,反映其应用的有效性,这里选择了上诉三个主要因素引起的具有代表性的噪声源作为检测目标。由水力因素引起的振动噪声源主要有:因幵口不均、转轮叶片断裂导致的导叶和轮叶噪声源;因低频偏心祸带产生的尾水管噪声源;因转轮叶片出水边后水流漩祸造成的水力噪声源。由机械因素引起的振动噪声源主要有:因转动部分质量不平衡、轴线不对中引起的机械缺陷转子噪声源;因轴承间隙过大等造成的轴承噪声源。由电气因素引起的振动噪声源主要有:因发电机转子不圆、机座合缝处铁芯间隙大导致的电气缺陷转子噪声源;定子铁芯松动、不平衡负载等引起的定子噪声源。表记录了水电机组常见的异常振动噪声源部位及分类编码。表水电机组常见的振动噪声源及编码區声源部位分类编码导叶和轮叶噪声源尾水管噪声源水力噪声源机械缺陷转子噪声源轴承噪声源。电气缺陷转子噪声源定子噪声源水电机组噪声源在线检测实验流形学习在水电机组噪声源检测上的应用是一个典型的模式识别问题,其本质就是水电机组异常振动噪声来源的分类识别问题。应用于水电机组噪声源检测的流形学习算法需要具备非线性处理能力,同时能够快速有效地处理高维数据,减少海量高维数据的存储空间,并且需要具备增量计算的能力,以解决训练初期训练样本不足而需要在线学习的问题。本文第四章提出的基于分解的增量式核判别分析法有效地解决了这三个问 浙江工业大学硕士学位论文题,适用与水电机组噪声源在线检测上。水电机组噪声源在线检测步骤水电机组噪声源在线检测的流程图如下:采集振动信号初始振动信号采集数据预处理数据预处理厂数据■阵数据特征提取噪声源分类判别结果输出图水电机组噪声源在线检测的流程图水电机组噪声源在线检测基本步骤:初始信号采集:在水电机组噪声源检测中,需要在水电机组对应位置上布置振动传感器采集振动信号,把某个时段所采集的信号预处理后即能构成一个样本对象。初始信号釆集需要采集一组能够比较全面反映不同噪声源振动异常的样本对象。把釆集的初始信号作为输入样本输入来计算最佳的特征提取规则,这也是水电机组噪声源在线检测中唯一一次需要进行完整流形计算的批量式计算过程,之后有新的样本到来时,只需使用增量式地计算更新最佳降维投影矩阵即可。数据预处理:振动信号的特征通常都表现在信号的频域上,数据预处理阶段需要对传感器采集的时域信号进行小波去噪,时频域转换以及提取适当频率上的幅值构成一个输入样本对象。数据特征提取以及噪声源分类判别:运用计算最佳投影矩阵,根据投影矩阵对样本对象进行特征降维以得到最能反映数据本质的特征,并用于噪声源分类判别。噪声源分类判别运用选定的分类方法,对异常振动数据所属的噪声源部位类型进行判别分析后输出结果。 浙江工业大学硕士学位论文信号构建及预处理水电机组运行工况复杂,受环境干扰大,在现有实验条件下全面、有效的噪声源异常振动样本难以获取。因此,本文根据水电机组运行特性,以及经采样分析得到的各个噪声源的频谱特性,构建一组水电机组异常振动仿真信号。不同噪声源的异常振动,是由不同的因素引起的,其振动信号的频谱特征表现是不同的,如机械缺陷引起转子噪声源振动频率往往是转频和转频的倍数,而电器缺陷引起的转子噪声源振动具有转频振动和高频振动根据各个噪声源的振动特性,设定每类噪声源的典型频率特性,经归一化处理后如下表:表水电机组噪声源典型频率特性一噪声源编码设定一台转子正常工频为的水电机组,则其倍频为,而半倍频为。根据表,第类噪声源的频率成分占,和的频率成分各占,则第类噪声源的振动信号表达式为£其中表示振动信号的总能量,为一组高斯白噪声。设定传感器每个工作周期采样次,将每个工作周期的振动传感器测量数据作为一个采样单位就得到一个由个采样点构成的样本。第类噪声源的一个振动信号样本的时域图如下图所示。时间(秒)图传感器釆集一个釆样单位振动信号 浙江工业大学硕士学位论文图是构建的一个采样单位的振动信号。对该信号运用小波变化去噪,根据多次实验比较,这里采用层小波分解,小波基选用。小波分解后得到一组低频信号成分和组高频信号成分。如图所示,其中第一行是低频信号成分,其余三行是高频信号成分。!——■图小波分解信号对层高频成分运用节介绍的软阈值方法进行处理,选取每层小波幅值的均值作为每层阈值软阈值处理后的效果如下图。!■‘—“‘‘“““图小波高频信号软阈值处理对低频成分和层高频成分进行小波重构得到图的信号。该信号即是对图中信号去噪后的结果,是原始无噪声信号的一个近似估计。最后运用傅立叶变换将图的时域信号转换到图的频域信号,因为傅里叶变换后的幅值频率图是完全中轴对称的,因此其频域为。 浙江工业大学硕士学位论文—一时间(秒)图小波去噪后一个采样单位振动信号频率(图经傅立叶变换后的频域信号虽然如图中的频域信号包含了个特征点,但是由于像水电机组这样的转动机械设备的异常振动通常不会表现在所有的频率上,而是体现在工频的分数倍频和整数倍频上,不需要将所有频率上的幅值都作为特征值。因此对于每个信号单位,选用,,…,共个点的采样值,构成一个维的样本作为一个输入算法的原始样本数据。水电机组噪声源在线检测实验由于在水电机的实际运作中,能够获得有效的水电机组异常振动数据是有限的,因此为了测试样本较少情况下算法的有效性我们只构建每类个样本的数据集。运用节中的方法构建噪声源异常振动信号数据集,其中包括类噪声源,每类数据包含个样本,每个样本含有个测量数据,构成的数据集。本文将数据集的一半共个作为训练样本,另一半作为测试样本。由于实验受设备使用的限制,不能在实际的水电机组上进行在线检测实验。因此将训练样本数据分成个部分,初始训练数据由每类个样本构成,剩余的每类个样本作为后续依次到来的训练数据来模拟在线学习及噪声检测过 浙江工业大学硕士学位论文程。将算法用于振动信号数据集上,同时和、、算法进行特征提取性能和计算效率两方面的比较。在核函数方面,本实验选择径向基核函数,经过基于交叉验证的网格搜索方法,选定径向基函数宽度战。实验重复进行次,取平均值作为最终结果。图为噪声源识别实验结果,图为在线检测中训练时间变化结果。————〇土厂未—命丄种齋“如〇〇〇〇〇〇〇()遂卞。〇〇〇一°—〇〇〇〇〇°〇〇〇‘训练样本数图水电机组噪声源识别结果———〇一口;::一十一一丄卜十—十、〇屉忘苹辛命七训练样本数图水电机组噪声源识别训练时间变化 浙江工业大学硕士学位论文由于与基于同一个理论,从图中可以看到它们的识别正确率相当,且高于以及这些经典的基于核方法的非线性判别分析法。当训练样本数量增加时,的识别率逐渐接近于。由于实验条件的限制,不能完全精准地表现出算法在水电机组噪声源识别上的性能,但是通过这个实验已经能够反映出在水电机组噪声源别上有效性以及流形学习算法在水电机组噪声源别上的应用可能性。从图中可以看出增量式的的算法时间开销远低于其它种批量式方法,同时由于引入了增量计算的思想,的计算开销受训练样本数量的增加影响较少。在本次实验中由于样本数较少,其计算时间几乎不变,但是另外个批量方法的计算时间随样本增加而增加的趋势明显。表给出了、、、在水电机组噪声源在线检测中的具体的训练时间幵销变化。表水电机组噪声源识别训练时间比较训练样本数—“在存储空间方面,最大需要一个的核矩阵存储空间,而其他三种方法最大都需要的核矩阵存储空间。在实际应用中,随着机组的常年运行,能够得到的训练样本总数远大于实验中的数量,因此能有效减少水电机组噪声源在线检测中存储空间开销。小结本章将得出的算法应用于水电机组噪声源在线检测上,并且与个批量的流形学习算法进行比较。实验结果表明有效地解决水电机组噪声源识别面临的大问题:复杂的线性不可分问题;样本难以获取而需要在线学习的问题;在线学习中的时空开销过大,影响识别性能的问题。相比其他个流形学习算法在时间复杂度和空间复杂度方面都有很大的优势,在水电机组噪声源检测上具有实际应用价值。 浙江工业大学硕士学位论文第章总结和展望总结由于水电机组构造复杂,机组运行具有季节性,异常振动诱发原因多等特点,要使机组安全可靠运行,必须及时地对故障噪声源进行判别。流形学习在水电机组噪声源检测上的应用是一个典型的模式识别问题,其本质就是水电机组异常振动噪声来源的分类识别问题。因此本文的的主要研究内容是分析水电机组噪声源振动信号的特点,设计适用于水电机组噪声源检测的流形学习方法。本文主要的研究成果总结如下:提出基于分解的增量式类内局部保持降维算法。该算法是针对线性问题而提出的,具有增量计算能力和良好的局部空间结构保持能力,能够对类内聚簇数据进行有效分类。仿真结果表明该算法在线性问题的在线学习过程中具有优秀的表现。提出基于分解的增量式核判别分析法。该算法在的基础上引入了核方法,以使其适用于水电机组这样的复杂非线性设备。算法能够有效地降低在线学习过程中核矩阵的构造幵销以及核矩阵的存储空间。仿真结果表明算法能有效地应用于非线性过程的在线学习中。将算法应用于水电机组噪声源在线检测中。由于水电机组是复杂的非线性设备,应用于其上的流形学习算法应具备下列要求:一是具有非线性处理能力;二是能够快速有效地处理高维数据,减少海量高维数据旳存储空间;三是具有增量计算的能力,以解决训练初期训练样本不足而需要在线学习问题。有效的解决了这个问题,使得流形学习算法在水电机组噪声源识别的应用成为可能。展望本文研究内容是流形学习算法及其水电机组噪声源检测,然而正如文中所述,水电机组是一个复杂的非线性工业设备,并且不同的水电机组具有不同的特性,相同的水电机组也会由于工况、环境、组装差异等因素影响而造成流形学习算法在其上应用的效果不佳。因此将流形学习算法在水电机组噪声源上的应用提升到系统级别,实现通用化的产品,还有一定的距离。另一方面,水电机组作为大型机械设备,其故障类型繁多,因此本文对于流形算法在水电机组上的应用仅限于对异常振动噪声产生的源头进行判别,而无法到达对 浙江工业大学硕士学位论文具体故障进行识别的程度。对于这些问题,今后可以从以下几个方面展开研究:水电机组振动噪声信号提取方法的研究。虽然小波去噪方法能够有效的对信号进行去噪处理,但是水电机组运行的工况复杂,且受到的环境干扰剧烈,针对不同的信号小波去噪的分解程度,阈值的选择都有所不同,因此对水电机组振动噪声信号的提取是一项很重要的研究,关系到之后算法识别的性能。建立具有实际意义的水电机组常见故障数据库。目前由于受到各种条件的限制,使得水电机组故障样本很难获取,难以建立系统的故障数据库,这样就导致可靠的仿真实验难以展开,这使得针于水电机组故障识别的研究不能很广泛的展开,使没有条件的学者很难参与进来。流形学习的研究成果虽然已经有很多,并且现在也有越来越多的流形算法研究是针对水电机组这样复杂的非线性工业设备展开的,但是相比流形算法在其他领域的研究还是相差很大。本文提出的算法是有监督的算法,但是实际应用中往往存在不可预知的故障样本,如何针对水电机组的特点设计无监督的算法也是一个需要深入研究的问题。流形学习方法在水电机组噪声源识别上的应用距离系统级别还有相当的距离,在实际应用场合,由于数据量庞大复杂,对于流形学习的训练要求会更好。今后的研究重点应该是如何提升流形算法的算法时间和空间效率,使得流形学习方法具有更高的实用性。 浙江工业大学硕士学位论文参考文献罗云霞,周慕逊,江振东,陈永宝基于改进遗传算法的串联小水电群优化调度水电自动化与大坝监测,朝晖,杨贤,毕亚雄水电机组数字化及其工程应用电力系统自动化,,王自强,钱旭,孔敏流形学习算法综述计算机工程与应用李波基于流形学习的特征提取方法,中国科技大学,王海清,宋执环,王慧过程监测方法的故障检测行为分析化工学报,,范自立,李凡长一种选择标注分层流形学习算法模式识别与人工智能,汪洪桥,蔡艳宁,孙富舂多尺度核方法的自适应序列学习及应用,模式识别与人工智能,许洁,胡寿松,申忠宇基于改进多尺度核主元分析的化工过程故障检测与诊断方法研究仪器仪表学报祝志博,宋执环融合样本分类的故障检测新算法,控制与决策蒋全胜基于流形学习的机械故障诊断理论与方法研究东南大学,张贤达,保铮非平稳信号分析与处理,北京:国防工业出版社,,赵立杰,王纲,李元非线性主元分析故障检测和诊断方法及应用,信息与控制, 浙江工业大学硕士学位论文林琳,王树勋,陈建基于可区分性加权的模糊核说话人识别,电子学报,,,余冰,金连甫,陈平利用标准化进行人脸识别计算机辅助设计与图形学学,,,,,李巍华,史铁林,杨叔子基于非线性判别分析的故障分类方法研究几振动工程学报,祝志博,宋执环故障分离一种基的模式分类算法化工学报,王广斌,刘义伦,黄良沛基于核正交局部判别的转子故障诊断,仪器仪表学报,惠康华,肖柏华,王春恒基于自适应近邻参数的局部线性嵌入,模式识别与人工智能阳建宏,徐金梧,杨德斌,黎敏基于主流形识别的非线性时间序列降噪方法及其在故障诊断中的应用,机械工程学报,蒋全胜,贾民平,胡建中,许飞云一种基于流形学习的故障模式识别方法年第九届全国振动理论及应用学术会议论文集,张育林,庄健,王娜,王孙安一种自适应局部线性嵌入与普聚类融合的故障诊断方法,西安交通大学学报陈遗志,周建中,常黎水电机组振动监测与故障诊断系统研究电力系统及其自动佬学报, 浙江工业大学硕士学位论文,,张敬斋,神经网络在水轮发电机故障诊断中的应用计算机仿真邹敏,周建中,刘忠基于支持向量机的水电相组故障诊断,中国农村水利水电陈铁华,陈启卷模糊聚类分析在水电机组振动故障诊断中的应用,中国电机工程学报,张双全,袁晓辉水电机组在线监测技术与故障诊断专家系统水力发电,向秀桥现代智能计算及其在水电机组故障诊断中的应用,华中科技大学,张梅军,何世平,谭华徐文明小波分析在信号预处理中的应用研究,振动、测试与诊断,姜绍俊小波变换在轴承故障诊断中的研究与应用大连交通大学,,肖应旺,基于小波变换核主元分析和多支持向量机的过程监控小型微型计算机系统,沈毅基于小波阈值降噪和经验模态分解的高光谱图像分类算法,宇航学报李志红水电机组振动信号去除高频噪声技术综述,大电机技术,。,,程承,潘泉,王申龙基于压缩感知理论的陀螺仪信号降噪研究,仪器仪表学报,牟少敏核方法的研究及其应用,北京交通大学,,鹿卫国,戴亚平,高峰一种基于概率分布估计的水电机组故障预警方法,中国电机工程学报, 浙江工业大学硕士学位论文致谢时光飞逝,光阴荏苒,马上就要告别研究生生活,回首这段往事,心中感慨万分。这其中,包含有苦乐、悲喜及得失,这两年多的研究的生活,将成为我人生中一段非常重要的回忆,一段光辉而又充满意义的经历。在学习和生活中,与周围的朋友和计算应用技术班的同学形成的纯洁友谊,以及对追求真理的学术精神将永远铭记于心!对支持、关心,给以我无私帮助的亲人、导师、同学和朋友致以最诚挚的谢意和最衷心的祝愿!在研究生生活即将结束之时,我要特别感谢我的两位导师:王万良教授和郑建炜讲师。王老师在学习生活上对我们给予无微不至的关怀,帮我解决工作生活上困难,让我安心钻研学术。本课题的选题和撰写工作是在郑老师的悉心指导下完成的,在论文的每一阶段都倾注着郑老师的孜孜不倦的教诲,在此表示深深的感谢。同时两位老师的渊博学识,认真严谨的治学态度,科学的研究方法和创新精神,勤奋的工作作风和崇高的人格,都深深地影响了我,使我在这两年多来的学习和工作中受益匪浅。这两年来,陪伴我的还有实验室的各个师兄弟妹们王翊、吴昌、濮约庆、杨经炜、陈青丽、李川、马亲、金亦挺、王雨晨、黄凯、陈宇、陈秋迪、邱虹、杨丹、陈琼、郑舒天等。在平时的学术研究中,我们一起探讨学术难题,寻求解决方案。在学习生活上他们提供热心的帮助,帮我解决了许多困难,使我的学位论文顺利完成。感谢浙江工业大学计算机学院的各位领导老师,给我提供了良好的学习和生活环境,并且在背后默默无闻的工作,给予我巨大的支持和帮助,让我顺利度过了许多难关。最后,我要在此衷心地感谢我的父母。感谢他们多年来对我的关心、爱护,感谢他们对我的养育之恩,感谢他们对我的支持。谨以此文献给所有关心、支持我的老师、亲人和朋友们。没有你们,就没有今天的我,谢谢你们。 浙江工业大学硕士学位论文攻读学位期间的科研成果录用和发表的论文王万良,陈旻昊郑建炜黄琼芳一种增量式类内局部保持降维算法计算机科学(己发表)