特征选择及其常用算法

一、特征选择及其常用算法（论文文献综述）

万琳,夏树进,朱毅,吕泽华^[1]（2021）在《一种改进的基于信息熵的半监督特征选择算法》文中认为随着数据量的爆炸式增长和数据维度的不断增加,如何从这些数据中快速地分析和挖掘出有用信息,是传统机器学习算法面临的巨大挑战。由于高维数据存在大量冗余信息,极大地降低了模型的预测性能和精度,因此降维就变成了数据预处理过程中十分重要的一个步骤。在研究了基于信息熵的半监督特征选择算法（Semi-supervised Feature Selection based on Entropy, SFSE）后,针对其时间复杂度较高的问题,文章优化了特征选择的过程,通过判断其信息熵的增加量是否大于给定阈值决定是否将其加入特征子集,并判断是否从特征子集中剔除该特征,降低了时间复杂度。实验结果表明,改进的SFSE算法能够在实现数据降维的同时提高算法的性能。

张涛^[2]（2021）在《基于中红外光谱的润滑油添加剂种类识别与酸值测定方法研究》文中进行了进一步梳理众所周知,机械设备在相对运动的接触表面必然伴随着摩擦磨损,若没有针对性的减小摩擦力的方法,那么机器的寿命则会十分的短暂。时代发展下,润滑油工艺技术越发完整,加之添加剂的广泛应用,润滑油成为一类重要的产品。简单来说,润滑油的工作机理就是润滑剂牢固地黏附在设备摩擦副的两个摩擦面上,从而使得两个摩擦面被分隔开,并形成一层油膜,该油膜和机件的摩擦面强力接合,两个摩擦面因此被分开。这样的工作机理就成功的将设备之间的摩擦转移到润滑油本身的分子之间,从而起到减摩降磨的作用。设备润滑是设备维护的关键一环。无论是油变质或是油减少都会加大设备的磨损。在此背景下,设备润滑的重要性不言而喻。润滑油是由基础油和添加剂两部分组成。基础油是润滑油的主要部分,决定着润滑油的基本性质;添加剂是润滑油的精髓,与基础油配伍后,可改善和提高其物化性能。所以添加剂中富含表征润滑油主要性能的信息,同时它也是保障润滑油的质量关键。为满足不同设备对于润滑油的不同要求,需在基础油中加入不同的添加剂以实现不同的功能。添加剂的种类不仅决定了油品的分类,也决定了油品的性能。如何科学地测试其性能,具有重要意义。另外,在诸多实际应用的过程中发现,润滑油的理化性能指标也能表征润滑油的性能及油品的质量状态。如总酸值、总碱值等理化指标,它们与润滑油的化学组成之间呈线性关系。在用设备润滑油的油液监测技术通过定期分析在用润滑油的成分和性能指标变化,可以提前预测油液污染和异常磨损。它不仅能及时掌握润滑油的使用状况,确认润滑油是否符合要求,是否能正常使用,而且能起到中介作用,间接获取机械设备的磨损情况,提前发现问题,及时解决问题,减少机械故障,降低维修成本,提高设备的使用寿命。因此,设备润滑油添加剂的定性分析以及理化性能指标的无损且快速的测试工作具有非常重要的理论意义和实际意义。本文针对上述问题从润滑油性能的快速测试作为抓手分别研究了两部分的内容,大致工作如下:1.关于近类别机械设备润滑油中微小量添加剂多种类识别问题,研究了几种经典分类算法,包括一对多支持向量机（OVR SVMs）、决策树（DT）、梯度提升树（GBDT）和随机森林（RF）,嵌入麻雀遗传搜索算法（GA-SSA）优选中红外光谱特征波段技术,建立多类别分类模型的构建方法。2.对于理化指标的快速测试方法研究,考虑到酸值可以表征润滑油的老化质量,且当酸值超过2时,油品将不能继续使用,所以本文以风电机组齿轮油作为实例分析对象,寻找可以快速测定风电机组在用齿轮油的总酸值的无损方法。同样也采用一些经典的回归算法,决策树、支持向量回归机等结合多种特征选择方法,建立风力发电机齿轮油中红外光谱数据与总酸值含量指标之间的回归预测模型,从而实现直接把油品预处理后的中红外光谱数据导入到模型中就可输出对应的酸值预测值。实例测试结果显示:OVR SVMs和GBDT嵌入GA-SSA优选技术后的新模型对微小量添加剂的识别率达到100%,可同步识别八种添加剂含量不同的润滑油。在酸值指标测定的方法研究中,L1稀疏表示结合决策树DT所建模型表现良好,决定系数达到1。以上结果证明了本文所研究方法的可行性。

师诗^[3]（2021）在《基于深度自编码神经网络的滚动轴承故障诊断方法研究》文中研究指明随着工业化的快速发展,保证机械特别是大型旋转机械的正常有序运行,对工业生产和生活起着至关重要的作用。滚动轴承是许多大型旋转机械的关键部件,旋转机械的长期安全运行与滚动轴承的稳定性密切相关。因此,研究针对于滚动轴承的故障诊断方法具有十分重要的意义。大数据时代以来,传统的故障诊断方法需要大量的人工处理过程,已经无法顺应大数据时代的发展要求。由于可以从原始数据中自动提取特征的优势,深度学习在机械故障诊断领域得到了越来越多的青睐。然而,深度学习暴露出参数选择困难、训练困难以及训练时间长的问题,因此很难训练出泛化性好、精度高的深度学习模型。为了解决这些问题,本文提出了一种基于改进的深度堆栈自编码神经网络（DSAE）的故障诊断模型。为了对DSAE网络模型的超参数设置对模型性能的影响进行研究,本文构建了振动仿真信号对网络中各类超参数设置了对比实验,通过学习率、训练时间以及误差收敛曲线等对性能进行了衡量。并针对DSAE网络对大样本的需要,而传统的时频预处理方法处理时间较长的问题,提出了一种新的数据预处理方案,其可以在较短时间内提取数据的复合信息。确定了基于DSAE的故障诊断模型基本框架。神经网络的性能在很大程度上取决于它的模型结构和相应的学习优化算法。针对深度自编码神经网络（DSAE）在微调过程中受内部协变量迁移导致梯度传递缓慢问题,基于批量归一化（BN）算法在DSAE网络微调阶段加入自适应平衡处理层对编码层的输入进行正则化处理,以自适应地纠正特征空间以提升训练效果。在DSAE网络中,针对基于梯度算法的固定学习率导致网络参数更新缓慢且适应度不够的问题,本文对比了各个基于梯度的优化算法,选定有自适应学习率的Adam算法对网络进行学习。并针对Adam算法中矩估计的指数衰减速率的设定问题,用自适应机制对Adam算法进行了改进,使得此新增超参数可以实现自适应变化。然后用改进的Adam算法优化了BN-DSAE网络的权重分布。为检验所提方法的有效性,在MATLAB平台上分别将改进的BN-DSAE网络、改进带自适应机制的Adam算法以及最终提出的BN-DSBAE故障诊断框架在电机滚动轴承数据集上进行了验证,并与DSAE以及常见的学习分类算法BP以及SVM进行对比,实验结果验证了所提方法在分类准确度以及损失值方面均使得DSAE网络有效的提升,经过优化后的DSAE框架也优于其它深度学习方法和传统的机器学习方法。

范春丽^[4]（2020）在《基于语义空间的英语作文切题分析模型研究》文中研究说明随着近年来我国英语考试的改革,作为主观题型的英语作文自动批改一直是研究的热点和难点,英语作文自动批改系统不仅能减轻大量英语作文给英语教师带来的批改负担和压力,同时,也能更为客观科学的对英语作文内容进行评分。目前国内外英语作文的切题分析方法主要分为有监督的英语作文切题分析方法和无监督的英语作文切题分析方法,有监督的英语作文切题分析方法需要参考范文或人工标注数据,不适用于大量英语作文批改。而当前无监督的英语作文切题分析方法主要是通过分布式向量表示直接计算作文的语义相似度进而判断作文的切题程度,无法避免非主题词所带来的噪声干扰,同时也缺乏对英语作文内容潜在的主题语义分析以及显着切题特征的分析等。对于二语学习者而言,作文内容是评估作文的最重要指标,其中相关实验研究结果表明,文章切题性,主题连贯性,观点倾向性这三个特征变量对中国学生英语作文内容综合质量解释的差异达到了56%。因此,研究开发无监督的英语作文切题分析模型能有效提高英语批改系统的可信度和鲁棒性,具有重要的意义。本课题基于中国学生的英语作文,设计了一种无监督的基于语义空间的英语作文切题分析模型。该模型通过构建层次主题树混合语义空间,并结合作文切题分析模块中本文提出的切题分析算法、主题连贯算法以及主题观点算法对英语作文内容和结构进行细致的切题分析,抽取英语作文的切题句子以及主题不连贯句子,并通过英语作文切题质量分析模块生成英语作文的切题质量评分。为了实现上述研究目标,本文的研究工作如下:（1）构建关系三元组层次主题树模型分析英语作文潜在主题并进行主题聚类,然后通过词嵌入模型Word2Vec生成主题关系三元组分布式语义空间,并基于知识库扩展主题语义空间,实现层次主题树混合语义空间的主题关系三元组分布式向量表示。（2）构建作文切题分析模块并提出三种算法:切题分析算法,主题连贯算法和主题观点算法,以英语作文中的关系三元组作为载体从句子级别扩展到篇章级别分析英语作文内容的潜在主题特征,主题连贯性及主题观点挖掘。（3）构建英语作文切题质量分析模块,通过计算句子级别、段落级别以及全文的主题语义相似度,主题连贯性及主题观点情感倾向语义关联度,并对三个部分进行加权得到英语作文切题质量评分。（4）通过以上步骤构建了一种无监督的基于语义空间的英语作文切题分析模型,并在不同的英语作文测试集中进行实验。实验结果表明,本文模型相较于目前的无监督英语作文切题分析方法具有更高的准确性和实用价值。

李铃睿,杜博,陈创^[5]（2020）在《人工智能在甲状腺癌精准化诊疗中的研究进展》文中研究说明甲状腺癌近年来呈高发趋势,需要精确的信息为患者提供高效的个体化服务。人工智能（artificial intelligence,AI）与医学的深度结合有助于提高医疗决策的智能化和精准化。本文结合目前研究主要探讨AI在甲状腺癌精准化诊疗中的研究进展,阐述了AI的概念和发展,以及精准化在甲状腺癌诊治中的意义;重点探讨AI在甲状腺癌诊断和预后预测方面的应用潜力,详细分析了超声、病理学诊断和基于传统病理参数、基因变异通路模型预后评估的机遇和挑战;对未来甲状腺癌AI研究做出展望。本文为应用AI技术进行关键信息的提取以期指导个体化治疗奠定基础。

李悦^[6]（2020）在《银行信用卡客户交易分期意愿问题的研究》文中研究表明近年来,随着经济进入新常态,消费金融蓬勃发展,新兴金融产品市场前景广阔,加之人们生活水平和消费理念的提高和变化,银行信用卡分期消费成为时下流行的消费方式。对于庞大的信用卡持卡人群体来说,有效的锁定对信用卡分期业务有需求的顾客,会很大程度上提高该项业务的业绩营销效率。而数据分析、机器学习将成为寻找该类客户的重要工具。本文以银行客户的信用卡信息为案例数据,从客户信息、信用卡信息和交易信息三个方面对数据做特征描述性分析,从定性角度对特征进行粗分类,再利用WOE（Weight of Evidence）编码和IV（information value）信息值进行特征构建和选择。在此基础之上使用决策树和集成学习算法以及最优参数选择方法,建立单一模型,并使用评价指标比较得出最优模型。对最优模型结合不平衡数据处理方法,即过采样和欠采样方法,对模型加以改进,从而得到更加有效的结果,从大量信用卡客户中找出有意愿采取分期消费的顾客,对这些客户进行专项营销,降低人力物力成本,提高营销成功率和市场竞争力。

高原^[7]（2020）在《基于多尺度多层次特征的半监督点云分类算法》文中研究说明激光雷达扫描（Light Detection and Ranging,LIDAR）是通过航空摄影测量遥感手段,实现对城市场景数据的有效复制。在实景三维城市建设与规划、位置导航、虚拟现实服务中充当重要的角色。LiDAR点云数据的处理及深加工是工程应用及科学研究的前提条件,近几年成为地理信息科学领域的一个重要研究方向。LiDAR数据分类处理的难点在于:一方面,城市场景LiDAR点云数据中包含丰富而复杂的数据特征、不同的形状、复杂的结构、相互遮挡,造成较大的数据丢失;另一方面,激光雷达扫描仪远离城市目标特征,像汽车、行人等,在扫描过程中处于运动状态,造成所获取的LiDAR点密度不均匀、存在漏洞。本论文目的是通过融合激光点云数据的多尺度、多层次点集特征来构建一种对地物具有较高、较稳定区分度的特征参数,采用人工智能方式进行点云数据分类算法的研究。在该算法研究中将所获取的点云数据分成四类:地面点、植被、建筑物和小汽车。首先,对所获取的数据进行航带拼接、系统误差改正及去噪,去除影响点云数据后处理的因素,再对预处理的数据进行点云滤波,将地面点和非地面点有效分离开来。然后,使用非地面点数据集作为研究对象,利用地物实体本身点云数据特点及空间范围上的差异,构建多尺度点集特征,并基于自然指数函数阈值将点云聚合为多层次点集,联合稀疏编码和潜狄利克雷分布提取多层次点集中各个点集的形状特征;最后,选用合适的人工智能算法分类器,利用不同场景环境下的三维空间信息数据进行分类算法试验。实验结果表明,该分类算法分类精度高,处理速度快,噪声影响小,可以有效解决复杂城市场景点云数据分类难的问题,在人工智能LiDAR数据分类领域具有重要意义。

岳嘉颖^[8]（2019）在《辐射源指纹特征提取技术与分类器设计研究》文中进行了进一步梳理无论是军事应用中的敌我识别、身份判定还是民用中的无线电频谱管理、设备故障诊断、网络准入身份确认等,对辐射源进行个体识别都具有重要意义。辐射源个体因其硬件差异等会对发射信号产生无意调制,通过分析接收信号,可提取出反映个体身份的信号特征,这些特征具有唯一性、稳定性、细微性和不可欺骗性,因此成为目前研究的热点。本文依据训练样本标注情况,从监督条件下单一类特征提取、联合特征提取以及半监督条件下神经网络分类器设计三个方面,分别考虑指纹的正确识别率、稳健性、普适性以及新场景等因素,研究辐射源个体识别的关键技术。主要工作如下:1.为了提高指纹正确识别率和普适性,在双谱的基础上,针对其特征维度高以及选择双谱等传统降维方法只保留双谱局部信息、忽略整体信息的问题,提出了一种基于灰度共生矩阵的纹理特征提取算法。首先计算信号双谱得到双谱图,然后采用灰度共生矩阵提取图像纹理特征,构成16维的特征向量,最后采用支持向量机分类器完成个体识别。仿真结果表明,相比选择双谱或Hilbert谱图纹理特征,本算法识别正确率更高;同时当目标个数以及调制方式改变时,本算法适应性更好。2.考虑指纹稳健性、普适性的因素,针对单一类特征易漂移的问题,提出了基于信号复杂度和熵的联合特征提取算法。首先计算信号的瞬时幅度、频率和相位,然后分别计算其盒维数、信息维数、信息熵,其次算法提出提取包络谱信息熵,最后将10个特征作为联合特征来识别辐射源个体。仿真结果表明,相比单一特征,联合特征方差更大,分散度更高,且以微弱的时间代价换取了精度的提高;当信号信噪比、调制方式改变时,联合特征性能更优。3.借鉴领域自适应实现源任务到目标任务的迁移思想,针对目标域和源域分布对齐困难以及决策平面附近经常生成目标域特征导致分类模糊的问题,提出了一种基于分类器差异最大化的分类器设计方法。算法利用已有标记数据库作为源域,待检测的未标记样本作为目标域。首先将双谱作为原始特征输入两个独立的CNN分类器。其次根据两个分类器对目标域样本的输出差异,以最小-最大优化方法实现特征生成器与分类器对抗学习。最后在对抗学习的过程中实现领域自适应,即不断重复地检测远离源域分布边界的目标域样本以及生成源域分布边界附近的目标域特征。实测结果表明,无论是识别新出现的设备还是不同时间段采集的用户信号,都有较好的迁移效果。

杨晨^[9]（2019）在《Web服务器样本不平衡的入侵检测反向选择算法》文中认为互联网发展迅速,网站增多,Web服务器的安全性愈发重要,因而对Web服务器进行入侵检测迫在眉睫。本文将构建基于误用的入侵检测算法,检测入侵行为并定位类型,做出合适的防御行为,减少入侵造成的损失。基于误用的入侵检测算法的重要功能是解决多类不平衡问题。多类不平衡样本要求分类算法能够同时处理数据量大的样本和数据量小的样本,且受不平衡比影响较小。现有该领域的分类算法均有各自的优缺点:部分机器学习算法如神经网络需要大量训练数据,处理负类样本效果差,有些算法如决策树则受类间不平衡影响较大。反向选择算法借鉴生物体胸腺T细胞阴性选择过程,通过学习自我样本的特点来区分非我样本。因其单类学习的特点,受不平衡比的影响较小,处理数据量小时有极佳的准确率,处理数据量大的样本也不会出现性能问题。但多类不平衡问题也会为反向选择算法带来检测器数量分配问题,同时要求反向选择算法能够更好地拟合边界样本,从而实现更高的检测效率。受不平衡样本处理方式的启发,本文尝试将反向选择算法用于构建Web服务器入侵检测中的误用检测算法,并进一步构建针对不平衡样本的反向选择算法以提高检测效率。首先总结入侵检测领域的特点与研究现状,分析现有方法存在的缺点。并介绍人工免疫系统及其中的反向选择算法,指出反向选择算法用于此问题的优势,并分析需要改进的地方。接着将反向选择算法用于处理不平衡问题,并提出优化方法。提出借鉴不平衡样本中代价敏感的思想,使用MetaCost方法,为反向选择算法中不同类别指定误分代价,结合先验概率,调整检测器在类间不同的分配,使检测器的数量分配更加合理,从而提高检测效率。再结合已有的克隆选择思想优化检测器分布,提高检测器对样本空间的覆盖,降低检测器重合。再提出结合Borderline-SMOTE中边界界定的方式,找出边界“危险”样本点生成检测器拟合边界,提高检测器对样本的覆盖从而提高检测准确率。最后使用KDD99网络入侵检测数据集作为实验数据集,通过设计对比实验,使用多类不平衡样本的评价指标F-Measure、G-Mean和ROC曲线及AUC值对算法进行评价,证明反向选择算法比其他经典算法更适合用于解决服务器入侵检测中的多类不平衡,而提出的代价敏感的改进方式与边界界定的方式均能够有效提高反向选择算法用于多类不平衡样本的分类效率,而综合代价敏感、边界界定和克隆选择优化的算法则拥有最高的分类效率。

任康^[10]（2018）在《大数据方法在压力管道风险分析中的应用》文中提出本文为解决定量RBI方法在风险分析中所需数据种类繁多和分析周期过长的问题,通过对某石化常减压装置的压力管道进行研究,提出了用大数据方法分析压力管道风险,介绍了基于风险的检验技术并计算出了全部压力管道的风险,构建了压力管道腐蚀速率、失效可能性和失效后果预测模型并确定了影响模型重要性的变量数据,并将模型预测结果与定量RBI技术计算出的风险结果进行了验证。本文主要工作如下:1、提出压力管道大数据分析架构模型,包括数据生成、数据理解、数据处理、数据分析、模型评估和发布模型六个部分。对数据处理和数据分析方法进行了介绍,通过研究分析发现可以使用神经网络算法、C5.0算法和CHAID算法去构建压力管道腐蚀速率、失效可能性和失效后果模型。2、对使用定量RBI方法计算压力管道风险的过程进行了说明,详细阐述了构成风险的失效可能性和失效后果的各因子,并对计算风险分析结果十分重要的腐蚀速率进行了介绍。用PCMS软件的RBI模块对某石化常减压装置的全部压力管道进行了风险分析,得到了风险矩阵图,生成了用大数据方法分析压力管道风险的数据。3、针对在压力管道的风险分析过程中腐蚀速率的重要性,区别于专家建议和实测腐蚀速率,提出通过大数据去预测腐蚀速率来确定较高风险压力管道的新方法。使用主成分分析方法提取影响压力管道腐蚀速率的4个因子,对各因子重要性和代表变量进行了分析,给出了 4个因子的方程。使用BP神经网络算法构建了预测压力管道腐蚀速率的大数据模型,对模型中各因子重要性进行了探讨,并对比了验证集中高腐蚀速率管道,得到了不错的预测效果。4、对常减压装置压力管道定量RBI分析后产生的数据进行数据理解,确定输入变量数据和目标变量。对压力管道数据进行标准变换,再使用相关性分析的方法进行数据精简,分别筛选出与压力管道失效可能性和失效后果关系最大的变量数据。分别使用C5.0算法和CHAID算法构建了压力管道失效可能性和失效后果模型,得到了参与模型构建的变量和其重要性。并将大数据方法得到的风险和定量RBI方法计算出的风险进行了比对验证,结果表明模型取得了不错的准确性和很高的可信度。

二、特征选择及其常用算法（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、特征选择及其常用算法（论文提纲范文）

（2）基于中红外光谱的润滑油添加剂种类识别与酸值测定方法研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文研究内容及主要贡献

第2章理论基础

2.1 润滑油基础知识

2.2 中红外光谱分析技术

2.3 光谱数据预处理方法

第3章经典分类算法种类识别模型

3.1 设备润滑油中红外光谱数据获取

3.2 构建润滑油添加剂种类识别模型

3.2.1 min-max标准归一化

3.2.2 PCA主成分分析

3.2.3 经典分类算法的润滑油添加剂种类识别模型设计

3.2.4 嵌入GA优选光谱特征波段的新模型构建

3.2.5 SSA二次筛选GA所选特征谱区内的特征波长

3.3 各分类识别模型实例测试

3.3.1 原始光谱数据预处理

3.3.2 测试结果

3.3.3 测试结果综合对比与分析

3.4 结论

第4章风电机组在用齿轮油酸值测定

4.1 实验部分

4.1.1 实验方法

4.1.2 建模及评价方法

4.2 实例建模分析

4.2.1 光谱数据预处理

4.2.2 特征选择

4.2.3 齿轮油酸值测定模型

4.3 结果与讨论

4.3.1 数据预处理结果

4.3.2 特征选择结果

4.4 测试结果

4.5 综合分析

第5章基于润滑油理化指标数据库的设计

5.1 润滑油管理系统数据库的建立

5.2 润滑油管理系统窗体的建立

5.3 本章小结

第6章结论与展望

6.1 结论

6.2 展望

参考文献

致谢

（3）基于深度自编码神经网络的滚动轴承故障诊断方法研究（论文提纲范文）

致谢

摘要

ABSTRACT

1 绪论

1.1 课题研究背景及研究意义

1.2 滚动轴承故障诊断技术发展现状

1.2.1 滚动轴承基本结构及运行机理分析

1.2.2 滚动轴承典型故障振动信号特征

1.2.3 滚动轴承传统故障诊断方法研究现状

1.3 深度学习概述及研究现状

1.3.1 深度学习发展及基本模型

1.3.2 深度学习在故障诊断中的应用

1.3.3 深度自编码神经网络存在的问题

1.4 本文主要研究工作及结构安排

2 深度自编码神经网络原理及相关工作基础

2.1 自动编码器

2.1.1 自动编码器的基本结构

2.1.2 自动编码器的训练

2.1.3 稀疏约束

2.2 深度堆栈自编码神经网络

2.2.1 贪心逐层无监督预训练

2.2.2 有监督的全局微调

2.2.3 深度堆栈自编码神经网络模型

2.3 分类器训练

2.4 仿真信号的构建

2.5 深度自编码网络的特征提取性能研究

2.5.1 基于DSAE的数据重构性能研究

2.5.2 常用特征提取方法

2.5.3 基于DSAE的特征提取性能对比分析

2.5.4 DSAE网络特征提取可视化

2.6 本章小结

3 基于DSAE的故障诊断模型及其关键参数研究

3.1 基于DSAE的故障诊断模型

3.2 数据预处理方案设计

3.3 网络参数研究

3.3.1 隐层节点数

3.3.2 隐层层数

3.3.3 迭代次数

3.4 正则化参数研究

3.5 优化参数研究

3.5.1 小批量梯度下降算法

3.5.2 动量算法

3.5.3 Adam算法

3.6 本章小结

4 基于DSAE故障诊断模型的优化研究

4.1 基于自适应机制的Adam优化算法研究

4.1.1 自适应机制原理

4.1.2 改进的自适应学习率的Adam算法

4.1.3 AEDR-Adam优化算法的仿真分析

4.2 自适应平衡标准化优化算法

4.2.1 批量标准化

4.2.2 带自适应平衡层的DAE

4.2.3 BN-DSAE模型的仿真分析

4.3 基于改进算法的DSAE故障诊断模型

4.3.1 基于改进算法的DSAE故障诊断模型框架

4.3.2 基于改进算法的DSAE故障诊断模型仿真分析

4.4 本章小结

5 基于改进的DSAE模型在滚动轴承故障诊断中的应用

5.1 滚动轴承数据集描述及分析

5.2 基于DSAE模型优化算法性能的验证

5.2.1 基于改进的Adam算法性能验证

5.2.2 基于BN-DSAE模型性能验证

5.3 与其他学习模型对比分析

5.4 本章小结

6 总结与展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

（4）基于语义空间的英语作文切题分析模型研究（论文提纲范文）

摘要

Abstract

第一章绪论

§1.1 课题的研究背景与意义

§1.2 国内外的研究现状

§1.2.1 文本语义空间的研究现状

§1.2.2 作文切题分析的研究现状

§1.3 研究目标及内容

§1.4 论文的组织结构

§1.5 本章小结

第二章相关的理论与方法

§2.1 文本语义空间分析方法

§2.1.1 基于共现矩阵的语义空间

§2.1.2 基于神经网络的语义空间

§2.1.3 基于知识库的语义空间

§2.2 特征降维与选取方法

§2.2.1 特征降维方法概述

§2.2.2 特征选取算法

§2.3 主题观点分析方法

§2.3.1 Sentic Net情感词典介绍

§2.3.2 计算情感倾向强度值方法

§2.4 文本相似度分析方法

§2.4.1 欧氏距离算法

§2.4.2 余弦相似度算法

§2.4.3 Jaccard距离算法

§2.5 本章小结

第三章基于语义空间的英语作文切题分析模型

§3.1 模型的总体结构

§3.2 模型的预处理方法

§3.2.1 特殊字符过滤

§3.2.2 作文切分

§3.2.3 词性标注

§3.2.4 信息提取

§3.3 层次主题树混合语义空间

§3.3.1 关系三元组层次主题树模型构建

§3.3.2 主题关系三元组分布式向量表示

§3.3.3 基于知识库主题语义空间扩展

§3.3.4 层次主题树混合语义空间的训练

§3.4 作文切题分析模块

§3.4.1 切题分析算法

§3.4.2 主题连贯算法

§3.4.3 主题观点算法

§3.5 作文切题质量分析模块

§3.5.1 切题评分计算

§3.5.2 主题连贯评分计算

§3.5.3 主题观点评分计算

§3.5.4 切题质量计算

§3.6 本章小结

第四章模型的实验与分析

§4.1 模型实验环境

§4.2 模型实验数据与评估标准

§4.2.1 模型实验数据

§4.2.2 模型评估标准

§4.3 模型的实验数据分析

§4.3.1 模型整体评价与讨论

§4.3.2 切题句子的实验与分析

§4.3.3 主题不连贯句子的实验与分析

§4.3.4 模型与教师评分对比

§4.4 模型切题分析示例

§4.5 本章小结

第五章总结与展望

§5.1 全文工作总结

§5.2 未来工作展望

参考文献

致谢

作者在攻读硕士期间的主要研究成果

（5）人工智能在甲状腺癌精准化诊疗中的研究进展（论文提纲范文）

1 AI和精准化医学

2 AI在甲状腺癌诊断中的应用

2.1 超声诊断

2.2 细针穿刺细胞学诊断

2.3 组织病理学诊断

3 AI在甲状腺癌预后预测中的应用

3.1 传统病理参数模型

3.2 基因变异通路模型

4 结语

（6）银行信用卡客户交易分期意愿问题的研究（论文提纲范文）

中文摘要

Abstract

第一章绪论

1 研究背景与意义

2 国内外研究现状

3 文章章节安排

第二章信用卡分期意愿特征描述

1 数据与变量介绍

2 变量描述性分析

2.1 因变量信用卡分期意愿分析

2.2 客户基本信息分析

2.3 信用卡信息分析

2.4 交易信息分析

2.5 交叉变量分析

3 变量选择

3.1 变量显着性检验

3.2 变量WOE值和IV值

3.3 变量相关性问题

第三章模型原理介绍与建模分析

1 分类预测评价指标

2 决策树建模分析

3 随机森林建模分析

4 xgboost与LightGBM建模分析

5 不平衡数据重采样建模分析

第四章总结与展望

1 总结

2 展望

参考文献

致谢

（7）基于多尺度多层次特征的半监督点云分类算法（论文提纲范文）

摘要

Abstract

1 绪论

1.1 课题研究背景目的及意义

1.1.1 研究背景

1.1.2 研究目的

1.1.3 研究意义

1.2 国内外点云分类研究进展情况

1.3 本文主要研究内容

1.3.1 工作内容

1.3.2 技术创新点

1.3.3 论文组织结构

2 点云分类研究理论基础

2.1 点云分类算法原理

2.1.1 半监督点云分类原理

2.1.2 监督点云分类原理

2.1.3 无监督点云分类原理

2.1.4 三种点云分类算法关系

2.2 系统组成及对地定位原理

2.2.1 系统组成

2.2.2 对地定位原理

2.3 点云数据的组成、存储格式和特点

2.3.1 点云数据的组成

2.3.2 点云数据存储格式

2.3.3 点云数据特点

2.4 本章小结

3 点云分类算法的研究

3.1 点云分类技术路线

3.2 点云去噪

3.3 点云滤波

3.4 点云分类算法

3.4.1 监督学习点云分类算法

3.4.2 无监督学习点云分类算法

3.4.3 半监督学习点云分类算法

3.5 分类精度评价

3.5.1 分类结果混淆矩阵

3.5.2 查准率

3.5.3 召回率

3.5.4 准确率

3.5.5 综合评价指标(F1)

3.6 本章小结

4 实验结果和分析

4.1 实验数据准备

4.2 实验结果与分类精度评定

4.2.1 点云分类

4.2.2 实验结果

4.2.3 实验分类精度评定

4.2.4 效率对比

4.3 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

（8）辐射源指纹特征提取技术与分类器设计研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 辐射源指纹特征提取技术研究现状

1.2.2 辐射源分类器设计技术研究现状

1.3 论文主要工作

1.4 论文结构安排

第二章辐射源个体识别基础

2.1 引言

2.2 基于功放Taylor多项式的辐射源个体信号模型

2.3 辐射源个体识别系统处理一般流程

2.3.1 信号预处理

2.3.2 特征提取

2.3.3 特征选择

2.3.4 分类识别

2.4 本章小结

第三章监督条件下基于图像处理思想的信号单一特征提取

3.1 引言

3.2 信号预处理

3.3 基于灰度共生矩阵的纹理特征提取算法

3.3.1 算法思想

3.3.2 算法设计

3.3.3 算法流程

3.4 实验及性能分析

3.4.1 实验设计

3.4.2 仿真实验与性能分析

3.4.3 实测信号验证

3.5 本章小结

第四章监督条件下基于C-E的信号联合特征提取

4.1 引言

4.2 信号预处理

4.3 基于C-E的联合特征提取算法

4.3.1 时域香农熵

4.3.2 时域参数复杂度

4.3.3 基于Hilbert包络谱的香农熵特征提取

4.3.4 C-E联合特征向量

4.4 实验与性能分析

4.4.1 实验设计

4.4.2 仿真实验与性能分析

4.4.3 实测信号验证

4.5 本章小结

第五章半监督条件下基于领域自适应的分类器设计

5.1 引言

5.2 领域自适应分类模型

5.3 领域自适应条件下基于分类器差异最大化的学习方法

5.3.1 算法思想

5.3.2 算法设计

5.3.3 算法流程

5.4 实验设计与结果分析

5.4.1 实验设计

5.4.2 实验与分析

5.5 本章小结

第六章总结与展望

6.1 工作总结

6.2 研究展望

致谢

参考文献

作者简历

（9）Web服务器样本不平衡的入侵检测反向选择算法（论文提纲范文）

摘要

Abstract

1 绪论

1.1 研究背景

1.1.1 Web服务器入侵检测中的问题

1.1.2 Web服务器入侵检测中的反向选择算法

1.1.3 不平衡样本对反向选择算法的启示

1.1.4 选题来源

1.2 研究现状

1.2.1 Web服务器入侵检测现状

1.2.2 现有入侵检测方法研究

1.3 研究目标与内容

1.4 本文组织结构

2 Web服务器入侵检测中的反向选择算法

2.1 入侵检测系统概述

2.1.1 入侵检测系统简介

2.1.2 Web服务器入侵检测的需求

2.1.3 入侵检测分类算法

2.2 人工免疫系统的概述

2.2.1 生物基础

2.2.2 计算机领域的应用

2.3 反向选择算法

2.3.1 反向选择算法概述

2.3.2 反向选择算法的优化

2.4 本章小结

3 Web服务器入侵检测中的不平衡问题

3.1 多分类的方式

3.2 不平衡样本的启示

3.2.1 现有解决方法

3.2.2 评价标准

3.3 Web服务器入侵检测中反向选择算法解决不平衡数据的关键问题

3.3.1 检测器数量分配

3.3.2 类边缘的界定

3.3.3 检测器对样本空间的覆盖

3.3.4 检测器的重叠

3.3.5 不平衡样本处理方法的启示

3.4 本章小结

4 Web服务器入侵检测中反向选择算法的优化

4.1 代价敏感的反向选择算法

4.2 边界界定的反向选择算法

4.3 检测器分布优化

4.4 综合优化的反向选择算法

4.5 本章小结

5 实验设计与结果分析

5.1 实验目的

5.2 实验数据集

5.3 实验过程

5.3.1 实验环境

5.3.2 实验步骤

5.4 实验结果及分析

5.4.1 经典反向选择算法

5.4.2 代价敏感的反向选择算法

5.4.3 边界界定的反向选择算法

5.4.4 综合的反向选择算法

5.5 本章总结

6 总结与展望

6.1 论文工作总结

6.1.1 论文主要工作

6.1.2 论文创新点

6.2 下一步工作

参考文献

致谢

（10）大数据方法在压力管道风险分析中的应用（论文提纲范文）

学位论文数据集

摘要

ABSTRACT

第一章绪论

1.1 课题研究背景及意义

1.2 国内外研究现状

1.2.1 压力管道风险分析

1.2.2 大数据方法概述及应用

1.3 课题研究的主要内容

第二章压力管道数据化与大数据分析方法

2.1 压力管道大数据分析架构

2.2 压力管道数据化

2.2.1 压力管道数据生成及理解

2.2.2 压力管道数据处理

2.3 大数据分析方法

2.3.1 大数据分析方法概论

2.3.2 C5.0算法

2.3.3 CHAID算法

2.3.4 神经网络算法

2.4 本章小结

第三章定量RBI方法在压力管道风险分析中的应用

3.1 压力管道风险分析概论

3.2 失效可能性与失效后果简析

3.2.1 失效可能性简析

3.2.2 失效后果简析

3.3 腐蚀速率计算

3.4 定量RBI方法风险分析结果

3.4.1 压力管道定量RBI方法风险分析示例

3.4.2 压力管道总体风险分析结果

3.5 检验策略的制定

3.6 本章小结

第四章压力管道腐蚀速率预测

4.1 概述

4.2 基于测试案例的计算方法

4.3 大数据方法在压力管道腐蚀速率中的应用

4.3.1 主成分分析方法

4.3.2 BP神经网络方法

4.4 本章小结

第五章大数据方法定性分析风险的研究

5.1 大数据风险分析问题描述

5.2 大数据方法在分析失效可能性中的应用

5.3 大数据方法在分析失效后果中的应用

5.4 大数据方法的结果可靠性评估

5.5 本章小结

第六章总结与展望

6.1 总结

6.2 展望

参考文献

致谢

作者及导师简介

附件

四、特征选择及其常用算法（论文参考文献）

[1]一种改进的基于信息熵的半监督特征选择算法[J]. 万琳,夏树进,朱毅,吕泽华. 统计与决策, 2021(17)
[2]基于中红外光谱的润滑油添加剂种类识别与酸值测定方法研究[D]. 张涛. 华北电力大学(北京), 2021(01)
[3]基于深度自编码神经网络的滚动轴承故障诊断方法研究[D]. 师诗. 北京交通大学, 2021(02)
[4]基于语义空间的英语作文切题分析模型研究[D]. 范春丽. 桂林电子科技大学, 2020(02)
[5]人工智能在甲状腺癌精准化诊疗中的研究进展[J]. 李铃睿,杜博,陈创. 中国肿瘤临床, 2020(07)
[6]银行信用卡客户交易分期意愿问题的研究[D]. 李悦. 兰州大学, 2020(01)
[7]基于多尺度多层次特征的半监督点云分类算法[D]. 高原. 大连理工大学, 2020(02)
[8]辐射源指纹特征提取技术与分类器设计研究[D]. 岳嘉颖. 战略支援部队信息工程大学, 2019(02)
[9]Web服务器样本不平衡的入侵检测反向选择算法[D]. 杨晨. 武汉大学, 2019(06)
[10]大数据方法在压力管道风险分析中的应用[D]. 任康. 北京化工大学, 2018(01)

标签：特征选择论文; 特征提取论文; 语义分析论文; 空间分析论文; 分类数据论文;

特征选择及其常用算法

一、特征选择及其常用算法（论文文献综述）

二、特征选择及其常用算法（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、特征选择及其常用算法（论文提纲范文）

（2）基于中红外光谱的润滑油添加剂种类识别与酸值测定方法研究（论文提纲范文）

（3）基于深度自编码神经网络的滚动轴承故障诊断方法研究（论文提纲范文）

（4）基于语义空间的英语作文切题分析模型研究（论文提纲范文）

（5）人工智能在甲状腺癌精准化诊疗中的研究进展（论文提纲范文）

（6）银行信用卡客户交易分期意愿问题的研究（论文提纲范文）

（7）基于多尺度多层次特征的半监督点云分类算法（论文提纲范文）

（8）辐射源指纹特征提取技术与分类器设计研究（论文提纲范文）

（9）Web服务器样本不平衡的入侵检测反向选择算法（论文提纲范文）

（10）大数据方法在压力管道风险分析中的应用（论文提纲范文）

四、特征选择及其常用算法（论文参考文献）

猜你喜欢