想用机器学习做信号分析,常用的特征提取手段有哪些,哪些信号特征是可以用来提取识别的?

您所在的位置:网站首页 数据抽取技术有哪些 想用机器学习做信号分析,常用的特征提取手段有哪些,哪些信号特征是可以用来提取识别的?

想用机器学习做信号分析,常用的特征提取手段有哪些,哪些信号特征是可以用来提取识别的?

2023-03-12 00:34| 来源: 网络整理| 查看: 265

先占坑,后回答。

占坑两天了,今天总算抽出时间来回答这个问题了。直接进入主题,我想先把作者这个问题分解一下。

我的理解,作者问了这两个问题:(1)机器学习做信号分析,常用的提取手段有哪些?(2)哪些信号特征可以用来识别信号?

针对第一个问题,其实问的我很懵,不太理解楼主是想知道常用的信号特征有哪些?还是真的问常用的“特征”提取手段?这本身就是两个问题。为了另楼主满意,我想这两个问题我还是都回答一下。

首先,针对常用的信号特征这个问题,一楼@刘锋博士已经回答的很好了,同时他还给特征分了三类,非常用心。这些特征非常有用,且在教科书上都能够找到相关的定义。我想我就不用在这里重复了,楼主应该可以查查文章,翻一翻书就能找到这部分知识。而我想从一个“更本质的角度”出发回答这个问题。任何能区分目标信号和其他信号的“描述”都能当作目标信号的特征。特征本质就是对一类信号“样貌”的“描述”。举一个例子,我们平时如何区分我们周围的人?我们一般从“身高”、“胖瘦”、“脸型”、“声音”等角度出发去辨别,这些就是我们对一个人“样貌”的定义和描述。信号一样我们可以从“均值”、“方差”、“有效值”、“频率”的角度描述信号的“样貌”。但是,特征的定义是什么呢?我们先看看百度词典的定义:

特征,汉语词语,读音为tè zhēng,意思是一事物异于其他事物的特点。人或事物可供识别的特殊的象征或标志。

我们可以看到“特征”本身最重要的含义是“事物异于其他事物的特点”。一个事物(这里可以直接认为是信号)的描述有很多,但是真正能称得上特征还必须具备一定的条件,那就是“差异性”。比如描述直流信号(方差都为0、均值为0)时,显然“有效值”能区分两种直流信号,而“均值”和“方差”无法区分两个直流信号。所以,此时我们认为“有效值”才是区分不同直流信号的特征,而不是“均值”和“方差”这样的描述。这充分体现的区分事物的“差异性”。再比如,两个正弦信号(注意幅度都为1、相位都为0)的特征应该是什么?很明显“均值”、“方差”、“有效值”都不适合了,因为你始终能构造出两个具有相同“方差”或“有效值”的两个正弦信号。而学过傅立叶变换的同学知道,区分两个正弦信号最有用的描述就是“频率”。这也就是傅立叶变换的核心“一个信号可以被分解为多个频率不同的正余弦信号的组合”。显然这个任务中“频率”才能称为信号的“特征”。试想一下,如果我要你区分直流和正弦信号呢?这时候你选择“有效值”显然就不合适了。我们可以构造出“有效值”完全相同的直流和正弦信号。而这说明了一个道理,真实情况中特征明显是和“要进行的任务”挂钩的。比如现实生活中区分“梨”和“苹果”,我们可以用“颜色”作为特征,而如果任务变为区分“樱桃”和“苹果”,显然此时“颜色”不再是“特征”,“大小”可能是这个任务应该考虑的特征。因此特征是“考虑任务场景,且具有事物区分度的描述”。这里我引用机械故障诊断领域先驱Simon Braun教授关于“机械特征分析”的定义来说明这个问题:

“机械特征分析”—机械设备异常状态导致的振动特征能很容易地同健康状态下的参考特征区分开来

上面这句话考虑的场景是“基于振动的机械设备异常分析”,“健康状态下的参考特征区分开来”是对“事物区分度”的表述。如果你真的需要一些即插即用的“描述”(注意我这里用的是描述,不是特征),我还是给你一个我曾经回答这个问题的链接。机械故障诊断及寿命预测中,通俗的讲特征提取是什么意思? - aresmiki的回答 - 知乎。

接下来另一个问题,特征提取手段。其实楼主的问题已经回答了这个问题的一小部分。“机器学习”本身就是一种特征提取手段。这里我给楼主一个例子:如何让一个不知道“苹果”和“梨”是什么的人能认识“苹果”呢?有一种方法就是“机器学习”。当他拿一个水果(样本)过来,我们只需要告诉他是不是“苹果”(这就是标签)。第一次他拿了一个大的“梨”过来,我们告诉他不是“苹果”,第二次他拿了一个小的“梨”过来,我们还是告诉他不是“苹果”。通过两次学习他知道了大小不是区分“苹果”和“梨”的关键,第三次他拿了一个带把的“苹果”过来,我们告诉他是“苹果”,第四次他拿了带把的“梨”过来,我们还是告诉他不是“苹果”。这两次他知道带不带把也不是区分两个水果的关键。。。。就这样不断的累积经验最终他会学习到“颜色”是区分他们的关键,他也就总结了“颜色”是这个任务的特征。很显然,这个特征的提取是通过学习。另一种呢就是直接专家经验呢,让一些已经知道的人直接根据经验去总结。回到信号特征的提取手段上面来,第一种就是“用机器学习”来提取特征,典型的就是“神经网络”和“机器学习”,这类方法学习到的特征具有很强的针对性,特定适用于这个任务。第二种就是经验的总结,数学上经验的总结一般用数学公式来描述,如“均值”,“方差”等等,可以看到一般都是基于一些统计手段进行描述。现实中,这些统计的描述太过宽泛,因此我们并不知道这些描述能不能用于我们特定的任务。比如前面“颜色”这个特征是人们在处理“苹果”和“梨”的任务中总结出的一种描述,但是如果换做“樱桃”和“苹果”的案例中就可能不适用。所以我们在使用现成总结好的特征时往往需要有一个过程“特征筛选”,人为的筛选出一些适用的“描述”作为特征。回到主题,第二种特征提取方法本质上人为经验的数学总结(主要适用统计手段)。另一类看是文字描述,本质还是适用数学手段描述的人工经验指标。比如,EMD(经验模态分解)对它想要得到的信号的“特征”描述是:

IMF(固有模态函数)的定义

⑴函数在整个时间范围内,局部极值点和过零点的数目必须相等,或最多相差一个;⑵在任意时刻点,局部最大值的包络(上包络线)和局部最小值的包络(下包络线) 平均必须为零

很显然这两句话依然是对要区分的信号的特征描述。在实际操作过程中,EMD通过“EMD迭代筛分步骤”实现这个特征的数学话,最终从一个复杂信号中提取出所有和定义“特征”相符的信号。

上面这个例子实际表述了一个现实,所有的信号分析和处理都是在做“特征”分析。不仅仅是“故障诊断”、“语音识别”等耳熟能详的任务。举例:小波分析将信号分解为和小波基相似的信号,因此给定的这个小波基函数就是一个“特征”的描述,要求分解的信号要和给定的这个基函数一样。傅立叶分析定义的信号的特征就是“频率”,他将信号分解为“频率”不一样的组合。PCA(主成分分析)使用“方差”作为区分信号特征,将信号分解为多个“方差”不同的信号。所以所有信号分析方法背后的本质都有一个“特征”作为目标的指导。就像我们找东西,都需要知道东西是什么,这里的“是什么”就是通过“特征”来描述。

先回答这么多吧。。。。有时间再回答最后这个问题“哪些信号特征可以用来识别信号?

OK~~本来想出去,遇到下雨了!还是回来把这个问题回答完吧。

实际上,上面我已经回答了这个问题,那些特征可用主要取决于你的任务。应为即使你直接使用现成总结好的特征,你依然面临一个问题“特征筛选”。这个问题非常常见。以机械故障诊断为例,我们经常能看到很多这种文章:

特征+机器学习

最简单就是根本不对特征进行选择,让神经网络自己去挑选有用的特征(通过网络权重大小决定特征的重要性)。这中策略“非常简单”,缺陷就是无用特征太多,网络结构太大,难以训练,最后“机器学习”的结果可能不是很满意。如果你想看看第一种技术的一个具体实现案例(包含大量特征计算),可以在这里下载到:

另一种就是使用一些技术对选择的特征进行“压缩和筛选”,得到最有差异和富有“信息”的特征,再用这些特征进行学习,这样网络较小,训练相对容易,可以提高“机器学习”的性能。但是这些压缩技术或筛选技术依然是人为经验的参与,比如基于距离信息的筛选原则,就是利用了认为经验“距离是评估特征好坏的判断准则”。如果我们能很好好解决大型神经网络的训练问题,实际上第一种策略是一种万能方法,因为所谓的压缩和特征筛选可以用前几层神经网络训练(这里解释一下,神经网络本身能逼近任何函数映射,而人为选择的流行学习或PCA等方法本身就是可以用神经网络等效实现的。这点可以从稀疏自编码网络等效实现PCA方法看出)。

当然另一种技术就是完全使用机器学习技术,将特征层也用神经网络实现,最终生成一种端到端的模型,这个网络要完成的功能非常多,特征表示、特征筛选压缩、分类和回归等,这样的网络会非常深,简称为“深度神经网络”。这种方法的流程如下:

深度学习,不需要认为设计特征,特征好坏完全有网络决定,实际是有数据集决定

是不是深度学习技术最简单,但是本质上网络将特征表示、特征压缩筛选、分类回归都用神经网络实现了,而你需要解决的就是准备足够好的“数据集”、好的“计算平台”、期待能调到好的参数。

因此你问“哪些信号特征可以用来识别信号?”,我的回答是“不知道”,因为你没有给出一个具体的任务。但是我给你回答了一个“通用公式”。你遇到实际问题后,我相信你按照我给的三个思路,一定会找到“好的信号特征”。俗话说“授之以鱼,不如授之以渔”。好了,就这么多吧,夜已深,希望我一晚的“工作”,能帮助到你。不求回报,只求“点赞”,“关注”,“评论指正”。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3