时间序列匹配之dtw的python实现(一)

您所在的位置:网站首页 PADDLE消费 时间序列匹配之dtw的python实现(一)

时间序列匹配之dtw的python实现(一)

#时间序列匹配之dtw的python实现(一)| 来源: 网络整理| 查看: 265

简介

Dynamic Time Warping(动态时间序列扭曲匹配,简称DTW)是时间序列分析的经典算法,用来比较两条时间序列之间的距离,发现最短路径。笔者在github上搜索dtw时发现了两个比较经典的库:dtw和dtw-python。dtw库的功能少但简单容易理解,dtw-python的功能齐全并提供了清晰的作图。在这里我们先介绍dtw库,dtw-python库留到下一篇文章介绍。

示例

对dtw算法的基本原理还不是很理解的可以点击这里,里面介绍的相当清楚了,接下来我们进入正题。

import numpy as np #来自官方库的示例,代码未动,但注解原创。 #y是x的子序列,从x的第三个数字开始一一匹配 x = np.array([2, 0, 1, 1, 2, 4, 2, 1, 2, 0]).reshape(-1, 1) y = np.array([1, 1, 2, 4, 2, 1, 2, 0]).reshape(-1, 1) from dtw import dtw #曼哈顿距离定义,各点相减的绝对值 manhattan_distance = lambda x, y: np.abs(x - y) #计算出总距离,耗费矩阵,累计耗费矩阵,在矩阵上的路径 d, cost_matrix, acc_cost_matrix, path = dtw(x, y, dist=manhattan_distance) print(d) #计算得出2.0 import matplotlib.pyplot as plt plt.imshow(acc_cost_matrix.T, origin='lower', cmap='gray', interpolation='nearest') #lower参数表示上下颠倒,注意这里矩阵行列转置 plt.plot(path[0], path[1], 'w') #path包含两个array plt.show()

在这里插入图片描述 看不懂?没关系,接下来进行具体剖析: 在这里插入图片描述 前面也说过了,y是x的子集,图中橙色的线条表示的是y,蓝色的线条代表的是x,从我们的肉眼角度来说,只要把y平移过去就可以了,但对于计算机而言,需要计算各点的距离矩阵,我们把cost_matrix打印出来: 在这里插入图片描述 看不清的话建议放大,上面是x,左边是y,排列好之后,两两相减取绝对值,就可以得到我们的曼哈顿距离矩阵,可以看到图中的最短距离,是1+1+0+0+0+0+0+0+0+0 = 2,也就是d。实际上我们的优化目标就是使当前距离+右上或右下或右前的格子里的值最小。 这就是cost_matrix和d的计算,而acc_cost_matrix就是把它累加起来,像下面这样: 在这里插入图片描述 可以看到斜线上面的累加距离始终为2。 那path里面存的是什么值呢?为什么上面的线和我作图出来的线是反的呢?我们把path打印出来。 在这里插入图片描述 第一个数组存的是横坐标,第二个数组存的是纵坐标,也就是路径为:(0,0)–>(1,0)–>(2,0)–>(3,1)–>(4,2)–>(5,3)–>(6,4)–>(7,5)–>(8,6)–>(9,7)。实际上这里的纵轴是反的,所以我们要在plot函数中传入origin='lower’参数使它上下颠倒形成前面的图,至于不上下颠倒的正确图形是以下这样的(注意纵轴和前面的是反过来的)。 在这里插入图片描述 当然,这样的图还是不够直观,不能直接显示出原序列的变换,所以在下篇文章里笔者将介绍dtw-python包。

1.https://github.com/pierre-rouanet/dtw 2.https://zhuanlan.zhihu.com/p/43247215



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3