时间序列数据在数据科学中无处不在。我们可能关心的许多现实世界现象都在时域中发挥作用。医疗保健、气候科学、金融和经济学只是时间序列分析必不可少的无数领域中的一小部分。掌握可以帮助我们识别这些数据集中模式的技术,将极大地推动将大量难以理解的数字转化为可操作的现实世界洞察力。一种这样的技术是傅里叶变换。这种技术将使我们既可以查明数据中的特定模式,也可以根据我们的发现生成新的特征变量。我们将从一个非常简单的虚假示例开始,为解决我们的模式识别问题奠定基础,并说明为什么时间序列数据处理起来如此棘手。
鲍勃的交通问题
假设 Bob 刚搬到一个新城市,开始在当地的能源公司 American Electrical Power 工作。在他新工作的头几周,他意识到上班路上经常有可怕的交通堵塞,每次他迟到都会被他的新老板训斥。作为一个以数据为导向的人,他的第一个冲动是每天记录流量水平。他收集了 4 周的数据记录,0 代表无流量,1 代表中等流量,2 代表可怕的流量。
image.png
令他高兴的是,他注意到一个清晰的模式,即每周二和周五的高水平。现在他可以计算出准确的离开时间,以确保准时到达办公室。问题解决了!
他很高兴能够使用时间序列数据中的模式识别来改善他的生活/工作绩效,他开始想知道他还能在哪里应用他新发现的技能组合。第二天上班时,他听到老板担心公司无法准确预测客户的能源需求。作为一名雄心勃勃的新员工,鲍勃看到了在新老板面前大放异彩的机会。他的老板向他提供了 10-1-04 到 9-30-05 的能源消耗数据,他开始着手尝试破译数据中的任何模式。










网友评论