规范化和清理时间序列
一旦我们有了时间序列数据,下一步就是使其以合适的粒度均匀分布、连续且干净。所需的任务取决于数据的原始形状以及我们的分析目的。例如,如果我们计划对产品进行为期一周的促销,我们可能对更详细的数据感兴趣,而不是想要了解某些产品的销售概况。
排序
时间序列需要按时间排序。将数据划分为训练集和测试集时,请记住通过从顶部/底部获取数据进行测试/训练来保留记录之间的时间结构。如果您的数据每个时间戳包含多条记录,则需 乌拉圭 WhatsApp 号码数据库 要按时间戳聚合它们。例如,当您每天有多个订单并且您对每日销售额感兴趣时,您需要对每天的销售额求和。此外,如果您对时间序列感兴趣的粒度与您当前数据中的粒度不同(例如,月销售额而不是日销售额),您可以进一步以首选粒度聚合数据。
缺失值
如果某些时间戳缺失,则需要将它们引入时间序列以使其间隔相等。有时缺失的记录是时间序列动态的一部分(例如,股票市场在周五关闭并在周一开市)。
頁:
[1]