专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
相关文章推荐
量子位  ·  Manus新功能一手实测!10分钟8页PPT ... ·  11 小时前  
爱可可-爱生活  ·  【[143星]Servo ... ·  昨天  
人工智能那点事  ·  深圳街头石墩可无线手机充电 ·  昨天  
黄建同学  ·  一篇文章看懂CUDA↓CUDA编程入门:释放 ... ·  昨天  
51好读  ›  专栏  ›  AI科技评论

AAAI 2020 | 华为:短小时序,如何预测?——基于特征重构的张量ARIMA

AI科技评论  · 公众号  · AI  · 2020-02-05 15:40

正文

请到「今天看啥」查看全文


分别是所有时间序列在每个时间点的值,经过MDT变换后每个一维向量变成一组矩阵。
在此,我们将数据只沿着时间维度上做变换,是因为其他非时间维度上的相邻关系并不很强相关(换句话说,可以任意置换不同时间序列之间的排序)。 因此在所有数据方向实施MDT是没有更多意义的,反而增加计算量(BHT阶数变高维度变大)。 不管怎么样,我们的算法是可以支持多方向同时做MDT得到更高阶(更多维数)的数据。
步骤 2: 步骤1得到BHT后,使用Tucker张量分解技术将其分解得到新的特征,称之为核心张量(core tensors)。这个分解过程需要一组共用的映射矩阵。现有的张量模型都会对每个数据维度方向上的映射矩阵加以约束,而我们只松弛时间维度上约束,即是只不在时间维度上加正交约束,而其他维度的正交约束不变,以更好地捕捉序列之间内在的相关性。与此同时,本研究将现有的经典预测算法(ARIMA)张量化使之可以直接处理多维数据。
步骤 3: 预测。我们直接使用核心张量训练张量ARIMA模型以预测得到新的核心张量,然后通过Tucker 逆变换 和MDT逆变换 ,同时得到所有序列的预测值。这样不仅减少了计算量(因核心张量尺寸更小),而且通过在模型构建过程中利用多个时间序列之间的相互关系提高了预测精度。
综上,我们得到新的预测算法,命名为 BHT-ARIMA ,其工作流程示意图如下:
(a) BHT-ARIMA应用在二阶时间序列数据(矩阵)
(b)BHT-ARIMA 应用在三阶张量时间序列数据
图5: 算法BHT-ARIMA的工作流程图。 通过MDT技术将源数据(多条时间序列)变换到高阶张量时间序列BHT。 再进一步利用张量分解技术(Tucker 分解) 从BHT提取新特征(核心张量G)。 与此同时,直接将这些核心张量训练张量ARIMA模型得到新的核心张量。 新的核心张量通过逆张量分解和逆MDT变换后得到源序列的预测值。
本研究将数据增广变换技术、低秩张量分解技术、张量预测模型三者各自的优势融入到一个统一框架中,不仅速度更快,更可捕捉到多条时序之间内在关系,从而可以改善预测结果,特别是对于短小的数据。 接下来,我们通过大量实验验证BHT-ARIMA的实际效果。

3、实验验证

我们将BHT-ARIMA应用在3个公开时间序列数据集:Electricity, Traffic, Smoke video 和2个华为供应链数据集:PC sales 和Raw Materials, 对比了九种常用或最新的算法:
  • 经典的ARIMA,VAR和XGBoost

  • 两种流行的工业界预测方法:Facebook-Prophet 和Amazon-DeepAR

  • 两种基于神经网络的方法:TTRNN和GRU

  • 两种基于矩阵/张量的方法:TRMF和MOAR

此外,我们将块汉克尔张量BHT作为MOAR的输入,得到新的算法“BHT + MOAR”以评估MDT结合张量分解的有效性。
我们通过对比不同长度和样本数目的时间序列,结果以误差NRMSE衡量预测准确率。 结果如Table 1 和 2 所示: BHT-ARIMA 在四个数据集上超越所有对比的方法,且在较短/较小的时间序列上具有更多优势。 整体来说, BHT-ARIMA比其他算法降低预测误差平均10%以上。
图6:在视频Smoke Video不同比例训练样本下的预测结果
我们进一步在更高阶的视频数据上测试。如图6所示,BHT-ARIMA在不同的训练集(甚至只有10%的训练样本)上持续保持其优势。尽管ARIMA可以使用超过50%的训练数据来获得比BHT-ARIMA稍好的预测结果,但它的计算成本和存储要求却非常高——因为像其他线性模型一样,它们无法直接处理张量数据只能将其变形为高维向量。
图7: 在Traffic 和Raw material 数据集上的长期(多步)预测结果
图7展示了长期预测结果的比较,进一步证实了BHT-ARIMA的良好性能。预测更多的步骤,所有方法的误差通常都会增加,而BHT-ARIMA始终在整体上保持其最佳性能,尤其是在较短的Raw materials 数据集上。虽然在Traffic80数据集上进行15步预测后,GRU的性能略胜于我们的方法,但它的计算时间是BHT-ARIMA的近900倍。






请到「今天看啥」查看全文