论文精读|AAAI 2020录用论文：GMAN一种多层注意力图神经网络的交通流量预测方法

本文已被国际人工智能领域顶级学术学术会议AAAI-2020 (The Thirty-Fourth AAAI Conference on Artificial Intelligence) 录用，本届大会将于2020年2月7日-12日在美国纽约举行。据悉AAAI-2020会议投稿量创下了8800+的纪录（进入审稿阶段7737篇），接收1591篇论文，录取率为20.6%。

一、背景介绍

交通流预测（traffic prediction）是一个经典的时间序列预测问题，根据历史交通状况观测值来预测未来的交通状况。

图1 复杂的时空相关性。(a)道路网络上的传感器。(b)动态空间相关性：虽然传感器1和2在路网中距离很近，

但他们并不总是高度相关；非线性时间相关性：传感器3在时间步t+l+1的交通状况可能与较远的时间步(如t-1)的交通状况相关，

而与较近的时间步长(如t+l)的交通状况不大相关。

然而，现有的交通流预测方法在长时交通流预测上效果不容乐观，主要是由于长时交通流预测具有以下挑战：

1）复杂的时空相关性：动态的空间相关性。如图1所示，路网中传感器交通状况之间的关系随着时间的推移发生明显的变化(例如，在高峰时间之前和高峰期间)，如何动态选择相关的传感器数据来预测目标传感器长期的交通状况是一个具有挑战性的问题；非线性的时间相关性。如图1所示，传感器所在地的交通状况可能会突然发生巨大的波动(例如，由于事故)，从而影响不同时间步交通状况之间的关系，因此，随着时间的推移，如何对非线性的时间相关性进行自适应建模也是一个挑战。

2）误差传播效应。在长时预测任务中，每一个时间步的预测误差在预测未来时，均可能被放大，这种误差传播为未来交通状况预测带来极大的挑战。

二、方法概括

为了有效解决以上挑战，我们提出了一种新的交通流预测方法，多层注意力图神经网络 (Graph Multi-Attention Network, GMAN)，来预测路网的交通状况。模型提出了一种时空注意力机制，能够更好地建模动态的空间相关性和非线性的时间相关性，并设计了一个门控融合器，来自适应地融合时空注意力机制提取的信息。此外，提出一种转移注意力机制，将历史交通特征转移到未来表征，建模历史时间步和未来时间步之间的直接关系。这种注意力机制调整观察时间步与未来时间步的依赖关系，从而避免误差累积，以有效缓解误差传播问题。具体作用机制见论文。

图片2.jpg

图2 算法框架

我们的模型框架如图2左图所示。GMAN改变了一种编码器-解码器结构，编码器和解码器均包含L个ST-注意力块，其中，每个ST-注意力块均由一个门控融合器将时间注意力机制和空间注意机制融合组成，见图2右下图。在编码器和解码器之间，应用一个转移注意力层，将已编码的流量特征转移到解码器。通过时空嵌入向量(STE)，将路网的图结构和交通流的时间信息融合到多注意力机制中，见图2右上图。此外，所有层都产生d维的输出，以便网络的残差连接。

在此框架下，本文提出了空间注意力机制，时间注意力机制和转移注意力机制，三种注意力机制相互配合，最终提高了长时交通流预测的预测精度，模型具体细节见论文。

三、实验结果

数据集

本实验所使用的两个数据集如图3所示，分别是厦门数据集（交通流量预测）和PEMS数据集（交通流速预测）。评估指标为平均绝对误差（MAE），均方根误差（RMSE）和平均绝对百分比误差（MAPE）。