正文
2、克服零膨胀问题
如果训练标签中的非零项目非常少见,深度神经网络(DNN)会使得训练的权重为全0,从而使得模型失效、遭受零膨胀问题。如图2(b)表明了短期事故的内在稀有性。为了克服实时事故预测中的这一问题,我们设计了一种基于先验知识的数据增强(PKDE)策略,以区分训练数据集标签中的风险值。具体来说,对于区间
,我们将
中的零值项转换为一个具有区分度负值。转换分为两个阶段:a)通过等式(2)将零值转换为事故风险指标;b)指标的值通过等式(3)转换为统计事故强度。给定分区
,我们可以计算其事故风险指标
,通过
其中
是训练数据集中的总周数,而
表示在整个训练期间区域
的总风险值第jj周的时间间隔。然后,我们可以计算区域
的统计事故强度
其中
和
是在
的绝对值范围和真实风险值的范围之间保持对称性的系数。我们利用(底数大于1的)对数函数在0到1之间的区分特性,可以轻松地使变换后的数据区分并适合于训练网络。转换的实现方式为:1)零值项的子区域的事故强度值为负,因此小于非零项目子区域的值,反映出零值项的子区域的事故风险在这个时间间隔内较低;2)具有较低事故风险指标的次区域具有较低的事故概率,可以保留实际事故风险的排序。
图2 NYC城市划分的一种方式及随机选取的10min事故分布
3、填充稀疏的感知数据
实时交通信息通常难以充分收集到以进行事故预测,但是,动态交通信息往往与静态空间路网结构具有交互作用。 因此,我们通过利用因子分解机(FM)的交互操作将xDeepFM修改为适合交通数据的时空深度分解机(ST-DFM),提出了一种协同感知策略。
我们首先通过静态亲和力矩阵
提取路网相似性和子区域之间的连接, 其中
中的
表示子区域
和
之间的静态亲和度,可以通过以下方式计算:
散度函数可以表示为:
与xDeepFM类似,ST-DFM包含压缩交互网络(CIN)模块和DNN模块。三个时空字段,即静态空间特征,动态交通特征(对于一个子区域
中的动态交通特征字段,我们首先通过静态亲和力矩阵(可用动态交通,选择最接近
的子区域。这些子区域中的信息将由
。 中的动态流量特征构成,并且时间戳嵌入ST-DFM中)。然后,ST-DFM
使用CIN模块学
习矢量方向上不同时空特征之间的交互关系,并使用DNN模块学习特征的高级表示之间的交互关系,最终获得特征的高级组合。我们通过将相应子区域的交通量输入到ST-DFM中来推断速度值,反过来,亦可训练一个ST-DFM模型来推测交通量,这就是我们的协同感知技术。然后,通过训练两个实时交通数据集的交集内的数据,可以最大程度地推断交通信息以获得全局交通状态。
五、基于Multi-task DTGN的交通事故预测
1、
时空时变差分图卷积
网络
(
Spatiotemporal DTGN)
采用GCN的动机:(1)由于交通事故和道路拥堵存在一定的交互影响和传播关系。具体而言,一方面,可能由于拥堵造成车辆的频繁超车从而导致交通事故,另一方面,发生交通事故后往往会堵塞道路,从而造成车辆排队,进而增加交通事故发生的风险,造成交通事故,由此在事故点/拥堵点不断传播扩散。(2)相似的路网结构和相似的动态交通模式易产生事故共现。如具有三叉路口、四岔路口等,这些路况往往因为车流量集中且存在变道、转弯的现象,容易造成事故,当城市处于同一天气下,这些地区的事故风险会同时增加,然而由于不同的地区交通模式不同,其事故风险的增加量各不相同,故需要一种方式去量化在不同条件下不同路段(区域)交通事故风险的变化。然而这种关联可能并不是在欧氏关系上的相邻或邻近,而是存在远距离的相似,即非欧氏关联。基于以上两点考虑,我们利用GCN在非欧氏关系中良好的建模效果,建立了本模型。我们提出了一GCN的变体差分时变图卷积网络(Differential Time-varying Graph neural Network, DTGN)并针对观察特征与挑战考虑了以下两个因素:
(1)【时变图网络】区域之间存在一定的相似性和关联性因潮汐车流等原因产生的会随时间变化的不同关联程度,如图3所示。总体亲和度矩阵
捕获特定时间间隔
内子区域间时变交通量相关性为
其中
部分为静态相似性,
为动态相似性,
为调和参数。
(2)【差分图网络】对于同一区域,相邻时间间隔内交通基础元素的数值变化对交通事故的影响(贡献)。与常规交通预测问题(基础元素)相比,事故或事件预测的任务与城市交通状况的异常变化更为相关,这一点已被人们普遍接受。 为此,我们引入了差分特征生成器来计算相邻时间间隔内的差分图像。 通过将差分动态交通特征输入到GCN中,可以对交通异常变化的传播和相互作用进行建模,并且可以了解即时交通状况变化与事故之间的高级关联,特别是对分钟级的事故预报有利。 给定
,可以通过以下公式计算微分矢量
:
参与差分特征生成的
包括流量,速度,而事故风险本身不参与差分生成(因为其差分无显著的物理意义)。
图3 时变的区域关联示意
通过结合其动态交通量特征和相应的差分矢量,我们生成一个统一的特征元组。由于动态的时空数据在时间维度上具有很强的特点,即连续性、周期性和趋势性,我们利用这一特点建立时间依赖关系。在模型的输入部分,基于以上三个特点建立样本并聚合数据,DTGN对输入的数据进行特征抽取,随着DTGN网络层数增加,更高阶区域之间的动态关联将被模型学到。
如图4所示,然后我们将所有三个时间趋势的视图统一特征元组集合独立地传入DTGN。 图4(a)中演示了一种DTGN的详细架构。 对于一个特定的时间角度,我们将对应的联合特征元组记为。 我们将传入全连接(FC)网络,以将所有元素编码为低维要素集,然后将其馈入GCN。GCN递归地进行运算,
图4 Multi-task DTGN的实现细节