时间序列预测数据增强方法¶

Ch01.569 时间序列预测数据增强方法¶

📊 Level ⭐⭐ | 6.2KB | entities/time-series-forecasting-augmentation.md

核心挑战¶

时间序列预测增强比分类更难：方法必须同时做到（1）引入足够多样性让模型见到训练数据之外的变化，（2）保持时间一致性让增强后的信号仍是合法连续序列。只破坏 input-target 对齐（look-back 窗口与预测 horizon 的连续关系），性能反而下降。
核心原则：增强前先拼接，增强后再拆分：

s = x ∥ y,  s̃ = 𝒜(s),  (x̃, ỹ) = Split(s̃)

只动 x 不动 y → 人为切断时间连续性 → 大部分分类增强在预测任务失败的根因。

技术路线¶

频域方法¶

方法	核心思路	适用场景
FreqMask	FFT 后用二值 mask 置零选定频率分量	迫使模型对缺失频率保持鲁棒
FreqMix	混合两个序列的频谱	一个序列继承另一个的结构特征
WaveMask/WaveMix	离散小波变换（DWT）多分辨率分解，在每层系数上 mask/mix	高频事件高时间分辨率 + 低频趋势高频率分辨率
Dominant Shuffle	挑 top-k 主导频率做 shuffle，不动其余	规避激进扰动引发出分布风险
Fourier vs Wavelet：Fourier 只回答"哪些频率存在"；Wavelet 额外回答"大概出现在哪里"。对含局部事件的时间序列，Wavelet 的时频定位更关键。

分解方法¶

STAug：EMD 分解得到 IMFs，mixup 式插值权重重新组合。缺点：EMD 内存开销大，大数据集不友好。

其他方法¶

方法	思路
wDBA	DTW 对齐下取平均，计算开销大
MBB	STL 拆趋势/季节性/残差，从残差 bootstrap 块生成
Upsample	线性插值拉伸局部片段，稳居较强非频域基线

Patch-based 方法¶

Temporal Patch Shuffle (TPS)：最新整体最强的 patch-based 方法——
1. 拼接 look-back 窗口与预测 horizon
2. 重叠 patch 提取（patch 长度 p、stride s；重叠让相邻 patch 共享时间步，过渡平滑）
3. 按 variance 评分选择 shuffle 子集（低 variance 优先）
4. 重叠区域取平均重建

方法对比结论¶

WaveMask/WaveMix：16 种 horizon 设置中 12 种第一、4 种第二
TPS：整体最强
Upsample：简单强基线，不容忽视
STAug：效果好但 EMD 内存瓶颈，大数据集无法评估

深度分析¶

时间序列预测数据增强方法的核心挑战在于"保持时间连续性"——增强后的序列必须仍是合法连续序列，否则会破坏look-back窗口与预测horizon之间的连续关系，导致模型学到虚假模式。
1. "拼接-增强-拆分"原则是预测增强的基础设施，违背它的大多数方法都会失效。 正确的流程是：s = x ∥ y → s̃ = 𝒜(s) → (x̃, ỹ) = Split(s̃)。只对输入x做增强而不动y，等同于切断时间连续性——这是分类增强方法在预测任务中表现差的根本原因。增强作用于拼接后的完整序列，确保增强后的x̃和ỹ仍然对应同一连续时间轴。
2. 频域方法的优势在于天然保持时间连续性，因为频率分量是全局性质。 FreqMask/FreqMix在FFT后操作，频域mask/mix不会在时域引入不连续突变。Wavelet方法比Fourier更进一步：对含局部事件的时间序列（如异常检测、金融波动），Wavelet的时频定位能力可以精确指出"哪个时间段出现了什么频率成分"，比Fourier的纯频谱信息更丰富。WaveMask/WaveMix在16种horizon设置中12种第一、4种第二的结果说明其多分辨率分解策略在各类预测场景中具有普遍有效性。
3. Patch-based方法（尤其是TPS）代表当前时间序列增强研究的方向性转变。 传统方法操作单点或单序列，而TPS将look-back窗口和预测horizon作为整体patch进行采样和重组。重叠patch提取（共享时间步让相邻patch过渡平滑）+ variance评分选择（低variance优先，避免破坏高能量结构）的组合，使其成为16种horizon设置中的整体最强方法。这个设计理念与视觉领域的patch-based表示学习高度一致，暗示时间序列patch化可能是比point-wise更好的表示范式。
4. STAug的EMD内存瓶颈揭示了分解类方法的工程化天花板。 EMD（经验模态分解）在理论上能提取多尺度结构，但IMF（固有模态函数）的数量与信号复杂度正相关，在大数据集上内存开销不可控。这提示：对于工程落地，wavelet分解是更可工程化的多尺度方案——计算复杂度固定，内存需求可预测。

实践启示¶

对于时间序列预测模型开发者： 在构建训练数据增强管线时，优先实现"拼接-增强-拆分"框架作为基础设施。在此基础上，WaveMask/WaveMix是频域方法的最佳选择（综合表现最强），TPS是patch-based方法的整体最优。两者可以叠加使用（先用TPS扰动结构，再用FreqMix融合频域特征）。
对于异常检测场景： 优先选择Wavelet方法而非Fourier——时频联合定位能力对于捕获局部事件（传感器异常、金融闪崩）至关重要，Fourier只能告诉你"存在异常频率"，无法告诉你"何时发生"。
对于长期预测任务（长horizon）： 随着预测长度增加，Upsample作为一种简单非频域基线的竞争力会下降，应优先使用WaveMask/WaveMix的多分辨率策略。长期预测的挑战在于低频趋势的保持——Wavelet在各层系数上独立操作的能力使其在长horizon上更具优势。
对于边缘/嵌入式时序推理场景： 优先考虑Upsample——线性插值计算极轻，无需频域变换，适合资源受限环境。在延迟敏感或功耗敏感的生产推理场景中，简单方法可能优于复杂方法。