本发明属于图像处理技术领域。提出了一种多尺度视频预测方法、系统、介质、产品及设备,将所述上一帧图像与所述当前帧图像分别输入至双分支光流模块的两个分支,得到运动特征和空间特征;根据所述运动特征和所述空间特征,得到融合特征,所述融合特征中包括下一帧图像与上一帧图像的反向光流、下一帧图像与当前帧图像的反向光流以及权重图;根据下一帧图像与上一帧图像的反向光流、下一帧图像与当前帧图像的反向光流以及权重图,确定下一帧图像的预测结果。本发明在不同尺度下捕捉动态物体的运动趋势与空间细节信息,并利用空间‑通道协同注意力融合策略对两分支特征进行深度交互,显著提升了视频预测的准确性和效果。
