摘要:动作识别作为计算机视觉领域的关键子领域,其研究进展在很大程度上依赖于对骨架数据和RGB数据的深入分析.尽管这两种数据类型各自提供了独特的视角,但单独使用时所蕴含的信息量往往有限.目前的研究多采取在后期简单叠加或融合这两种数据,这可能导致信息整合不足,影响对动作的准确理解.针对这一问题,提出了一种融合多模态时空上下文的动作识别新方法.通过引入RGB视频序列,旨在捕获与人体动作紧密相关的环境上下文信息,以深化对动作的洞察.在特征学习阶段,设计了一个创新的时空上下文引导模块,该模块通过增强特征的表达力和促进不同模态间的数据交互,显著提升了动作识别的精度.通过深入挖掘RGB数据中的丰富时空上下文信息,该方法有效地加强了不同数据模态之间的协同效应,显著提高了动作识别的准确性,并增强了其在多样化实际场景中的适用性和适应性.实验结果在NTU-RGBD数据集上展示了所提出的网络架构所取得的优越性能.
专辑:
基础科学;信息科技
专题:
计算机软件及计算机应用
分类号:
TP391.41
在线公开时间:
2025-10-10 15:55