基于注意力机制和时空信息的群组行为识别
作者:
作者单位:

四川大学 电子信息学院,四川 成都 610065

作者简介:

姜 雪(1988-),女,在读硕士研究生,主要研究方向为计算机视觉.email:1015475773@qq.com.
卿粼波(1982-),男,博士,教授,博士生导师,主要研究方向为多媒体通信与信息系统、人工智能与计算机视觉.
黄江岚(1999-),女,在读硕士研究生,主要研究方向为计算机视觉.
刘 博(1997-),男,在读硕士研究生,主要研究方向为计算机视觉.

通讯作者:

卿粼波(1982-),男,博士,教授,博士生导师,主要研究方向为多媒体通信与信息系统、人工智能与计算机视觉. email:qing_lb@scu.edu.cn

基金项目:

国家自然科学基金资助项目(61871278)

伦理声明:



Group activity recognition based on attention mechanism and spatio-temporal information
Author:
Ethical statement:

Affiliation:

College of Electronics and Information Engineering,Sichuan University,Chengdu Sichuan 610065,China

Funding:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    群组行为识别是对个体的共同行为进行识别。群组行为与群组状态密不可分,也与群组内个体时空特征息息相关,时空信息既能描述空间语义信息,更能反映行为的动态变化情况。针对有效精细的时空特征提取问题,本文提出了一种基于注意力机制和深度时空信息的群组行为识别方法。首先将ShuffleAttention引入双流特征提取网络中,有效提取个体外观和运动信息。其次使用改进Non-Local网络提取深度时序信息。最后将个体特征送到图卷积网络中进行空间交互信息建模,得到群组行为识别结果。在CAD和CAED数据集上的准确率达到了93.6%和97.8%,在CAD数据集上与凝聚群组搜索算法(CCS)和成员关系图(ARG)方法相比,准确率提高了1.2%和2.6%,这表明本文方法能有效提取深度时空特征,提升群组行为识别准确率。

    Abstract:

    Group activity recognition is to identify the common activity of individuals in space. It is closely related not only to group state, but also to the individual spatio-temporal features which can not only describe the semantic information in space, but also reflect the dynamic changes of activity. A group activity recognition method is proposed based on attention mechanism and deep spatio-temporal information. Firstly, the advanced ShuffleAttention is introduced into the two-stream feature extraction network to extract individual appearance and motion information. Secondly, the improved non-local network is employed to extract the deep temporal information. Finally, the individual features are input into the graph convolutional neural network to model the interaction and spatial information, recognizing group activity. The accuracies on Collective Activity Dataset(CAD) and Collective Activity Extended Dataset(CAED) reach 93.6% and 97.8% respectively. Compared with Cohesive Cluster Search(CCS) and Actor Relation Graph(ARG) methods, the accuracy of the proposed method on CAD datasets is 1.2% and 2.6% higher, indicating that the proposed method can effectively extract deep spatio-temporal features and improve the accuracy of group activity recognition.

    参考文献
    相似文献
    引证文献
引用本文

姜雪,卿粼波,黄江岚,刘博.基于注意力机制和时空信息的群组行为识别[J].太赫兹科学与电子信息学报,2023,21(5):661~670

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
历史
  • 收稿日期:2022-07-16
  • 最后修改日期:2022-09-18
  • 录用日期:
  • 在线发布日期: 2023-06-02
  • 出版日期: