数学机械化重点实验室贾晓红研究员及其博士生杨小龙与腾讯公司合作,将李代数运用于卷积神经网络(CNN)进行侧脸识别,并在头部旋转估计和商业规模级大数据训练两个方面上取得进一步突破,在多个人脸识别、验证和匹配数据集上刷新目前最优测评成绩。
该工作探索了三维空间中的头部旋转变换影响人脸在CNN的深层特征生成的过程,并证明了图像空间中的头部旋转等效于 CNN 特征空间中仅由旋转决定的附加残差分量。相关论文“LARNeXt: End-to-End Lie Algebra Residual Network for Face Recognition”[1]被人工智能和模式识别领域国际顶级期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(T-PAMI, IF:24.314)接收发表。
该工作在多个重要人脸识别、验证和匹配数据集上的测评都刷新了最佳结果。例如,侧脸人脸数据集IJB-A上所有四个指标都优于近五年大量人脸识别工作,在多个通用人脸数据集LFW,YTF,CPLFW上都取得领先。对比前序工作LARNet[2](ICML, 2021),本研究进一步增强了人脸识别、验证等多类任务的性能,在更加复杂和困难的IJB-B/IJB-C数据集的结果超越2022-2023年的相关前沿人脸研究;在名人数据集CFP-FP上突破前序工作的超高精度结果99.01%,降低约14%的高难度样本错误率,识别精度达到99.19%;面对当前商业级别的巨大量数据的冲击,本研究的算法设计验证了可在大规模数据上扩展,并且取得更高的精度(CFP-FP: 99.19%->99.29%)。
参考文献:
[1] Xiaolong Yang, Xiaohong Jia, Dihong Gong, Dong-Ming Yan, ZhiFeng Li, Wei Liu
LARNeXt: End-to-End Lie Algebra Residual Network for Face Recognition
IEEE Transactions on Pattern Analysis and Machine Intelligence(T-PAMI), 2023. DOI: 10.1109/TPAMI.2023.3279378.
[2] Xiaolong Yang, Xiaohong Jia, Dihong Gong, Dong-Ming Yan, ZhiFeng Li, Wei Liu
LARNet: Lie Algebra Residual Network for Face Recognition.
Proceedings of the 38th International Conference on Machine Learning (ICML2021).
附件下载: