(资料图)
阿里巴巴旗下的达摩院近日与大连理工大学联合推出了一款名为HQTrack的人工智能框架。该框架主要由视频多目标分割器(VMOS)和掩模优化器(MR)组成,其主要目标是“实现对视频中任何目标的高质量跟踪”。 据研究团队介绍,HQTrack基于开源框架DeAOT、HQ-SAM,并在此基础上进行了一定的改进,实现了“在视频中分割各目标”的可能性。同时,研究团队使用Intern-T作为特征提取器,提高了框架对不同类型物体的区分能力,并加入了一个门控传播模块(GPM),以便于框架在复杂环境中感知更多微小物体,生成高质量的即时目标遮罩。 据了解,HQTrack在VOTS2023竞赛中以0.615的质量得分获得第二名。研究团队表示,该人工智能框架可以应用于人脸识别、智能驾驶、监控追踪等领域,并有望在未来商业应用中落地。 目前,该项目已经在GitHub中开放。HQTrack的核心功能包括:多目标追踪,可以同时追踪多个目标对象,适用于复杂场景下的目标追踪任务;目标分割,能够准确地分割视频中的目标对象,并生成高质量的目标遮罩,可用于目标识别和分析;高质量输出,其追踪结果具有高质量和高准确性,能够满足各种应用场景的需求;简单易用,提供了简洁的接口和使用指南,用户可以轻松地使用和集成该工具。