前言
2022年10月,习近平总书记在党的二十大报告中指出,“……加快实现高水平科技自立自强。以国家战略需求为导向,集聚力量进行原创性引领性科技攻关,坚决打赢关键核心技术攻坚战”。创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。
2017年7月8日,国务院发布了《新一代人工智能发展规划》(国发〔2017〕 35号)。人工智能成为国际竞争的新焦点,人工智能是引领未来的战略性技术; 人工智能已经成为经济发展的新引擎,成为新一轮产业变革的核心驱动力; 人工智能带来社会建设的新机遇,也将深刻改变人类社会生活、改变世界格局。抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国是我们的首要任务。在《新一代人工智能发展规划》
中提出,要“促进人工智能在公共安全领域的深度应用,推动构建公共安全智能化监测预警与控制体系。围绕社会综合治理、新型犯罪侦查、反恐等迫切需求,研发集成多种探测传感技术、视频图像信息分析识别技术、生物特征识别技术的智能安防与警用产品,建立智能化监测平台。加强对重点公共区域安防设备的智能化改造升级,支持有条件的社区或城市开展基于人工智能的公共安防区域示范”。智能视频检测与识别技术是上述任务的技术基础。
智能视频检测与识别技术是利用计算机图像分析技术以及近两年出现的大模型技术,通过对场景视频图像进行感知,判断背景和目标,并分析前景目标的属性和状态,追踪在摄像机场景内以及跨域出现的目标轨迹。应用系统具有多种视频内容分析的功能,通过在不同摄像机的场景中预设不同的视觉任务和预警规则,当感兴趣的目标在场景中出现或发生了预警规则所定义的现象或行为时,智能视频检测与识别系统会产生响应,并实施预警。
视频图像中的目标检测和识别,以定位并识别图像中感兴趣的对象为目的,是计算机视觉和机器学习中一项重要的任务。当前,深度学习的发展为视频图像目标检测和识别性能的提升带来了显著进展。结合图像目标检测并融合多帧图像中的时序信息实现高准确度的视频目标检测和识别是该领域的重要课题。同时,相比基于图像的目标检测和识别,视频目标检测不仅要保证在每帧图像上检测的准确性,还要保证检测结果具有帧间一致性和时序连续性,对于特征表征描述的挑战性更强,具有重要的理论研究意义。视频目标检测和识别是高阶场景内容理解与应用的基础,在智慧城市、公安安防、智能交通、无人驾驶、机器人等诸多场景中有重要应用。
目前,虽然有部分书籍分别介绍了智能视频检测与识别技术的某项技术内容,但并没有系统全面地讲解以现代机器学习和深度学习为主要方法的视频中常用典型目标的检测和识别。本书可作为高等院校人工智能与计算机相关专业、信息与信号处理、计算机视觉和机器人等智能体等相关领域的教学参考书,也可供从事智能安防相关领域的技术人员参考使用。
本书共分10章,由多位专家撰写。各章分别对人们关注和重要应用的典型视频目标检测和识别技术进行了论述。第1~6章主要介绍智能视频中目标检测技术的发展和检测方法,包括视频目标检测、无人机目标检测、人脸检测、行人检测、车辆检测、异常检测。第7~10章主要介绍智能视频中目标识别技术的发展和识别方法,包括人脸识别、行人再识别、行为识别、视频车牌识别。
本书每一章都对应一个主题。首先概述主题,围绕主题介绍背景,讲解技术。技术的讲解以方法为主,结合实际场景展示应用结果,便于读者综合学习和加深理解。其中第1~2章由清华大学李亚利撰写,第3章、第7~8章由清华大学王生进撰写,第4~5章由天津大学庞彦伟撰写,第6章和第9章由国防科技大学谢剑斌撰写,第10章由清华大学彭良瑞撰写。清华大学豆朝鹏、许景焘 张佩仪、赵珂萌,天津大学曹家乐、高阿麒,墨尔本大学谢昌颐,中北大学常智超等参与了本书的部分整理工作。另外,由于本书源自作者的一些实际研究成果,因此部分内容参考了多位作者指导的博士研究生和硕士研究生(舒晗、陈荡荡、郑良、许勤、孙奕帆)学位论文的部分内容。
本书部分研究成果来自国家自然科学基金项目“重现的行人目标数据关联和深度跟踪理论及方法研究”、国家自然科学基金项目“开放场景下基于深度学习的时空信息融合行人再识别方法研究”、科技部“863”计划项目“基于人类视觉感知和认知机理的视频图像模式识别和机器学习”、国家“十三五”重点研发计划项目“课题1: 动态人脸获取和快速比对技术与装备研究”、国家“十四五”重点研发计划项目“课题3: 人像鉴定及活体检测系统攻击检测与防御技术研究”、国家科技创新2030新一代人工智能重大项目“类脑通用视觉模型及应用”等。
在计算机视觉和人工智能领域,智能视频检测与识别技术的发展非常迅速,特别是2023年以来大模型出现以后更是如此。尽管本书力求全面并努力跟随技术发展趋势,但由于作者水平和时间有限,书中难免存在疏漏之处,恳请读者给予批评指正。
作者
2024年5月