清华大学出版社--图书前言

图书前言

前言

目标检测是计算机视觉领域的核心任务，旨在从图像或视频中定位并识别出特定目标。它不仅需要确定目标的种类（分类任务），还需要给出目标在图像中的具体位置（通常以边界框的形式表示）。目标检测广泛应用于自动驾驶、安防监控、人脸识别、智慧交通、工业检测等领域，是人工智能技术在实际场景中的重要应用之一。

目标检测方法经历了从传统计算机视觉技术到深度学习驱动的演变。传统方法依赖人工设计的特征提取与分类模型，性能受限于特征表达能力；而现代目标检测算法（如YOLO（You Only Look Once）、Faster RCNN、RetinaNet等）基于深度学习技术，通过卷积神经网络（CNN）等强大的特征提取能力，显著提升了检测精度和速度。特别是，YOLO系列算法以其实时性和高效性成为目标检测领域的代表性技术，广泛应用于工业生产和科研实践。

本书以YOLO目标检测框架为核心，全面解析目标检测的基础理论、技术演进与应用实践，旨在帮助读者深入理解目标检测的核心技术，并掌握YOLO框架的开发与实现方法。本书分为基础理论、技术实现及实战应用3个部分，内容循序渐进，既包含目标检测的基本原理，又覆盖领域前沿的创新技术。

第1部分基础理论（第1~3章）：介绍了目标检测的基本概念与理论框架。第1章从目标检测任务的定义与分类出发，详细介绍了常用的评估指标、目标检测方法的演进、目标检测的实际应用与公开的数据集；第2章介绍了目标检测所依赖的深度学习技术框架（如TensorFlow、PyTorch、MXNet与Keras），以及目标检测开发环境的搭建与使用等；第3章介绍了卷积神经网络（CNN）的核心原理与技术，通过具体示例演示CNN在目标检测任务中的作用与实现。

第2部分技术实现（第4~8章）：详细介绍了YOLO目标检测框架的技术细节与实现方法，包括数据增强与数据处理方法（第4章），YOLOv1至YOLOv11框架的技术演进（第5、6章），以及RetinaNet的基本原理与网络架构，焦点损失函数（Focal Loss）的实现，多维度注意力机制、弱化非极大值抑制算法与自适应学习率策略等新技术（第7章），涵盖YOLO目标检测技术的各个方面。第8章从训练流程到模型调优，通过实际案例讲解了YOLOv11的小目标检测实现过程。

第3部分实战应用（第9、10章）：第9章以交通场景中的小目标检测为例，讲解YOLOv11在实际项目中的应用流程，包括数据预处理、模型训练与优化以及小目标检测的性能提升策略；第10章则迈向开放世界目标检测技术，详细介绍YOLO-UniOW框架及其在动态开放环境下的表现。

在本书的撰写过程中，得到了许多同行、专家与朋友的支持和帮助。在此，衷心感谢为本书提出宝贵意见的研究者、审稿人，以及参与内容校对的团队成员。他们的专业知识与建议使本书更加完善。

希望本书能为你的学习与研究提供启发与帮助。

本书源码下载

本书提供配套源码彩图，源码可通过微信扫描下面的二维码获取，彩图直接扫描图书中对应图例所付二维码即可查看：

如果读者在学习本书的过程中遇到问题，可以发送电子邮件至booksaga@126.com，邮件主题为“计算机视觉：YOLO目标检测原理与实践”。

著者

2026年1月

关于我们

新闻资讯

服务支持

关于我们

新闻资讯

服务支持

图书前言