首页 > 图书中心 >图书详情
Python计算机视觉与应用案例
作者:杨光光
丛书名:计算机科学与技术丛书
定价:79元
印次:1-1
ISBN:9787302676980
出版日期:2024.12.01
印刷日期:2024.12.02
"《Python计算机视觉与应用案例》以Python为平台,以“概述+案例”的方式系统地对计算机视觉进行实战分析。本书先介绍计算机视觉编程基础知识,接着介绍在各个领域利用Python解决计算机视觉问题,最后通过两个经典案例综合分析计算机视觉应用。为了帮助读者更好地掌握相关知识,各章节都通过概述与案例相结合的方式,让读者在掌握概念的同时举一反三,掌握程序设计的方法,利用程序设计解决实际问题。 《Python计算机视觉与应用案例》适合想深入研究Python计算机视觉的开发者阅读参考,也可作为高等院校相关专业的教材。"
more >前言 计算机视觉(Computer Vision,CV)又称机器视觉(Machine Vision,MV),是一门研究如何使机器“看”的科学,更进一步地说,它是使用摄影机和计算机代替人眼对目标进行识别、跟踪和测量,并进一步使用计算机将目标处理成为更适合人眼观察或传送给仪器检测的图像识别与处理技术。 深度学习源自经典的神经网络架构,属于机器学习领域,它通过不同形式的神经网络,结合视觉大数据的大规模存量与不断产生的增量进行训练,自动提取细粒度的特征,形成抽象化的视觉描述,目前在视觉分析方面取得了很大的进步,是当前人工智能爆炸性发展的内核驱动。就技术而言,目前的计算机视觉可分为以下几个大方向: 图像分类; 目标检测; 图像分割; 图像重构; 图像生成; 人脸; 其他。 随着大数据及人工智能技术的不断发展,计算机视觉以其可视性、规模性、普适性逐步成为AI实际应用的关键领域之一,在理论研究和工程应用方面均迅猛发展。 Python是一种计算机程序设计语言,是一种面向对象的动态类型语言,它在设计上坚持了清晰和整齐划一的风格,这使得Python成为一种易读、易维护,并且受大量用户欢迎的、用途广泛的编程语言。随着Python版本的不断更新和新功能的添加,越来越多地被用于独立的、大型项目的开发。自从20世纪90年代初Python语言诞生至今,它已被广泛应用于系统管理任务的处理和Web编程。 自从电子计算机诞生以来,通过计算机仿真来模拟人类的视觉便成为非常热门且颇具挑战性的研究课题。随着数码相机、智能手机等硬件设备的普及,图像以其易于采集、信息相关性大、抗干扰能力强等特点得到越来越广泛的应用。信息化和数字化时代已经来临,随着国家对人工智能领域的投入力度加大,计算机视觉处理的需求量也会越来越大,应用也将越来越广泛。 【本书特色】 因为Python具有易用、简单、普适等特性,所以本书的计算机视觉实现是使用Python语言完成的。本书编写特点主要表现在如下几方面。 (1) 案例涵盖面广、实用,可扩展性、可读性强。 本书以“概述+案例”的形式编写,充分强调案例的实用性及程序的可扩展性,所选案例大多数来自日常生活,应用性强。另外,书中每个案例的程序都经过调试与测试,同时程序代码中添加了大量的解释说明,可读性强。 (2) 点面完美结合,兼顾性强。 本书点面兼顾,涵盖了数字图像处理中几乎所有的基本模块,并涉及视频处理、配准拼接、数字水印等高级图像处理方面的内容,全面讲解了基于Python进行计算机视觉应用的原理及方法,内容做到完美衔接与统筹兼顾,可使读者实现由点到面的发散性延伸。 【本书内容】 全书共20章,各章主要内容如下。 第1章介绍了计算机视觉编程基础知识,主要包括计算机视觉概述、Python编程软件、几个常用库、Python图像处理类库等内容。 第2章介绍了图像去雾技术,主要包括空域图像增强、时域图像增强、色阶调整去雾技术等内容。 第3章介绍了形态学的去噪,主要包括图像去噪的方法、数学形态学的原理、形态学运算等内容。 第4章介绍了霍夫变换检测,主要包括霍夫变换检测直线、霍夫变换检测圆、霍夫变换检测其他形状等内容。 第5章介绍了车牌分割定位识别,主要包括车牌图像处理、定位原理、字符处理、字符识别、OpenCV+SVM车牌识别等内容。 第6章介绍了分水岭实现医学诊断,主要包括分水岭算法、分水岭医学诊断案例分析等内容。 第7章介绍了手写体数字识别,主要包括神经网络算法、卷积神经网络概述、SVC识别手写体数字等内容。 第8章介绍了图片中的英文识别,主要包括OCR介绍、OCR算法原理、OCR识别经典应用、获取验证码等内容。 第9章介绍了小波技术的图像视觉处理,主要包括小波技术概述、小波实现去噪、图像融合处理、小波压缩图像等内容。 第10章介绍了图像压缩与分割处理,主要包括SVD图像压缩处理、PCA图像压缩处理、KMeans聚类图像压缩处理、KMeans聚类实现图像分割、阈值法实现图像分割等内容。 第11章介绍了图像特征匹配,主要包括相关概念、图像匹配等内容。 第12章介绍了角点特征检测,主要包括Harris算子的基本原理、Harris算法流程、Harris角点的性质、角点检测函数、FAST特征检测、SIFT角点检测等内容。 第13章介绍了运动目标自动检测,主要包括帧间差分法、背景差分法、光流法等内容。 第14章介绍了水印技术,主要包括水印技术的概念、数字水印技术的原理、典型的数字水印算法、水印技术案例分析、小波变换水印技术等内容。 第15章介绍了大脑影像分析,主要包括阈值分割、区域生长、区域生长分割大脑影像案例分析等内容。 第16章介绍了自动驾驶应用,主要包括理论基础、环境感知、行为决策、路径规则、运动控制、A_star算法规划自动驾驶运动及自动驾驶案例分析等内容。 第17章介绍了目标检测,主要包括RCNN系列、YOLO检测等内容。 第18章介绍了人机交互,主要包括Tkinter GUI编程组件、布局管理器、事件处理、Tkinter常用组件、菜单等内容。 第19章介绍了深度学习的应用,主要包括理论部分、AlexNet网络及案例分析、CNN拆分数据集案例分析、MTCNN人脸检测算法实现等内容。 第20章介绍了视觉分析综合应用案例,主要包括合金弹头游戏、停车场识别计费系统等内容。 【配套资源】 本书提供程序代码、教学课件等配套资源,可以在清华大学出版社官方网站本书页面下载,或者扫描封底的“书圈”二维码在公众号下载。 本书由佛山大学杨光光编著。 由于时间仓促,加之作者水平有限,疏漏之处在所难免。在此,诚恳地期望得到各领域的专家和广大读者的批评指正。 编者 2024年9月
more >