首页 > 图书中心 >图书详情

统计学习方法

作者:李航
定价:38
印次:1-20
ISBN:9787302275954
出版日期:2012.03.01
印刷日期:2017.11.17

内 容 简 介   统计学习是计算机及其应用领域的一门重要的学科。本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。   本书是统计学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。

more >

前 言   计算机与网络已融入到了人们的日常学习、工作和生活之中,成为人们不可或缺的助手和伙伴.计算机与网络的飞速发展完全改变了人们的学习、工作和生活方式.智能化是计算机研究与开发的一个主要目标.近几十年来的实践表明,统计机器学习方法是实现这一目标的最有效手段,尽管它还存在着一定的局限性.   作者一直从事利用统计学习方法对文本数据进行各种智能性处理的研究,包括自然语言处理、信息检索、文本数据挖掘.近20年来,这些领域发展之快,应用之广,实在令人惊叹!可以说,统计机器学习是这些领域的核心技术,在这些领域的发展及应用中起着决定性的作用.   作者在日常的研究工作中经常指导学生,并在国内外一些大学及讲习班上多次做过关于统计学习的报告和演讲.在这一过程中,同学们学习热情很高,希望得到指导,这使作者产生了撰写本书的想法.   国内外已出版了多本关于统计机器学习的书籍,比如,Hastie等人的《统计学习基础》.该书对统计学习的诸多问题有非常精辟的论述,但对初学者来说显得有些深奥.统计学习范围甚广,一两本书很难覆盖所有问题.本书主要是面向将统计学习方法作为工具的科研人员与学生,特别是从事信息检索、自然语言处理、文本数据挖掘及相关领域的研究与开发的科研人员与学生.   本书力求系统而详细地介绍统计学习的方法.在内容选取上,侧重介绍那些最重要、最常用的方法,特别是关于分类与标注问题的方法.对其他问题及方法,如聚类等,计划在今后的写作中再加以介绍.在叙述方式上,每一章讲述一种方法,各章内容相对独立、完整;同时力图用统一框架来论述所有方法,使全书整体不失系统性.读者可以从头到尾通读,也可以选择单个章节细读.对每一方法的讲述力求深入浅出,给出必要的推导证明,提供简单的实例,使初学者易于掌握方法的基本内容,领会方法的本质,并准确地使用方法.对相关的深层理论,则仅予以简述.在每章后面,给出一些习题,介绍一些相关的研究动向和阅读材料,列出参考文献,以满足读者进一步学习的需求.本书第1章简要叙述统计学习方法的基本概念,最后一章对统计学习方法进行比较与总结.此外,在附录中简要介绍一些共用的最优化理论与方法.   本书可以作为统计机器学习及相关课程的教学参考书,适用于信息检索及自然语言处理等专业的大学生、研究生.   本书初稿完成后,田飞、王佳磊、武威、陈凯、伍浩铖、曹正、陶宇等人分别审阅了全部或部分章节,提出了许多宝贵意见,对本书质量的提高有很大帮助.在此向他们表示衷心的感谢.在本书写作和出版过程中,清华大学出版社的责任编辑薛慧给予了很多帮助,在此特向她致谢.   由于作者水平所限,书中难免有错误和不当之处,欢迎专家和读者给予批评指正.来函请发至ml-book-hangli@hotmail.com.         李 航 ?   2011年4月23日

more >
扫描二维码
下载APP了解更多
图书分类全部图书
more >
  • 目    录

    第1章 统计学习方法概论 1

    1.1 统计学习 1

    1.2  监督学习 3

    1.2.1 基本概念 4

    1.2.2 问题的形式化 5

    1.3  统计学习三要素 6

    1.3.1  模型 6

    1.3.2  策略 7

    1.3.3  算法 9

    1.4  模型评估与模型选择 10

    1.4.1  训练误差与测试误差 10

    1.4.2  过拟合与模型选择 11

    1.5 正则化与交叉验证 13

    1.5.1  正则化 13

    1.5.2  交叉验证 14

    1.6  泛化能力 15

    1.6.1  泛化误差 15

    1.6.2  泛化误差上界 15

    1.7 生成模型与判别模型 17

    1.8 分类问题 18

    1.9 标注问题 20

    1.10 回归问题 21

    本章概要 23

    继续阅读 23

    习题 23

    参考文献 24

    第2章 感知机 25

    2.1 感知机模型 25

    2.2 感知机学习策略 26

    2.2.1 数据集的线性可分性 26

    2.2.2 感知机学习策略 26

    2.3 感知机学习算法 28

    2.3.1 感知机学习算法的原始形式 28

    2.3.2  算法的收敛性 31

    2.3.3  感知机学习算法的对偶形式 33

    本章概要 35

    继续阅读 36

    习题 36

    参考文献 36

    第3章 k近邻法 37

    3.1  k近邻算法 37

    3.2 k近邻模型 38

    3.2.1  模型 38

    3.2.2  距离度量 38

    3.2.3 k值的选择 40

    3.2.4  分类决策规则 40

    3.3  k近邻法的实现:...

版本展示

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘