首页 > 图书中心 >图书详情

Python数据分析与机器学习(微课视频版)

从Python基础、数据分析与可视化到机器学习,循序讲解、案例丰富。配套微课视频、源码、课件等。课件下载处为配套资源。

作者:杨年华
定价:110
印次:1-1
ISBN:9787302611516
出版日期:2023.01.01
印刷日期:2022.11.07

本书首先简要介绍Python语言的基础知识,为后续内容的学习提供基础,接着介绍NumPy、Matplotlib和Pandas三个数据分析基础模块的用法,同时也为后面基于scikitlearn的机器学习提供基础,最后介绍基于scikitlearn机器学习及其模型的评价方法、超参数调优方法。全书通过大量案例,希望能让读者快速提高实践能力。 本书适合作为高校本科生或研究生数据分析、机器学习等相关课程的教材或参考书,也可作为数据分析和机器学习爱好者的自学教程,还可以作为相关科研工作者与工程实践者的参考书。

more >

前言 在大数据和人工智能时代,数据是各企事业单位的重要资产。数据分析和机器学习是寻找数据之间关系、预测趋势的重要手段,是智能决策的重要方法之一。通过数据分析和机器学习知识体系的培养,结合各学科的应用,可以为各学科的人才培养注入新的动力。Python语言入门简单,已经得到广泛的应用,也是当前大数据和人工智能领域最常用的程序设计语言之一。我们在相关课程建设的基础上编写了本书。 本书共14章。第1~4章主要介绍Python语法的基础知识,为后面内容的学习提供基础。第5~7章主要介绍数据分析和可视化方法,同时也为后面的机器学习部分提供基础。第8~14章主要介绍机器学习及数据预处理和模型评估方法。各章节的主要内容如下。 第1章主要阐述Python语言的特点、模块的概念、帮助的使用方法及开发环境的安装与使用方法。 第2章主要介绍Python语言的语法基础,包括标识符、表达式、常用数据类型、分支与循环结构、常用组合类型等。本章部分内容由柳青、张晓黎、郑戟明编写。 第3章主要介绍自定义函数以及类型注解、lambda表达式和函数式编程的常用类与函数。本章部分内容由柳青编写。 第4章主要介绍类与对象的关系、自定义类和类的继承。本章4.1节和4.2节中的部分内容由柳青编写。 第5章主要介绍NumPy数据处理基础。NumPy是学习Matplotlib、Pandas、scikitlearn等内容的基础。 第6章主要介绍Matplotlib数据可视化基础,介绍了多种数据展示方法。 第7章主要介绍Pandas数据处理与分析技术,包括Series和DataFrame两种对象的用法及在数据库和文件中的存取方法、常用函数与方法、数据清洗与处理方法、时间处理、统计分析、Pandas中的绘图方法。这些处理步骤为后续章节中的机器学习提供了数据预处理的技术。 第8章是对机器学习方法的概述,并介绍了一些常用实验数据的获取与加载方法,最后给出了使用scikitlearn实现机器学习的基本步骤。 第9章介绍将数据集用于模型训练前的常用预处理方法,主要包括特征的离散化、标准化、正则化和编码。 第10章主要介绍机器学习模型的常用评估方法和scikitlearn中连接系列操作的轨道使用方法。 第11章主要介绍有监督学习中的经典算法及scikitlearn中对应类的用法。 第12章主要介绍几种常用的集成学习方法及scikitlearn中对应类的用法。 第13章主要介绍基于无监督学习的聚类和降维。 第14章主要介绍如何利用网格搜索进行超参数调优和算法选择。 全书除了第2~4章提到的编写人员外,其他章节均由杨年华编写。 本书案例中使用的实验数据主要来自scikitlearn自带数据集和UCI机器学习库(UCI Machine Learning Repository),另外用到了部分从雅虎财经频道下载的股票交易数据。在此,我们对数据集的分享者表示感谢。 本书案例在Python 3.10、NumPy 1.22.1、Matplotlib 3.5.1、Pandas 1.4、scikitlearn 1.0.2下通过测试。读者也可以在更高版本的配置上运行本书的源代码。 本书提供配套的源代码,并为教师提供课件和教学大纲等资料。这些资料可以在清华大学出版社官方网站下载。本书的第3章和第5~7章配套了微课视频,读者可先扫描封底刮刮卡内的二维码,获得权限后,再扫描正文中的二维码,即可观看视频。 由于作者水平有限,书中难免存在疏漏和不妥之处,敬请批评指正,并将意见反馈给我们。 作者 2022年3月

more >
扫描二维码
下载APP了解更多

同系列产品more >

大数据分析——预测建模与评价机制

张聪、曹文琪、张俊杰、
定 价:89.90元

查看详情
文本挖掘与信息检索概论

蔡晓妍、杨黎斌、程塨、
定 价:49元

查看详情
Java语言程序设计(第4版)

张思民、康恺
定 价:59.80元

查看详情
大数据分析:Python爬虫、数据清洗...

黄源,蒋文豪,龙颖
定 价:59.80元

查看详情
大数据采集与预处理技术(HDFS+HBa...

唐世伟 田枫 盖璇 李学贵
定 价:59.90元

查看详情
图书分类全部图书
more >
  • 顺序渐进地从Python基础知识、数据分析与可视化基础到机器学习进行讲解。案例丰富、结构清晰、简单明了。适合作为本科高年级或研究生相关课程的教材,也适合作为工程技术人员的参考书。配套微课视频、教学课件、源代码等资源。
more >
  • 目录

    源码下载

    第1章Python语言与开发环境概述

    1.1Python语言的特点

    1.2Python的下载与安装

    1.3开始使用Python

    1.3.1交互方式

    1.3.2代码文件方式

    1.3.3代码文件的打开

    1.3.4代码风格

    1.4模块与库

    1.4.1模块及其导入方式

    1.4.2标准模块与第三方模块

    1.5使用帮助

    1.6Anaconda简介

    1.6.1Anaconda模块的安装

    1.6.2Spyder的使用

    1.6.3Jupyter Notebook的使用

    1.6.4Jupyter Notebook默认路径的设置

    1.6.5任意路径下创建Jupyter Notebook文件

    习题1

    第2章Python语言基础

    2.1控制台的输入与输出

    2.1.1数据的输入

    2.1.2数据的输出

    2.2标识符、变量与赋值语句

    2.2.1标识符

    2.2.2变量

    2.2.3赋值语句

    2.3常用数据类型

    2.3.1数值类型

    2.3.2布尔类型

    2.3.3常用序列类型

    2.3.4映射类型

    2.3.5集合类型

    2.4运算符与表达式

    2.4.1运算符分类

    2.4.2运算规则与表达式

    2.4.3条件表达式

    2.4.4复合赋值运算符

    2.5分支结构

    2.5.1单分支if语句

    2.5.2双分支if/else语句

    2.5...

精彩书评more >

标题

评论

版权所有(C)2022 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802013248号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘