首页 > 图书中心 >图书详情

数据科学理论与实践

国家级一流本科课程“数据科学导论”的配套教材,北京市优质本科教材,人大朝乐门教授编写。课件下载处为本书课件、大纲、源码。

作者:朝乐门
定价:79
印次:3-3
ISBN:9787302616351
出版日期:2022.12.01
印刷日期:2023.08.07

《数据科学理论与实践》(第3版)重点讲解数据科学的核心理论与代表性实践,在编写过程中充分借鉴了国外著名大学设立的相关课程以及全球畅销的外文专著,同时考虑了国内相关课程定位与专业人才的培养需求。内容包括数据科学的基础理论、理论基础、流程与方法、技术与工具、数据产品及开发、典型案例及实践和附录等。 《数据科学理论与实践》(第3版)的读者范围很广,可以满足数据科学与大数据技术、计算机科学与技术、管理工程、工商管理、数据统计、数据分析、信息管理与信息系统等专业的教师和学生(含硕士生和博士生)的教学与自学需要。

more >

第3版前言 本书为作者负责建设的国家级一流本科课程“数据科学导论”的配套教材。自第2版出版以来,已成为我国数据科学领域出版最早、影响力很大的经典教材之一,于2020年荣获“北京市高等学校优质本科教材”称号。本书第3版主要从以下5方面进行修订: (1) 实时更新知识内容。数据科学仍处于快速发展和迭代期,新理论和新实践不断涌现,而且有些理念与工具已经过时。为此,本版根据数据科学领域的理论与实践进展,更新、删减和补充知识点,力争教材具备更高的实用价值。例如,更新了Gartner数据科学及机器学习平台魔力象限、全球数据规模估计和预测数据、数据科学的发展史、非专业级数据科学家(Citizen Data Scientist)、数据科学项目中常见错误等内容; 新增了数据湖及湖仓一体化、统一分析(Unified Analytics)、数据管理原则、《中华人民共和国个人信息保护法》目录、《中华人民共和国数据安全法》目录、数据攻击和谷歌炸弹以及机器学习的可解释性等内容。 (2) 更加符合学习者的需要。根据相关高校教师的教材使用反馈,进一步优化教材结构与内容,使其更加符合课堂教学和自学的需要。同时,结合作者在中国人民大学开设的“数据科学导论”(本科)、“数据科学理论与实践”(硕士)、“信息分析前沿研究”(博士)三门课程,建设国家精品开放在线课程“数据科学导论”的教学经验以及在企事业单位担任首席数据科学家和参与部分高校数据科学专业建设的经验,并结合自己在数据科学与大数据技术领域的学术研究,对本书内容进行了调整与优化。例如,重写了机器学习部分的解读,补充了深度学习的知识,增减了部分章节。 (3) 对标世界一流大学的数据科学教材。自2012年以来,作者每年坚持调研世界一流大学的数据科学教材和课程建设现状,确保本书内容与世界一流大学数据科学课程的教材无缝对接,为我国相关专业的人才培养提供较为权威的参考方案。例如,补充了Drew Conway的数据科学维恩图的讨论及Jeffrey D.Ullman的改进; 重写了数据故事化部分; 重写了数据可视化的知识; 调整了CAP理论的解读; 补充了美国国防部数据战略框架的介绍; 新增了伯克森悖论(Burkson Paradox)以及机器学习中的性能与可解释性之间的矛盾的解读。 (4) 聚焦社会对数据科学人才的能力要求。从2015年开始,作者每年坚持跟踪调研数据科学领域的岗位面试题、用人单位招聘信息中的能力要求及岗位职责,并将调研结果及时吸收至本书内容之中。例如,加强了对数据驱动、特征工程、DevOps、数据误用、数据分析的能力和经验解读; 新增了Ghavami的八个分析法则、数据湖及湖仓一体化、非专业级数据科学家的能力要求以及大数据与数据科学领域的名人名言等实用性较强的内容。 (5) 同步更新本书配套资源。按照作者首次提出的“开源课程倡议”,在GitHub上建立配套社区,与同行老师共同维护课程资源,并重画了部分重要图表,更新了所有教学资源,使本书内容更加符合我国大数据人才培养的需求。 本书旨在系统讲解数据科学领域的经典理论与最佳实践,满足不同层次读者的需求。因此,建议读者结合自己的教学或学习需要,对本书进行定制使用,参考方案如表1所示。 表1本书的教学与学习建议 内容 导论类课程非导论类课程 非大数据类 专业大数据类 专业本科 低年级本科高年级 或硕士 第1章基础理论 √ √ √ √ 第2章理论基础 √ 第3章流程与方法 √ √ √ 第4章技术与工具 √ √ 第5章数据产品及开发 √ √ 第6章典型案例及实践 √ √ √ √ 注: 与数据科学相关的导论类课程有“数据科学导论”“大数据导论”“数据科学与大数据技术导论”等; 非导论类课程有“数据科学”“数据科学理论与实践”“数据科学原理与实践”“数据科学方法与技术”等; 常见的大数据类专业有数据科学与大数据技术、大数据管理与应用、大数据技术与应用和大数据分析等。 朝乐门 2022年8月18日

more >
扫描二维码
下载APP了解更多
图书分类全部图书
more >
  • 北京市优质本科教材;国家级一流本科课程、国家精品开放在线课程“数据科学导论”的配套教材;一本系统讲解全球范围内的数据科学的新理论与代表性实践的好书。
more >
  • 目录

    第1章基础理论

    1.1术语定义

    1.2研究目的

    1.3研究视角

    1.4发展简史

    1.5理论体系

    1.6基本原则

    1.7相关理论

    1.8人才类型

    习题

    参考文献

    第2章理论基础

    2.1数据科学的学科地位

    2.2统计学

    2.3机器学习

    2.4数据可视化

    习题

    参考文献

    第3章流程与方法

    3.1基本流程

    3.2数据加工

    3.3数据审计

    3.4数据分析

    3.5数据可视化

    3.6数据故事化

    3.7数据科学项目管理

    习题

    参考文献

    第4章技术与工具

    4.1数据科学的技术体系

    4.2MapReduce

    4.3Hadoop 

    4.4Spark

    4.5NoSQL与NewSQL

    4.6R与Python

    4.7数据湖与湖仓一体化

    4.8发展趋势

    习题

    参考文献

    第5章数据产品及开发

    5.1定义

    5.2主要特征

    5.3关键活动

    5.4数据柔术

    5.5数据能力

    5.6数据战略

    5.7数据治理

    5.8数据安全、隐私、道德与伦理

    习题

    参考文献

    第6章典型案例及实践

    6.1统计分析

    6.2机器学习

    6.3数据可视化

    6.4Spark编程

    6.52012年美国总统大选

    习题

    参考文献

    附录A本书案例的...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘