





作者:朝乐门
定价:79元
印次:3-4
ISBN:9787302616351
出版日期:2022.12.01
印刷日期:2024.07.19
图书责编:刘向威
图书分类:教材
《数据科学理论与实践》(第3版)重点讲解数据科学的核心理论与代表性实践,在编写过程中充分借鉴了国外著名大学设立的相关课程以及全球畅销的外文专著,同时考虑了国内相关课程定位与专业人才的培养需求。内容包括数据科学的基础理论、理论基础、流程与方法、技术与工具、数据产品及开发、典型案例及实践和附录等。 《数据科学理论与实践》(第3版)的读者范围很广,可以满足数据科学与大数据技术、计算机科学与技术、管理工程、工商管理、数据统计、数据分析、信息管理与信息系统等专业的教师和学生(含硕士生和博士生)的教学与自学需要。
中国人民大学副教授,博士生导师;国家级一流本科课程、国家精品在线开放课程《数据科学导论》负责人;中国计算机学会信息系统专委员会委员、中国软件行业协会中国软件专业人才培养工程专家委员、全国高校人工智能与大数据创新联盟专家委员会副主任、全国高校大数据教育联盟大数据教材专家指导委员会委员;获得北京市中青年骨干教师、国家自然科学基金项目优秀项目、国家留学基金管理委员会-IBM中国优秀教师奖教金、全国高校大数据教育杰出贡献奖、IBM全球卓越教师奖、中国大数据学术创新奖、中国大数据创新百人榜单、数据科学50人、全国高校人工智能与大数据学术创新奖等多种奖励30余项。主持完成国家自然科学基金、国家社会科学基金等重要科学研究项目10余项;参与完成核高基、973、863、国家自然科学基金重点项目等10余项。朝乐门是我国第一部系统阐述数据科学理论与实践的重要专著《数据科学》(清华大学出版社)的作者,另著有图书《数据科学理论与实践》。
第3版前言 本书为作者负责建设的国家级一流本科课程“数据科学导论”的配套教材。自第2版出版以来,已成为我国数据科学领域出版最早、影响力很大的经典教材之一,于2020年荣获“北京市高等学校优质本科教材”称号。本书第3版主要从以下5方面进行修订: (1) 实时更新知识内容。数据科学仍处于快速发展和迭代期,新理论和新实践不断涌现,而且有些理念与工具已经过时。为此,本版根据数据科学领域的理论与实践进展,更新、删减和补充知识点,力争教材具备更高的实用价值。例如,更新了Gartner数据科学及机器学习平台魔力象限、全球数据规模估计和预测数据、数据科学的发展史、非专业级数据科学家(Citizen Data Scientist)、数据科学项目中常见错误等内容; 新增了数据湖及湖仓一体化、统一分析(Unified Analytics)、数据管理原则、《中华人民共和国个人信息保护法》目录、《中华人民共和国数据安全法》目录、数据攻击和谷歌炸弹以及机器学习的可解释性等内容。 (2) 更加符合学习者的需要。根据相关高校教师的教材使用反馈,进一步优化教材结构与内容,使其更加符合课堂教学和自学的需要。同时,结合作者在中国人民大学开设的“数据科学导论”(本科)、“数据科学理论与实践”(硕士)、“信息分析前沿研究”(博士)三门课程,建设国家精品开放在线课程“数据科学导论”的教学经验以及在企事业单位担任首席数据科学家和参与部分高校数据科学专业建设的经验,并结合自己在数据科学与大数据技术领域的学术研究,对本书内容进行了调整与优化。例如,重写了机器学习部分的解读,补充了深度学习的知识,增减了部分章节。 (...
目录
第1章基础理论
1.1术语定义
1.2研究目的
1.3研究视角
1.4发展简史
1.5理论体系
1.6基本原则
1.7相关理论
1.8人才类型
习题
参考文献
第2章理论基础
2.1数据科学的学科地位
2.2统计学
2.3机器学习
2.4数据可视化
习题
参考文献
第3章流程与方法
3.1基本流程
3.2数据加工
3.3数据审计
3.4数据分析
3.5数据可视化
3.6数据故事化
3.7数据科学项目管理
习题
参考文献
第4章技术与工具
4.1数据科学的技术体系
4.2MapReduce
4.3Hadoop
4.4Spark
4.5NoSQL与NewSQL
4.6R与Python
4.7数据湖与湖仓一体化
4.8发展趋势
习题
参考文献
第5章数据产品及开发
5.1定义
5.2主要特征
5.3关键活动
5.4数据柔术
5.5数据能力
5.6数据战略
5.7数据治理
5.8数据安全、隐私、道德与伦理
习题
参考文献
第6章典型案例及实践
6.1统计分析
6.2机器学习
6.3数据可视化
6.4Spark编程
6.52012年美国总统大选
习题
参考文献
附录A本书案例的...