智能数据工程
一本全面的、系统的、专业的、经典与前沿技术相结合的智能数据工程教材。

作者:岳昆、段亮、武浩、吴鑫然

丛书名: 高等学校智能科学与技术/人工智能专业教材

定价:49.8元

印次:1-1

ISBN:9787302682615

出版日期:2025.03.01

印刷日期:2025.03.20

图书责编:张玥

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

"本书以“数据管理—数据挖掘—知识发现”为主线,将智能数据处理及分析的理论方法与Python程序实现相结合。作者开发了基于Git的在线编程平台和案例库,旨在构建智能数据工程“思想—模型—技术—实现”四位一体的知识学习框架。本书围绕数据处理及分析的典型任务,从不同类型数据的特点出发,介绍架构、模型及算法,注重智能数据处理及分析理念的传递。 本书介绍智能数据工程的经典方法和前沿技术,包括数据管理篇、数据挖掘和智能分析篇、知识表示和知识推理篇三部分。数据管理篇(第1~3章)介绍关系数据库查询优化、经典信息检索、数据组织和架构技术;数据挖掘和智能分析篇(第4~7章)介绍高维数据挖掘、视觉数据分析、文本数据分析和图数据分析技术;知识表示和知识推理篇(第8~9章)介绍知识图谱和贝叶斯网模型及相应的知识推理技术。 学习本书,读者需要具有计算机程序设计、数据库技术、深度学习的基础知识,以及使用开源平台的基本能力。本书可作为计算机和电子信息类相关专业研究生、高年级本科生数据工程、人工智能或机器学习等相关课程的教材,也可作为数据科学及人工智能等相关学科研究和开发人员的参考书。教师可根据学生类别、课程性质、学分设置和学习目标选择不同篇(或章)开展教学。"

岳昆,男,43岁,博士,云南大学信息学院副院长、教授、博士生导师,云南省智能系统与计算重点实验室主任。云南省高等教育计算机类专业教指委主任,云南大学学术委员会委员、计算机科学与技术学科带头人、国家级一流本科负责人,云南省中青年学术和技术带头人,云南省万人计划青年拔尖人才,云南移动-云南大学“5G+AI”联合实验室主任,中国人工智能学会理事,中国人工智能学会不确定性人工智能专委会副主任委员、人工智能基础专委会委员,中国计算机学会数据库专委会委员,全国人工智能/智能科学与技术教材编委会委员,信息技术新工科产学研联盟第一届理事会理事。从事大数据知识工程、贝叶斯深度学习、知识图谱等方向的研究,主持国家级、省部级科研项目20余项,国内外权威期刊及会议上发表论文100余篇,授权职务发明专利17项。

前言 随着数据处理、互联网和人工智能技术的快速发展和迅速普及,当代计算机学科发生了深刻变化,即“以计算为中心”转变到“以数据为中心”。随着新一轮科技革命和产业变革深入推进,智能数据处理及分析技术在科学研究、工业生产、社会治理等领域中发挥着不可替代的作用,成为发展人工智能新质生产力的重要技术基础。同时,日益迫切的数据密集型科学研究、各行各业的数字化转型需求,也促进了数据库、数据科学、人工智能等围绕数据和知识两个要素快速发展、持续演进和交叉融合。 针对智能数据处理及分析任务的模型构建、算法设计、分析比较、编程实现能力,是计算机和电子信息类相关专业研究生及高年级本科生必备的重要能力,反映了学生解决复杂工程问题、建立有效解决方案、应用信息技术对实际问题进行建模和求解的必要素养。相关学科领域交叉渗透加剧,培育学生数据思维、算法思维、编程思维的要求日益提高,智能数据工程的内涵不断演进、外延日益丰富,相关课程具有较强的工程性,教学方式也逐步从“由原理到技术”向“原理与技术相协同”转变,对课程的教学内容和教学模式提出了新的要求。 培养学生解决复杂工程问题能力的迫切需求与智能数据工程相关课程的内容设置和教学模式之间,仍存在不同学习阶段知识点重复或不衔接,数据管理与组织、数据挖掘与分析、知识发现与推理的教学内容缺乏系统性,经典方法与前沿技术、理论模型与编程实践结合不紧密等问题。一方面,智能数据工程知识的学习,需要面向实际需求,从不同组织形式或不同模态数据的特点出发,掌握经典的模型和算法,把握其基本理念和求解问题的一般思路;另一方面,不同层次的读者,对智能数据工程知识的学习需求也有很大...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1篇数据管理篇

第1章关系数据库查询优化3

1.1关系数据库查询优化概述3

1.2基数估计4

1.2.1基数估计概述4

1.2.2传统基数估计5

1.2.3基于机器学习的基数估计12

1.3思考题22

第2章信息检索24

2.1信息检索概述24

2.1.1信息检索的概念24

2.1.2信息检索的基本原理25

2.1.3信息检索相关学科和研究内容26

2.2信息检索模型28

2.2.1信息检索系统的形式表示28

2.2.2布尔模型29

2.2.3向量空间模型29

2.3文本信息检索33

2.3.1词汇的频率与数量分布规律33

2.3.2文本信息预处理34

2.3.3文本信息的倒排索引35

2.4Web信息检索39

2.4.1Web信息搜索的概念和工作原理39

2.4.2搜索引擎中的网页去重技术41

2.4.3搜索引擎中的结果排序技术43

2.5信息检索评价指标49

2.5.1单个查询的评价指标49

2.5.2多个查询的评价指标51

2.5.3面向用户的评价指标52

2.6思考题53

第3章数据组织和架构55

3.1数据组织概述55

3.2数据仓库56

3.2.1数据仓库的基本特征56

3.2.2从操作型系统到信息型系统57

3.2.3数据仓库体系结构57

3.3数据湖63

3.3.1数据湖概述63

3.3.2数据湖与数据中台64

3.3.3数据湖体系结构65

3.3.4Apache Hudi简介68

3.4向量数据库71

3.4.1向量数据库概述71

3.4.2向量数据...

"1、编写理念新颖
以“数据管理-数据挖掘-知识发现”为主线,将智能数据处理及分析的理论方法与Python程序实现相结合,提供智能数据工程“思想-模型-技术-实现”四位一体的知识学习框架,培养学生的数据思维、算法思维和编程思维。各章围绕数据处理及分析的典型任务,从不同类型数据的特点出发,介绍架构、模型及算法,注重智能数据处理及分析理念的传递。

2. 内容系统全面
数据管理篇介绍以基数估计为代表的关系数据库查询优化技术,经典信息检索模型和Web信息检索技术,数据仓库、数据湖和向量数据库这三种数据组织方式及相关技术;数据挖掘和智能分析篇介绍高维数据的降维、分类和聚类挖掘技术,围绕目标检测、图像分割和视频目标跟踪的视觉数据分析技术,围绕语言模型、情感分析和机器翻译的文本数据分析技术,围绕节点分类、链接预测和社区发现的图数据分析技术;知识表示和知识推理篇介绍知识图谱构建、嵌入和推理技术,以及贝叶斯网构建和推理技术。

3、教学资源丰富
针对智能数据处理及分析的各类任务,给出问题背景、模型思想、核心算法,读者扫描书中的二维码即可观看演示动画。配套教学课件和习题参考答案,读者可从清华大学出版社网站下载。还配套了在线编程平台、示例程序和自测练习,读者可免费使用,为学生提供即学即用的实践环境。

4、读者覆盖面广
紧跟“以数据为中心”的计算机学科发展趋势,适应数据库、数据科学、人工智能等多学科交叉融合背景,可作为计算机和电子信息类相关专业研究生、高年级本科生数据工程、人工智能或机器学习等相关课程的教材,可根据学生类别、课程性质、学分设置和学习目标选择不同篇(或章),也可作为数据科学及人工智能等相关学科研究和开发人员的参考书。

"