


定价:79.8元
印次:1-1
ISBN:9787302708858
出版日期:2026.04.01
印刷日期:2026.04.09
图书责编:王冰飞
图书分类:教材
"本书专注于健康大数据领域的深入探索,巧妙融合理论与实践,以Python为核心技术工具,全面而系统地介绍健康大数据分析与挖掘的基础理论、技术方法,同时提供了丰富的应用案例。全书共分为7章,涵盖健康大数据基本概念、数据采集和预处理、数据分析与挖掘、数据可视化及综合案例等内容。全书本着循序渐进、理论联系实际的原则,每个知识点均辅以典型实例,并通过心脑血管风险数据的分析与预警综合案例,完整呈现了从数据清理、集成、转换、统计分析到预测模型构建与优化的全流程,引导读者将理论综合运用于实践,以实现知识的巩固与技能的提升。 本书可作为高等院校大数据管理与应用、数据科学与大数据技术、计算机科学与技术等相关专业的教材,也可作为医学生入门数据分析与挖掘的教学用书或数据分析与挖掘爱好者的自学用书。 "
前言 在信息化和数字化高速发展的今天,数据已成为推动社会进步和科技创新的重要力量。尤其在医疗健康领域,随着医疗信息化程度的加深和智能医疗设备的普及,海量的健康数据正以前所未有的速度被收集、存储和分析。这些数据不仅包含丰富的个人健康信息,还蕴含着关于疾病预防、诊断、治疗和健康管理等方面的宝贵知识。如何有效地利用这些健康数据,挖掘其中的价值,为人口健康科学研究和临床决策提供有力支持,已成为当前大数据领域和医疗健康学界共同面临的重大课题。 本书得到了“国家人口健康科学数据中心”的鼎力支持。该中心是我国医药卫生、人口健康领域的国家科学数据中心。作为国内领先的健康数据管理与研究机构,该中心不仅拥有丰富的健康数据资源和先进的数据处理技术,还积极推动健康数据的开放共享和科学研究,支撑了由数据驱动的科技创新和人才培养。在本书的编写过程中,该中心不仅提供了宝贵的健康数据案例,还资助了相关的研究专项,使得本书能够深入剖析健康数据分析的实际应用,揭示数据背后的科学规律。 本书旨在通过具体的健康数据案例,展示数据分析与挖掘技术在医疗健康领域的应用实践,为相关领域的研究者和从业者提供一套系统、实用的方法和工具。Python语法简洁,在数据采集、分析和可视化等方面均有成熟的扩展库,可高效完成数据统计分析、数据挖掘、可视化等任务,是目前数据分析与挖掘、机器学习和人工智能等领域广泛应用的一门编程语言。 本书基于Python语言,聚焦于健康大数据的分析挖掘和案例应用,全面系统地介绍了数据分析与挖掘的基本概念、方法和相关技术。 全书共7章。第1章介绍健康大数据...
目录
第1章健康大数据分析与挖掘概述
1.1健康大数据
1.1.1健康大数据的概念
1.1.2健康大数据的采集与管理
1.1.3健康大数据使用中的伦理问题
1.1.4相关问题的应对策略
1.1.5健康大数据的应用
1.2数据分析与挖掘
1.2.1数据分析与挖掘的基本流程
1.2.2健康大数据分析
1.2.3数据挖掘技术的应用
1.3本章小结
习题1
第2章大数据采集
2.1大数据采集概述
2.1.1大数据采集的概念
2.1.2大数据采集方法
2.1.3大数据采集平台
2.2大数据来源
2.2.1大数据的主要来源
2.2.2健康大数据来源
2.2.3心脑血管数据集来源及介绍
2.3网络爬虫技术
2.3.1网络爬虫概述
2.3.2常用网络爬虫技术
2.3.3网页数据的采集
2.3.4网页数据采集实例
2.4网络爬虫工具
2.4.1Googlebot爬虫
2.4.2八爪鱼采集器
2.4.3火车头采集器
2.4.4GooSeeker
2.5数据抽取技术
2.5.1数据抽取概述
2.5.2数据抽取工具
2.5.3网页数据抽取
2.6案例——公共健康大数据采集
2.7本章小结
习题2
第3章数据预处理
3.1数据预处理概述
3.2数据集成
3.2.1数据集成概述
3.2.2数据集成的主要方法
3.2.3数... 查看详情





