首页 > 图书中心 >图书详情

数据分析实战——90个精彩案例带你快速入门

"循序渐进,从实战案例深入浅出地讲解数据分析理论 从基础知识、核心概念到实例应用,90个案例带你了解数据分析师真实面对的问题 "

作者:汝思恒
丛书名:计算机技术开发与应用丛书
定价:59
印次:1-1
ISBN:9787302660712
出版日期:2024.06.01
印刷日期:2024.05.22

数据分析是现在不仅在互联网行业同时也在基础行业中必不可缺的运营手段,是业务提升效率、增强收益的有效方法。 本书的前8个章节精选提炼了多种数据分析中重要方法,包括ROI分析、数据标签和评分、用户生命周期、因果推断、可解释模型、PSM理论、ABtest、时序分析等,并通过更清晰、简单的方式向读者全方位的展示数据分析在以下诸多原理上的阐释,并且针对每种方法都提供了充足的生活和业务中的前沿案例作为辅助讲解,帮助读者更好的理解数据分析在传统行业、互联网行业及各类新兴行业的实际应用,同时也能更快的运用在实际工作和生活中,所以通过阅读前8个章节,读者可以系统的学习数据分析的理知识,拥有数据化思维,为读者能够在数据分析行业中不断深耕打下良好的理论基础并将数据分析能力逐步应用于实际的工作和生活中,成为一名合格的数据分析师。 本书适合从事需要掌握数据分析技能的行业,数据分析相关专业的在读学生,入门数据分析行业的相关从业人员,以及已有自己本职工作,但仍需要学习数据分析能力来提升自己的职业技能和职场竞争力的相关行业从业者阅读。

more >

前言 如今现代社会生活中的方方面面都跟数据息息相关,如超市货架的物品摆放逻辑、互联网各平台的广告投放或者企业运营状况等都需要数据分析,所以数据分析本质上是一种解决问题的方法。一次完整的数据分析方案,应得出对应的结果并给出指导决策、解决对应问题的方法,而不是单纯的数据描述。 本书第1~8章为读者讲解数据分析相关知识,第9~11章帮助读者更好地展示自己的分析结果,所以后3章分别对数据分析的可视化、数据分析报告的撰写方法、数据分析的常用工具进行了详细介绍,主要帮助尚在入门阶段的读者学会如何将自己的数据化思维和思考结论输出为可视化的图标或者通俗易懂的数据报告,帮助自己的相关业务方或上级领导甚至公司的战略层、决策层更好地理解数据分析所得出的结论、优化建议及对未来的预测指引。 什么是数据分析 数据分析是通过收集大量与问题相关的数据进行分拆解析,提取出有用的信息,进而推导出问题的结论,是对数据进行详细研究和总结的过程。数据分析的目的是通过各种分析手段把隐藏在数据中的信息提炼出来,找到数据间的内在规律,并让它成为对解决问题有帮助、有价值的东西。在现代的商业社会中,数据分析帮助企业的每条业务线从0到1地进行发展,并帮助各类组织或企业把控整个运营经营状况。 数据分析从时间维度上可以分为3种类型。 1. 描述性分析 描述性分析主要通过对历史数据的统计和总结,得出过去一段时间里业务运营情况的好坏。通过各种核心指标的完成情况,去衡量过去业务运营情况的状态,以此看清过去哪些行为需要优化,哪些行为需要深耕。这种分析既有相对长期的以总结形式进行的,例如服装公司的一个财年过去了,想要知道过去一年里的经营情况,公司就需要从各种数据维度去拆解公司不同业务的经营情况,常见的例如销售额、销量、滞销量、利润额、资金周转效率等,通过这些数据衡量每条业务的好坏; 也有短期的以复盘形势进行的数据分析,例如大型商场在“双十一”期间做活动优惠大酬宾,所有商品的价格一律打9折,并且每笔消费获得的积分可以在下次购物时直接抵扣。现在“双十一”过去了,业务需要通过数据分析来知道打9折活动的效果如何,发给用户的积分有没有获得相应的收益。像这样一类了解数据情况的分析工作都被称为描述性分析。 2. 现状分析 准确来讲,现在发生了什么一般会有实时的数据监控,但数据监控的过程除了初期设定需要监控的核心指标外,在业务进行的目前并不需要进行额外的数据分析工作,但是当某个现状发生或者出现异动时,需要通过数据分析去回答它为什么会发生,这种现状分析也叫归因分析。例如今天饭馆营业额为什么上升了,服装店衣服销量为什么上升了,网站访问量为什么突然暴涨,放到更宏观一点的环境中,电商直播行业为什么在零售行业的比重越来越大,年度GDP为什么稳步提升,这些问题都可以通过现状分析来回答。 还是用战争时期德国发面包的示例举例,假如政府派发给工厂的任务是为民众提供面包,并没有要求工厂所做面包的质量如何,仅仅要求需要满足民众的日常饮食需要。实际上这样的情况很常见,尤其在供应链的链条中可能涉及很多不同行业的合作,生产面包的工人不懂生产面粉的情况,也不懂生产包装的情况,而作为政府方可能更不知道链条中各厂家的情况,因此也会有专门的研究员从后验的角度去分析供应情况。假如现在有100个面包,想要知道大多数面包的质量为多少克,假设面包质量在400g左右可以满足日常需求,就会假设面包的质量可能是400g,那么出现380g的面包就应该是个概率很小的事件,先假设大多数面包的质量在380g以上,备择假设就是大多数面包的质量不在380g以上。样本抽样20个面包。进行结果检验,如果有10个面包的质量大于380g,则p=0.5,假设成立。也就是说,面包大多数大于380g; 如果只有一个面包的质量大于380g,则p=0.05,假设不成立。 3. 预测分析 很多时候数据分析最核心的价值就体现在预测分析上,预测分析也往往需要基于描述性分析和现状分析,在充分了解了业务的历史和目前的运营现状之后,通过数据分析可以对业务的发展趋势做出或短期或长期的预测,并且以预测结果为基础制定合理的运用目标、有效的运营策略,以此保障业务的稳定发展。例如做食品生鲜行业的企业通过对过去业务运营情况及整个市场的分析,发现了在冷链技术越来越成熟的目前,更多的营销额从线下转到了线上,并且本企业的业务也同样呈现出这个趋势,按照这个趋势预测,明年生鲜行业的线上份额会持续扩大,为了占据更多市场份额,因此公司需要提前做好布局线上的准备,并把提升线上营业额的目标作为下一年度的核心运营指标; 当然也有短频的预测分析,例如网店同期上架了一批新品,通过一定时间的测试后,预测其中一个商品从点击率、客服咨询率、收藏、加购等多个数据维度,出现了具备成为爆品的潜力,那么在接下来的一段时间里面,需要从各方面通过运营手段把该商品成功引爆,当然这样的预测性分析在供应链、股票行业中更为常见。 什么是数据分析师 回答数据分析是干什么的,并不代表回答了数据分析师是干什么的。数据分析是数据分析师工作的主要内容,但并不是全部,除了数据分析之外,数据分析师在数据分析前和数据分析后都有很多事情要做,下面会逐一拆解。 1. 明确问题 如果说数据分析工作是以某个具体问题为起点,以解决问题为目标进行工作的,则数据分析师有一个重要的工作,就是找出问题。在企业中,数据分析师通常是去承接来自其他业务方的数据分析问题的,这样的问题也分为显性的问题和隐性的问题。显性的问题,例如业务方关心今天总支付金额(GMV)为什么上涨了?昨天的支付用户数为什么下降了?这样比较直接的问题每天都会发生,数据分析师要做的也是比较直接的数据分析。但也有一些隐性的问题,例如业务方只是想提升新用户对产品的转化率,但他并不知道应该去提升哪一方面; 又或者业务方提出了一个自己认为想要关心的指标,但和他想解决的问题其实没有根本联系,在这种过程中数据分析师的作用是通过数据的分析逻辑,找到问题的根本,并帮助业务方明确他真正需要的数据分析结果。 2. 数据提取 在大部分实际的业务场景中,即使明确了想要分析的问题,也不一定能够用来进行数据分析,例如数据体量不够或者没有相应的数据获取渠道。在大部分公司,即使是大公司,数据基建都不会是完全健全的,并且对应实际想要解决的问题应该用什么口径的数据是正确解决问题的先决条件,所以很多时候我们在分析之前需要对数据进行预处理,例如数据的格式、类型或需要对数据进行转换,这些都是做一个完整数据分析前的必备工作。 3. 分析总结 在数据分析过程中,数据分析师会应用很多数学方法、统计学方法来得到分析结果,但这样的分析和结果对应到实际业务层面需要说明什么,也就是从分析语言到业务语言的转换也是数据分析师的必修课。业务方很多时候没有充足的数学知识来理解数据分析过程中的处理方法,因此在分析总结及呈现时,使用业务方能理解的语言来呈现分析结果也是必要的。 4. 制作报表、可视化 通过一次或一系列的数据分析后,业务上经常会形成一些可以进行长期观察的数据指标,这些指标需要周期性地进行查看、更新和维护,但是并不是每次需要看时都进行一次完整的数据分析,因此数据分析师会把这些数据形成报表或者可视化的图表进行例行监控,以便更直观地觉察数据指标变化的情况。 数据分析行业现状 数据分析经过十来年的发展慢慢地开始出现细分演变,分成了数据分析师(Data Analyst,DA)、数据科学(Data Scientist,DS)、数据工程师(Data Engineer,DE)三大方向。DA更加贴近业务,很多时候是跟运营团队划分在一起,从而解决具体的业务上的分析问题,并且向后会朝数据运营或者数据产品的方向发展,渐渐地变成以数据能力为基础,更多地去把控业务的角色; DS则更偏向于数据团队,在技能上DS除了需要具备统计学知识和数据分析能力之外,还要求掌握一些算法模型并且具备一定的编写代码(Coding)的能力,在目前的互联网行业中,很多业务发展到了后期会期望产品具有“千人千面”或者个性化推荐的能力,而这一切的背后都是算法模型在推动,除了本身专业的算法团队以外,一个懂得算法的DS可以从离业务更近的角度去做出更贴近业务的模型; DE其实有更多细分,例如做数据架构的及做数据仓库的等,这些更偏技术能力一些,也是一些数据分析师在工作一段时间后发现还是写代码快乐。在目前的前沿行业(例如互联网、金融、供应链)中越来越多的业务需要算法、数据模型的支持,所以DS会是接下来一段时期数据分析发展方向的主流,这也意味着当今的数据分析师需要掌握更多的高阶分析方法和数据模型。 最后,希望读者能够通过本书,系统化地掌握数据分析基本功,形成数据化思维,通过理论与实际的结合,熟练地运用数据分析技能,同时输出可落地可执行的专业数据分析报告。 汝思恒2024年4月

more >
扫描二维码
下载APP了解更多

同系列产品more >

后台管理系统实践——Vue.js+Expre...

王鸿盛
定 价:119元

查看详情
Python语言实训教程(微课视频版)

董运成 主编,刘晓亚、
定 价:59元

查看详情
编译器之旅——打造自己的编程语言...

于东亮
定 价:59元

查看详情
Kubernetes API Server源码分析与...

张海龙
定 价:89元

查看详情
公有云安全实践(AWS版·微课视频版)...

陈涛、陈庭暄
定 价:79元

查看详情
图书分类全部图书
more >
  • 汝思恒,南京大学数学基地班保送生,先后入职国内知名互联网企业,包括字节跳动、遥望、由莱等公司;参与多个从0到1创业孵化项目,并帮助业务进入赛道正规;阿里巴巴公司数据营销方向特邀讲师。

  • 实用的行业大厂数据分析技巧,ROI、Label、LTV、ABtest、因果推断、PSM、时序分析;超全的应用方法论带你了解数据分析师真实面对的问题;教授如何做数据可视化、写数据分析报告、使用数据分析工具。

more >
  • 目录

    第1章ROI: 值得做还是不值得做

    1.1浅层ROI

    1.1.1案例1: 活动拉新ROI

    1.1.2案例2: 吃早餐的ROI

    1.1.3案例3: 地摊零售ROI

    1.1.4案例4: 《囧妈》决策的ROI分析

    1.1.5案例5: 淘宝私域引流ROI情况

    1.2深层ROI

    1.2.1案例6: 综艺直播ROI测算

    1.2.2案例7: 摆地摊的ROI测算

    1.2.3案例8: 广告投放中的ROI测算

    第2章标签与评分: 千人千面的基础

    2.1数据分析对象的有效标签

    2.1.1案例9: 信贷公司用户画像

    2.1.2案例10: 美妆产品用户画像

    2.2标签的组合与量化

    2.2.1案例11: 外卖员画像

    2.2.2案例12: 店铺评分系统

    2.2.3案例13: 层次分析法

    2.2.4案例14: 层次分析法应用

    第3章用户分层与生命周期: 业务服务的是一个人及他整个“一生”

    3.1用户生命周期N种分层方式

    3.1.1案例15: 店铺用户生命周期分层

    3.1.2案例16: 平台用户生命周期分层

    3.2用户生命周期中的无限可能性

    3.2.1案例17: 用户分层四象限法

    3.2.2案例18: 用户生命周期分层

    3.2.3案例19: 中国移动的用户生命周期分层运营

    3.2.4案例20: 用户生命周期划分方法

    3.2.5案例21: 用户召回

    第4章因果推断: 种瓜得瓜,种豆得豆

    4.1因果推断原理 ...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘