前言
在智能传播时代,人们的日常生活深深嵌入网络之中,几乎所有的社会互动和个体活动都在某种程度上留下了数字踪迹。在线上,从信息搜索、购物消费到媒体互动;在线下,从外出旅行、学习培训到娱乐活动,产生的所有信息都以数据形式被记录并存储,从而形成庞大而复杂的数据生态系统,构成全面而多元的基础信息库。这些行为数据具有丰富性和实时性,正在改变社会科学研究范式,并催生了“计算社会科学”这一研究领域。
大数据时代的崛起,为社会科学研究者提供了新的研究方法和研究途径,研究者能够更加深入地挖掘庞大而又复杂的信息流,揭示其中蕴含的规律,预判未来的发展趋势。从信息采集、处理到知识提取,大数据技术以前所未有的广度、深度以及收集和分析数据的能力,改变了我们获取信息的方式,更为我们理解社会现象提供了全新的认知途径。大数据时代给社会科学研究者带来了前所未有的机遇,提高了理论创新的可能性,但也给社会科学研究者带来了巨大的挑战。数据的庞大、多样和实时性既要求社会科学研究者掌握先进的数据处理和分析技能,又要求社会科学研究者发展新的理论框架和方法论,从而更深刻、全面地理解和解释这些数据。这就对传媒专业的学生培养提出了新的要求。在海量信息时代,传统的研究方法已经不能满足高效处理庞大数据集的需求,传媒专业的学生需要掌握并能运用先进的计算方法,从庞杂的媒体数据中提炼出有价值的信息,以便开展新闻报道、深度分析、广告投放、公关策略优化等实务工作。此外,传媒专业的学生还应能在理论层面理解大数据改变信息生产和传播的过程,从而推动传媒研究趋向于数据驱动,为学科的深度发展创造新的契机。
本书是传媒专业的研究方法类课程教材,一方面侧重技术细节,致力于用浅显和简单的语言介绍复杂的计算方法;另一方面侧重计算方法在新闻传媒研究中的实际应用,以便于读者学习如何将计算方法应用于社会实践和理论创新。本书以大数据分析技术为线索,每章介绍一种方法,包括大数据的获取、文本分析、情感分析、聚类分析、主题模型、机器学习、自动文本分析、社会网络分析、语义网络分析、虚拟仿真等。除了
“第1章 大数据的获取”以外,其他章的编写思路都是先介绍技术原理,再通过数据案例介绍技术操作流程,最后选取若干篇研究案例,介绍相关技术原理在新闻传播学研究中的主要应用。
本教材的知识框架和知识内容基于本人的课堂教案,感谢我的学生蔡文怡、赖咏晴校对教材内容并进行格式调整,感谢我的学生文湘婧、王皎(第1章)、陈辰(第2章)、杨雅坤(第3章)、王昱瑾(第4章)、蔡文怡(第5章)、赖咏晴(第6章)、董晨曦和吴洋洋(第7章)、凌觐如(第8章)、耿珂欣(第9章)、张金(第10章)帮助收集资料并凝聚成初稿。
此次书稿得以成书出版,还得益于苏州大学传媒学院给予的大力支持和我的导师清华大学沈阳教授提供的宝贵指导意见,在此表示衷心的感谢。
限于作者水平,书中不足之处在所难免,敬请读者批评指正。反馈邮箱:shim@tup.tsinghua.edu.cn。
罗茜
2023年12月