本作品为2023年第十四期北京大学可视化发展前沿研究生暑期学校系列作品之 9 – 春晚可视化。从数千条原始数据中,小组成员抽丝剥茧,寻找那些隐藏在数字背后的故事,春晚不仅仅呈现为一场文艺盛会,更像是一面镜子,映射着人们的向往与社会的繁荣。
引言
对于许多中国家庭而言,春晚不仅仅是一个节目,它是一代又一代人共同的记忆与情感纽带。从丝竹之韵到当代歌舞,春晚不仅仅是年夜的欢乐,它横跨经典传统与现代,记录着变革的历程与人民生活水平的变化。每一年的春晚,都是一个关于中国社会、文化、和情感的缩影,要理解和感受春晚与中国社会变迁的联系,仅凭借观看方式远远不够。可视化可以捕捉和呈现春晚的数据和信息,更加直观地呈现春晚发展中的故事和趋势。小组希望从时间变化的角度观察春晚,既是对春晚的一种致敬,更是对中国春晚文化的一次探索与再现。
数据收集与整理
小组对维基百科中春晚的数据列表进行爬取。获取到了历年春晚的主持人、导演名称、首播时间、播出时间、届数、在线播放平台、节目序号、节目类别、节目名称、演出单位、表演者等超千条数据。数据中有大量错误、缺失,小组成员对春晚数据集的超过千条数据进行清洗、校对,并结合节目表演形式进行聚类,最终获得了四个维度的数据:歌舞类,如合唱、独唱、舞蹈等;表演类,如武术、魔术、杂技等;语言类,如小品、相声、朗诵等;曲艺类,如京剧、戏曲、黄梅戏等。之后进行数据清洗,通过分词、停用词过滤出表演者列表。
可视化目标
本作品以春晚节目单数据为切入点,通过可视化信息图的形式向读者展示春晚四十年的变与不变,从参演人员的出场频次,到分会场地域分布,再到节目类型及数量占比,以时间为脉络勾勒出一幅春晚历程全局图,并辅以交互设计帮助读者根据自身兴趣探索数据细节、发现结论。
可视化与交互设计
最终的可视化如下图1所示。

图1

图2
主视图(图2)以时间为脉络、节目类型为联系采用散点图和柱状图相结合的形式分别展示了春晚40年参演人员以及节目数量、类型的分布情况。当用户在图表上按年份选择时,图表会以当年年份为中心重新排列,将当年的节目类型、节目数量、参演人员参演了什么类型的节目一一对应。当鼠标悬停在上方图表的某一色块时,会显示出当前年份(纵轴)内演员(横轴)参演的节目名称及具体类型。当鼠标悬停在下方图表的某一色块时,会高亮突出显示出当年每种类型节目的具体数量。通过这种交互方式,用户可以轻松地将时间、演员和节目类型中的内容相互对应,从而更好地发掘时间角度上的春晚变迁。

图3
如图3,除北京主会场外,春晚在40年间还在广东、上海等省市设立过分会场,通过地图上地区的颜色深浅映射分会场设立的频次。

图4
如图4,结合时代发展特征与时政阶段,以5年为一阶段统计了历届春晚节目单的高频词,从而以小见大清晰地反映每个时代的语言风格以及社会特征。

图5
如图5,以传统泼墨山水元素为基础,对各类节目的总数进行表征,沿用主视图的四种基本色来代表不同类型的节目。山的高度用来映射各类节目的总数。
结语
春晚与时代同行,数据见证了春晚与中国社会的蓬勃发展。春晚不仅是中国人情感的纽带,更是记录着时代脚步的历史卷轴。从初步的数据爬取、清洗到最终的视觉呈现,每一步都是对春晚历史的重新审视。从数千条原始数据中,小组成员抽丝剥茧,寻找那些隐藏在数字背后的故事,春晚不仅仅呈现为一场文艺盛会,更像是一面镜子,映射着人们的向往与社会的繁荣。
课程设计:《春晚可视化》
小组成员:孙世杰 北京邮电大学,曹俊翔 上海交通大学,赵丹宁 中视前卫 ,张济彬 武汉理工大学
指导老师:袁晓如 北京大学、徐瑞鸽 雪城大学
暑期学校优秀课程设计将陆续收录在可视化看中国网页:

https://vis.pku.edu.cn/vis4china
暑期学校网页:

可视化与可视分析实验室欢迎各方面合作,有兴趣者联系 xiaoru.yuan[at]pku.edu.cn
0 条评论。