Final Project

注意 重要时间点:
  • 2023/10/08 23:59:59 之前确定课程设计选题。
  • 2023/12/13 23:59:59 之前提交初步数据分析报告。
  • 2023/12/17 23:59:59 之前提交初步设计报告。
  • 2024/01/10 课程设计答辩。
  • 期末展示 
  • 时间:2024/01/10,具体时间待定
  • 地点:待定

  • 选题指导

    在期末课程设计中,同学们分成小组(不超过四个人),选定一个主题,结合本学期所学的可视化知识与方法,设计并实现一个在线可视化系统,完成数据分析、故事叙述或艺术展示等任务。构建的可视化系统需要能够以网页形式运行。期末时,每个小组需要对课程设计项目进行汇报,并提交总结报告。
  • 请在10月08日23:59之前完成分组并选题,并将分组情况填入课程群中公布的在线文档中。
  • 在分组列表中,每组的第一位同学为组长,组长负责发送邮件和提交各项作业材料。
  • 设计实现时应检索是否已有类似工作,避免出现雷同的现象。
  • 如果同学们对候选主题以外的主题感兴趣,请在课间或通过邮件与老师讨论,征得老师同意后,方可选择自定主题。(有意向的小组在讨论产生结果之前,可以暂缓表格中主题填写)


  • 初步数据分析报告

    关于课程设计的初步数据分析报告,包括以下内容:
    1. 摘要
    介绍任务背景,介绍针对什么数据做什么分析。
    2. 数据分析
    介绍数据、数据类型、数据包含的维度、各个维度之间的关系等等。数据的初步探索,介绍通过统计方法从中获得的见解。
    3. 分析任务
    阐述针对选择的数据,要做什么分析,有什么任务。
    4. 提交方式
    将上述内容写入一个文件中,并命名为“初步数据分析报告-groupX.pdf”,其中“X"替换成阿拉伯数字表示的组号。字数不作限制,解释清楚即可,必要时可配图说明。报告发送至助教邮箱machiteng[at]pku.edu.cn和cxyapril[at]stu.pku.edu.cn,同时抄送至老师邮箱xiaoru.yuan[at]pku.edu.cn。邮件标题为: “[数据可视化] Final Project初步分析报告-groupX”,其中“X"替换成阿拉伯数字表示的组号。

    初步设计报告/修改后的设计报告

    关于初步设计报告和修改后的设计报告,需要基于数据分析讨论的内容,进行数据分析总结和可视化设计,包括以下内容:
    1. 背景介绍
    主要是回顾初步数据分析报告的内容,如果有新的改进也可以在这里加入。
    2. 初步设计
    介绍通过具体什么可视化方法和设计来完成任务。上述内容需要形成一个文档,并命名为“初步设计报告/修改后的设计报告-groupX.pdf”,其中“X"替换成阿拉伯数字表示的组号。
    3. 准备幻灯片
    需要制作初期报告的演示幻灯片,包括以上内容,至少应有5页。幻灯片命名为“初步设计报告/修改后的设计报告-groupX.pptx”,其中“X"替换成阿拉伯数字表示的组号。
    4. 提交方式
    将上述内容打包成“初步设计报告/修改后的设计报告-groupX.zip”(其中“X"替换成阿拉伯数字表示的组号),并发送至助教邮箱machiteng[at]pku.edu.cn和cxyapril[at]stu.pku.edu.cn,同时抄送至老师邮箱xiaoru.yuan[at]pku.edu.cn。邮件标题为: “[数据可视化] Final Project初步设计报告/修改后的设计报告-groupX”,其中“X"替换成阿拉伯数字表示的组号。

    期末提交要求

    针对目标数据,设计和实现新颖的在线可视化,以探索其内部关系,并为用户带来见解。
    1. 期末项目报告
    详细描述数据、项目设计、最终系统、发现的结果、关于本工作的讨论,以及小组中每个成员所做的工作。
    2. 系统实现
    最终的可视化系统必须能够在线访问。建议使用D3.js和其他可视化库进行网页编程。最后需要提交源代码。
    3. 演示视频
    需要制作一个时长大约1分钟的演示视频,以演示系统的可视化效果。视频不仅需要清楚地展示可视化的工作原理,还应该演示该可视化能够提供哪些见解。视频的分辨率至少应为1280X720。
    4. 海报
    需要制作一张海报以展示您的可视化。海报上应该清楚地演示数据、技术细节和分析结果。请按照模板制作。
    5. 演示幻灯片
    需要制作期末项目的演示幻灯片,用于最后的课堂展示。
    6. 作业提交(请严格按照以下格式进行提交)
    • 源代码打包命名为“datavis_f23_组号(例如:group1)_final_src.zip”。注意:源代码中必须包含所用到的库和数据等文件,必须含有index.html文件。
    • 作业报告命名为“datavis_f23_组号_final_report.pdf”
    • 展示的ppt命名为“datavis_f23_组号_final_slides.ppt”
    • 演示视频命名为“datavis_f23_组号_final_demo.mp4”
    • 海报命名为“datavis_f23_组号_final_poster.pdf”
    • 一张200×200像素的有代表性的图片命名为“datavis_f23_组号_final.png”
    • 以上所有材料一起打包成“datavis_f23_组号_final.zip”发送至发送至助教邮箱machiteng@pku.edu.cn和cxyapril@stu.pku.edu.cn,同时抄送至老师邮箱xiaoru.yuan@pku.edu.cn。邮件标题为: [数据可视化] 期末提交_组号(例如:group1)。

    其中,2、3、5项需要在期末展示前准备好。在展示后,根据老师的意见和建议,修改后,按照第6项的要求,在报告当周的周末2024年1月14日23:59:59前提交作业。



    候选主题

    1、中国古代戏剧(如《窦娥冤》)
  • 数据描述:元杂剧《窦娥冤》可视化。《感天动地窦娥冤》,简称窦娥冤,是元朝关汉卿的杂剧代表作,取材自“东海孝妇”的民间故事。情節反映出元代貪污官吏「無心正法」,草菅人命,以及百姓有冤無路訴的黑暗現實和政治弊病。
  • 数据来源:https://yuedu.163.com/source/10042644cb514828ae66ad3d7ad85ecd_4
  • 数据链接:https://zh.m.wikipedia.org/zh/%E7%AA%A6%E5%A8%A5%E5%86%A4
  • 数据属性:
    • 人物(People):基本信息
    • 社会区分(Status):身份
    • 社会关系(Associations):包括亲属关系与非亲属关系如直接、间接,参加丧事、馈赠礼物等关系
    • 重大事件(Events):比如判案、陷害、屈打成招、斩首等,以及相关的人物、时间、地点、财产情况
  • 可选课程设计方向:根据该元曲剧本,从中提取相关人物信息,开展相关可视化。可包括:人物关系、对话内容、角色类型、情节发展等信息。

  • 2、可视化故宫藏品目录
  • 数据描述:“故宫博物院”既是明清故宫(紫禁城)建筑群与宫廷史迹的保护管理机构,也是以明清皇室旧藏文物为基础的中国古代文化艺术品的收藏、研究和展示机构。“故宫博物院”院藏文物体系完备、涵盖古今、品质精良、品类丰富。现有藏品总量已达180余万件(套),以明清宫廷文物类藏品、古建类藏品、图书类藏品为主。藏品总分25种大类别,其中一级藏品8000余件(套),堪称艺术的宝库。
  • 数据链接:https://www.dpm.org.cn/explore/collections
  • 数据属性:
    • 分类:25种大类
    • 名称:藏品命名,同时可能包括年代和作者信息
    • 年代:完成历史年代,一般具体到朝代
    • 颜色:主要颜色
    • 照片:藏品颜色
  • 可选课程设计方向:根据该数据以及其他补充信息,选取某一或者几个角度,分析和可视化一类藏品的数量、分布等信息。帮助用户理解故宫藏品的丰富。

  • 3、史记可视化
  • 数据描述:《史记》是中国历史上第一部纪传体通史,以写人物为中心,被列为二十四史之首。史上评注《史记》最有影响的是俗称“三家注史记”:《集解》(裴骃注)、《索隐》(司马贞注)和《正义》(张守节注)。书格提供了南宋建安黄善夫家塾刊本(最早三家注合刻本),现藏于日本国立历史民俗博物馆。
  • 数据链接:https://www.shuge.org/ctags/song_ke_ben_zhuan_ti/page/4/
  • 数据属性:
    • 文字内容、目录、影像。共130卷。需要考虑进一步转换。
  • 可选课程设计方向:书格提供了宋代刊本。可以同步参考电子文字版本,对史记数据从有趣的角度开展可视化。

  • 4、北京大学历史可视化
  • 数据描述:北京大学是中国最早的大学之一,初名京师大学堂,成立于1898年戊戌变法中。可以从多种来源获取相关学校历史的变迁。
  • 数据链接:https://zh.wikipedia.org/zh-hans/%E5%8C%97%E4%BA%AC%E5%A4%A7%E5%AD%A6%E6%A0%A1%E5%8F%B2
  • 数据属性:
    • 时间、地点、人物、时间。学科门类、院系合并分离等。
  • 可选课程设计方向:可以采用可视化叙事的方式,利用获取的数据,互动展示北京大学的变迁历史。

  • 5、国家5A级旅游景区可视化
  • 数据描述:国家5A级旅游景区依照《旅游景区质量等级的划分与评定》国家标准(标准中对AAAAA级旅游景区提出了12项条件,即旅游交通、游览、旅游安全、卫生、邮电服务、旅游购物、经营管理、资源和环境的保护、旅游资源吸引力、市场吸引力、年接待游客量及游客抽样满意率),经“全国旅游景区质量等级评定委员会”组织评定,由中华人民共和国文化和旅游部发布。列表截至2022年7月26日,共318处。
  • 数据链接:https://zh.wikipedia.org/wiki/%E5%9B%BD%E5%AE%B65A%E7%BA%A7%E6%97%85%E6%B8%B8%E6%99%AF%E5%8C%BA
  • 数据属性:
    • 名称:国家5A级旅游景区名称
    • 地点:所在省、市、区行政区域名称
    • 获批批次:批次,对应时间
    • 景区具体信息:相关具体信息
  • 可选课程设计方向:可以从分布、类型等方面考虑。也可以比较不同地区的旅游资源。

  • 6、汉语方言可视化
  • 数据描述:汉语方言通常分为十大方言:官话方言、晋方言、吴方言、闽方言、客家方言、粤方言、湘方言、赣方言、徽方言、平话土话。 各方言区内又分布着若干次方言和许多种“土语”。 其中使用人数最多的官话方言可分为东北官话、北京官话、冀鲁官话、胶辽官话、中原官话、兰银官话、江淮官话、西南官话八种次方言。
  • 数据链接:
  • 数据属性:
    • 方言地域、方言发音、特点等。
  • 可选课程设计方向:可以通过问卷或者其他方式,采集一些典型词语的方言发音。也可以根据书本,从注音出发。结合差异计算,帮助大众理解方言之间的差异。

  • 7、书画印章可视化
  • 数据描述:宋、元以后,书家逐渐注重书画题跋和署款,在印章中可以识别书画作者、收藏者、鉴别者等不同角色。
  • 数据链接:需要自行采集
  • 数据属性:
    • 书画影像,印章图片,印章对应人物、文字内容、时间等
  • 可选课程设计方向:通过提取和识别书画中的印章或者题款,通过可视化叙事,依托时间、地点、人物等和相关数据支撑,讲述某知名书画的流传历史。

  • 8、可视化北京大学校园植物
  • 数据描述:北大校园里的高等植物超过600种。通过可视化的方法,可以帮助同学了解校内植物的分布。
  • 数据链接:需要自行采集或者参考网站
  • 数据属性:
    • 植物名称,类型、地点、数量、图片等
  • 可选课程设计方向:可以通过交互地图,帮助用户了解校内不同地区的植物分布。对于植物的识别,可以借助自动算法。

  • 9、人工智能领域近年算法及其关系可视化
  • 数据描述:随着人工智能领域的快速发展,新兴算法不断涌现,这些算法与经典算法之间存在继承关系,也有不同的细分应用领域。对人工智能领域近年算法进行可视化,有助于厘清学科发展的脉络与全貌。
  • 数据链接:论文数据库、会议论文集,要求至少25种以上的具体的算法
  • 可选课程设计方向:可以是文章间的继承关系、模型间的关系(溯源)或者提出者之间的关系、应用的成功的领域

  • 10、可视化国内外可视化会议历史
  • 数据描述:国内外近年来建立了一系列和可视化相关的会议。在20世纪九十年代,IEEE Visualization可视化会议开始运行,同时逐渐出现了 Information visualizaiton, Volvis等小型同期研讨会。结果各种迭代,逐渐合并形成IEEE VIS. 欧洲的主要会议是EuroVis,亚太地区PacificVis始于2008年。中国的可视化大会创建于2014年北京。2024年日本也开始了其首届可视化会议。
  • 数据链接:会议网站
  • 数据属性:
    • 会议名称、时间、地点、参加人数、论文数、录取率、会议议程设置等等
  • 可选课程设计方向:通过收集相关会议历年信息,形成一个叙事可视化,讲述可视化会议历史。

  • 11、可视化历代登科进士
  • 数据描述:“历代进士登科数据库”是以历朝登科人物的传记资料为主要内容的专业在线数据库产品。内容涵盖隋朝至清朝全部的登科人物资料,规模庞大,共计约10万余条,4,000万字;内容来源包括各类传世文献和出土文献,在区分朝代的基础上,针对每个人物提供登科科目、登科年号、在位帝王、公元年份、生源籍贯、人物简介和文献记载等信息
  • 数据链接:https://examination.ancientbooks.cn/docDengke/
  • 数据属性:
    • 姓名,时间,籍贯,科目,名次等
  • 可选课程设计方向:选取某一时期,可视化登科进士情况,分析其在地域等方面分布。(宋或清)

  • 12、其他自选主题
  • 请在选题截止时间前,与袁老师和助教讨论确定。