作者存档: Shao, Hanning

暑期学校课程设计作品 – Y染色体单倍型类群和中国姓氏家族

作为人类46条染色体中较为特殊的一个,Y染色体仅会父子相传的特点,使得人们可以通过研究Y染色体的遗传进化过程,了解人类父系族群的发展与迁徙。人类Y染色体谱系树即是通过Y染色体单倍型类群,整理出的Y染色体进化树。在这棵树上,根节点是在遗传学上理论上认定的人类父系共同祖先亚当,而每个分支节点则都代表着该节点下各个进化分支的公共祖先。

继续阅读 »

利用深度学习为大众探索多视图可视化进行多样化交互推荐 (Diverse Interaction Recommendation for Public Users Exploring Multi-view Visualization using Deep Learning)

如图是一个具有多视图的可视化系统,用于帮助探索宋代四位诗人在其人生的各个阶段的行程轨迹,以及文学创作,从多个角度分析诗人的一生。该可视化系统可以被放置在博物馆等场景中,作为面向大众的可视化案例。利用其高交互性和丰富的内容,以独特的形式帮助大众了解相关的领域知识。

系统模型的训练模块和实时更新模块
继续阅读 »

经籍览观:览录而知旨,观目而悉词

中国的图书分类历史源远流长,唐初官修目录《隋书 · 经籍志》是第一部正式使用“经、史、子、集”四部分类法进行分类的目录。除《隋书 · 经籍志》外,《旧唐书 · 经籍志》《新唐书 · 艺文志》《宋史 · 艺文志》也都是官修史书的图书分类目录,不仅在时间上具有连续性,也延续了 “经、史、子、集”四部分类法。另有一部《日本国见在书目录》,记录了日本国平安前期为止的传世的汉籍总目录。该书借鉴《隋书 · 经籍志》,成书虽晚于 《隋书 · 经籍志》 ,却早于《旧唐书 · 经籍志》,所著内容与国内官修史书目录可以相互补充,同样具备极高的研究价值。 通过对这五部目录的研究,可以窥得我国古代书籍分类之一隅。

继续阅读 »

Stylette:使用自然语言修改网页样式(Stylette: Styling the Web with Natural Language)

针对网页样式的修改工具通常停留在代码层面,如直接修改HTML,CSS或者JavaScript代码文件。也有一些工具进行以一定程度的封装,实现了部分较为底层的操作。然而,这两种修改网页样式的方法对于没有编程基础、设计基础的新手来说是难以掌握的。新手难以将他们的高度抽象的目的转化为底层的基础操作,更难以找到需要修改的属性。因此,该工作尝试通过自然语言的交互方式,半自动地帮助新手完成网页样式的修改。

继续阅读 »

CrossData: 利用文字和数据之间的关联(CrossData: Leveraging Text-Data Connections for Authoring Data Documents)

研究者常用数据文档来记录在进行数据探索中的各种发现。尽管目前已经有相当多的工具可以被用于进行数据探索,但是针对帮助进行数据文档编写的工具仍然很少。研究者们仍然需要通过手动的方式记录和维护数据文档。于此同时,一旦数据本身发生更新,对应的数据文档就需要进行修改;由于缺少对应的工具,手动地对数据文档进行修改和维护始终是一件乏味且容易出错的事。为了解决这个问题,来自加州大学圣地亚哥分校的研究者们提出了CrossData,通过自动识别数据和文本之间的关系,来帮助对数据文档的编写。

继续阅读 »

大规模实时社交媒体数据分析(Real-Time Visual Analysis of High-Volume Social Media Posts)

社交媒体平台上每时每刻都在发布各个领域的相关新闻、报告等信息,这些信息对于领域专家来说,往往具有极高的研究价值。而然,社交媒体数据的巨大规模以及极高的更新率对于分析工具提出了巨大的挑战。已有的相关工具有相当大的局限性——大量的分析系统仅仅支持事后的分析,因此缺失了社交媒体数据的事实性;支持实时分析的数据往往又难以支持大规模数据的涌入。还有一些工具依赖于额外的元数据,例如地理空间数据。近年来,包含这类元数据的社交媒体数据的比例不断下降,导致类似的工具的实用性越来越低。

继续阅读 »

2021年北京大学可视化发展前沿研究生暑期学校 – Day 3

今天(7月16日)是北京大学可视化发展前沿研究生暑期学校的第三天。今天的主要内容包含可视化设计空间和可视化设计实践两个部分。

继续阅读 »