学术报道数据可视化——学术沙龙
Posted 华科建规学术
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学术报道数据可视化——学术沙龙相关的知识,希望对你有一定的参考价值。
2018.5.11周五晚一场学术沙龙在华科南四楼锁石咖啡厅展开,荷兰皇家注册建筑师Jimmy Lee(以下简称“李老师”),以“数据可视化”为主题,为大家带来了一场内容丰富的精彩专题讲座,同学们反响热烈,获得一致好评。
图一 讲座现场-锁石咖啡厅
图二 主讲人Jimmy Lee老师
首先李老师提出了“什么是数据可视化?”这个问题,引发大家思考,之后进行了详细阐述。
数据可视化,是关于数据视觉表现形式的科学技术研究。其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
它是一个处于不断演变之中的概念,其边界在不断地扩大。主要指的是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。与立体建模之类的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多。
数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相关。当前,在研究、教学和开发领域,数据可视化乃是一个极为活跃而又关键的方面。“数据可视化”这条术语实现了成熟的科学可视化领域与较年轻的信息可视化领域的统一。
数据可视化技术包含以下几个基本概念:
①数据空间:是由n维属性和m个元素组成的数据集所构成的多维信息空间;
②数据开发:是指利用一定的算法和工具对数据进行定量的推演和计算;
③数据分析:指对多维数据进行切片、块、旋转等动作剖析数据,从而能多角度多侧面观察数据;
④数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。
图三 数据可视化示意图
接下来李老师对数据可视化适用范围进行了阐述。
关于数据可视化的适用范围,存在着不同的划分方法。迈克尔·弗兰德利(2008),提出了数据可视化的两个主要的组成部分:统计图形和主题图。《Data Visualization: Modern Approaches》(意为“数据可视化:现代方法”)(2007),概括阐述了数据可视化的下列主题 :1)思维导图
2)新闻的显示 3)数据的显示 4)连接的显示
5)网站的显示 6)文章与资源 7)工具与服务
所有这些主题全都与图形设计和信息表达密切相关。
Frits H. Post (2002)则从计算机科学的视角,将这一领域划分为如下多个子领域:1)可视化算法与技术方法 2)立体可视化 3)信息可视化 4)多分辨率方法 5)建模技术方法 6)交互技术方法与体系架构。
图四 数据可视化示意图
关于数据可视化发展史,李老师有自己的见解,大概分为三个阶段。
数据可视化领域的起源,可以追溯到二十世纪50年代计算机图形学的早期。当时,人们利用计算机创建出了首批图形图表。
一、科学可视化
1987年,由布鲁斯·麦考梅克、托马斯·德房蒂和玛克辛·布朗所编写的美国国家科学基金会报告《Visualization in Scientific Computing》(意为“科学计算之中的可视化”) ,对于这一领域产生了大幅度的促进和刺激。这份报告之中强调了新的基于计算机的可视化技术方法的必要性。随着计算机运算能力的迅速提升,人们建立了规模越来越大,复杂程度越来越高的数值模型,从而造就了形形色色体积庞大的数值型数据集。同时,人们不但利用医学扫描仪和显微镜之类的数据采集设备产生大型的数据集,而且还利用可以保存文本、数值和多媒体信息的大型数据库来收集数据。因而,就需要高级的计算机图形学技术与方法来处理和可视化这些规模庞大的数据集。
二、信息可视化
更近一些的时候,可视化也日益尤为关注数据,包括那些来自商业、财务、行政管理、数字媒体等方面的大型异质性数据集合。二十世纪90年代初期,人们发起了一个新的,称为“信息可视化”的研究领域,旨在为许多应用领域之中对于抽象的异质性数据集的分析工作提供支持。因此,21世纪人们正在逐渐接受这个同时涵盖科学可视化与信息可视化领域的新生术语“数据可视化” 。
三、数据可视化
一直以来,数据可视化就是一个处于不断演变之中的概念,其边界在不断地扩大;因而,最好是对其加以宽泛的定义。数据可视化指的是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。与立体建模之类的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多。
接下来,李老师对于数据可视化的实际案例做了详细介绍,有轴散点图、折线图、柱状图、饼状图等。这里选取三种具有代表性的案例进行介绍。
图五 树状关系图
树状图,亦称树枝状图。树形图是数据树的图形表示形式,以父子层次结构来组织对象。是枚举法的一种表达方式。树状图也是初中学生学习概率问题所需要画的一种图形。的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多。
图六 桑基图
桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。
图七 平行坐标图
平行坐标图是一种通常的可视化方法, 用于对高维几何 和 多元数据 的可视化。为了表示在高维空间的一个点集,在N条平行的线的背景下,(一般这N条线都竖直且等距),一个在高维空间的点被表示为一条拐点在N条平行坐标轴的折线,在第K个坐标轴上的位置就表示这个点在第K个维的值。
平行坐标图是信息可视化的一种重要技术。为了克服传统的笛卡尔直角坐标系容易耗尽空间、 难以表达三维以上数据的问题, 平行坐标图将高维数据的各个变量用一系列相互平行的坐标轴表示, 变量值对应轴上位置。为了反映变化趋势和各个变量间相互关系,往往将描述不同变量的各点连接成折线。所以平行坐标图的实质是将m维欧式空间的一个点Xi(xi1,xi2,...,xim) 映射到二维平面上的一条曲线。
平行坐标图的一个显著优点是其具有良好的数学基础,其射影几何解释和对偶特性使它很适合用于可视化数据分析。
最后,李老师对于以进行数据可视化的工具和网站(Polymaps、NodeBox、Flot、Echarts等)进行了简要介绍,干货满满
图八 Echarts网站
演讲结束后,同学们踊跃提问,和李老师积极互动,这场生动的学术沙龙在同学和老师热情澎湃的讨论中圆满结束。
图九 李老师和学生们热烈讨论
撰稿:2016级建筑学硕士研究生 黄胤喆
拍摄:黄胤喆
审核人:王通
发布人:黄胤喆
以上是关于学术报道数据可视化——学术沙龙的主要内容,如果未能解决你的问题,请参考以下文章
学术福利Pytorch的tensorboard食谱帮你可视化误差结果