1、科学可视化和信息可视化的区别
信息可视化与科学可视化的主要区别首先是:科学可视化通常是观察基于物理的、有几
何属性的数据,而信息可视化则用来显示各式各样的抽象数据;其次,科学可视化的用户多
是高层次的专业工作者,而信息可视化的用户则主要是非技术人员。要为难以形象表达的抽
象数据设计更加容易理解的表现形式,使信息可视化面临更大的挑战。
信息可视化的可视化目的和科学可视化不同。科学可视化的目的要求是真实地反映,要
求忠实地“直译”。而信息可视化的可视化目的则是要从大量抽象数据中发现一些新的信息,
它不仅仅使简单的反映,而且要求能够创造性地反映,能够把隐藏在可视化对象深处或可视
化对象之间的信息挖掘出来,它是一种知识和价值创造的过程,且信息可视化主要是通过使
用交互式可视化界面来进行抽象数据的交流
2、简述力导向图的基础算法和加速算法
基础算法:
一开始对节点的位置进行随机初始化,定义所有节点之间存在斥力,相邻节点之间存在
弹簧力,然后开始按照节点之间两种力相互作用的结果重新确定节点之间的位置,每变换一
次位置就要对力进行重新计算,一直迭代计算直到节点之间的位置不再改变或是改变幅度小
于某个给定的值才结束
加速算法:
用 QuadTree 实现
3、给一段文字和词频表,采用什么方法可视化较好,为什么?
4、给定数据,并绘制平行坐标图或散点图矩阵,并说明其优缺点
用平行坐标图绘制较好
优缺点:
1. 适用于分类问题和回归问题
2. 一次可视化多达 24 个维度
3. 平行坐标图可以突出显示单个数据,也可以绘制单个组,以比较该组与其余数据的
特征
4. 在处理数据集的子集时,平行坐标可以帮助将特定子集的特征与数据集的其余部分
相关联
5. 相邻的两个坐标轴正相关系数越大,在轴之间的一段折线越接近平行。负相关系数
越大,线段之间的交叉越严重,甚至穿过两轴之间的一个点。一般情况线段有不同程度的交
叉
6. 比散点图更加容易找出属性之间的相关性。
7. 属性很多时需要大量的空间,整体呈现为一个长方形。
8. 完整的绘制数据可能会导致数据堆积在一起,反而不能呈现更多的信息。在观察多
变量数据的关系时可以添加数据选择的交互。
9. 对坐标轴的表示范围和顺序非常敏感。
10. 用户第一次使用难以直观的理解图标所表示的含义,需要显式的说明。所以通常作
为数据可视化的一个选项,用于和其他的可视化图标做比对。
5、给两个数字,给出至少五个可视化图形,并对其有效性进行排序
6、比较 focus + context 和 overview + detail 两种方式
overview+detail:
- 多个视图展示,相同的数据,不同的分辨率,且视图之间空间分离
- 能够快速导航到要找的地方,并且不会改变细节信息
- 细节改变会立即显示在概览中
- 为查看者提供更多信息以及有关数据用例的详细信息。可以获得更多关于具体事件的
信息,但是可能造成从聚集视图到个人视图的改变,缩放可能不能呈现所有的信息,或者令
数据变得抽象
focus+context:
- 同一个视图中同时包含焦点和焦点周围的环境
- 显示细节时保持用户方向
- 数据大时有问题
- 将选定的特定事件集合信息嵌入到整体当中,视图包含局部信息和整体信息。方法减
少了过滤和聚合的数据量,但是需要为呈现具体事件的视图挪出空间,可能导致整体信息的
变化,造成几何上的扭曲,比如相关数据的比例关系发生变化等。
7、简述 TSNE 的基本原理和优点
8、介绍一个你最感兴趣的可视化应用,指出其中的不足并给出解决方法