人工智能之可视化.pdf
《人工智能之可视化.pdf》由会员分享,可在线阅读,更多相关《人工智能之可视化.pdf(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 可视化研究报告 主 编:曹 楠 编 辑:何 杨 蒲 杰 目录目录 1.1.概述篇概述篇 .1 1 1.1 基本概念 1 1.2 可视化发展历程 2 1.3 可视化呈现的设计标准 5 2.2.技术篇技术篇 .6 6 2.1 数据可视化(Data Visualization)6 2.2 可视化图形库 21 2.3 国内知名可视化实验室 22 2.4 可视化领域的顶级会议和期刊 23 3.3.人才篇人才篇 .2525 3.1 学者情况概览 25 3.2 国外学者简介 28 3.3 国内学者简介 34 4.4.应用篇应用篇 .3939 4.1 社交媒体可视化 39 4.2 体育数据可视化 40 4.
2、3 医疗数据可视化 42 5.5.趋势篇趋势篇 .4545 图表目录图表目录 图 1 可视化发展历程.2 图 2 拿破仑进军莫斯科的历史事件.3 图 3 1933 年 Henry Beck 设计的伦敦地铁图.3 图 4 科学可视化的早期可视化流水线.7 图 5 CT(左)MRI(右).7 图 6 飞机翼流可视化.8 图 7 信息可视化参考模型.11 图 8 2D 散点图.12 图 9 基于投影的多维可视化与平行坐标多维可视化.12 图 10 集成了散点图和柱状图的平行坐标工具 FlinaPlots.13 图 11 GitHub 欧洲用户分布示意图.14 图 12 细节级呈现.14 图 13 压
3、缩的邻接矩阵.14 图 14 电影故事情节的可视化.15 图 15 法国 1864 年红酒出口.16 图 16 可视化领域词云.17 图 17 DAViewer 和 DocuBurst 文本语义结构树.17 图 18 推特用户线上社交活动的射线布局及基本信息.18 图 19 主题河流图.18 图 20 事件河流图.19 图 21 可视分析学内容.20 图 22 美国各州失业率等值线图(左)与溪流图(右).22 图 23 IEEE 可视化会议官网.24 图 24 IEEE 可视化与计算机图形学.24 图 25 全球可视化领域 TOP 学者分布图.25 图 26 可视化领域 TOP 学者中国分布.
4、26 图 27 全球可视化领域 TOP 学者迁徙图.27 图 28 全球可视化领域 TOP 学者分布机构统计 TOP10.27 图 29 全球可视化领域 TOP 学者 h-index 分布.27 图 30 全球可视化领域 TOP 学者男女性别比例.28 图 31 可视化全球研究趋势图.45 表 1 可视化呈现的设计标准.5 表 2 科学可视化分类.9 表 3 全球可视化领域 TOP 学者分布国家 TOP5.26 表 4 社交媒体可视化介绍.39 表 5 体育数据可视化.40 表 6 医疗数据可视化.43 1 1.概述篇概述篇 本章节从阐述可视化基本概念出发,简要介绍可视化的发展历程、研究内容、
5、设计原则与设计标准。1.1 基本概念 可视化是把数值或非数值类型的数据转化为可视的表示形式,并获得对数据更深层次认识的过程。可视化将复杂的信息以图像的形式呈现出来,让这些信息更容易、快速地被人理解,因此,它也是一种放大人类感知的图形化表示方法。可视化充分利用计算机图形学、图像处理、用户界面、人机交互等技术,以人们惯于接受的表格、图形、图像等形式,并辅以信息处理技术(例如:数据挖掘、机器学习等)将复杂的客观事物进行图形化展现,使其便于人们的记忆和理解。可视化为人类与计算机这两个信息处理系统之间提供了一个接口,对于信息的处理和表达方式有其独有的优势,其特点可总结为可视性、交互性和多维性。目前,数据
6、可视化数据可视化针对不同的数据类型及研究方向,可以进一步划分为科学数据可视化、信息可视化,以及可视分析学三个子领域。这三个领域即紧密相关又分别专注于不同类型的数据及可视化问题。具体而言,科学可视化科学可视化是针对科学数据的可视化展现技术。科学数据,例如,医疗过程中由 CT 扫描生成的影像数据、风洞实验而产生的流体数据、以及分子的化学结构等,是对物理世界的客观描述,往往是通过科学仪器而测量得到的数据。这类数据的可视化主要关注于如何以清晰直观的方式展现数据所刻画的真实物理状态。因此,科学可视化往往呈现的是三维场景下的时空信息。信息可视化信息可视化注重于如何以图形的方式直观展现抽象数据,它涉及到了对
7、人类图形认知系统的研究。在这里,抽象数据(例如:图形数据、多维度数据、文本数据等)往往是对各应用领域所产生数据的高层次概括,记录的是抽象化的信息。针对这样的数据,信息可视化着眼于多维度信息的可视编码技术,即如何以低维度(2D)的图形符号来直观展现并揭示抽象数据中所隐藏的潜在规律与模式;可视分析可视分析学学是多领域技术结合的产物,旨在结合并利用信息可视化、人机交互、以及数据挖掘领域的相关技术,将人的判断与反馈作为数据分析中重要的一环,从而达到精准数据分析、推理及判断的目的。可视化的重要性在于,通过提供对数据和知识的展现,建立用户与数据系统交互的良好沟通渠道,利用人类对图形信息与生俱来的模式识别能
8、力,通过以直观的图像化方式展现数据,从而帮助用户快速发觉数据中的潜在规律,并借助分析人员的领域知识与经验,对模式进行精准分析、判断、推理,从而达到辅助决策的目的。目前可视化技术在各行各业中均得到了广泛的应用。其中,可视化技术在信息安全、智慧医疗、电子商务、机器学习、智慧城市、文化体育、数字新闻、气象预报、地质勘测等诸多领域产生了非常广泛的应用,并逐渐成为这些领域当中越来越重要的组成部分。当下可视化存在的挑战是:如何进一步深入挖掘人类对于图形、动画、以及交互的感知 2 及认知模式,从而进一步完善可视化的相关理论;如何打破“手工作坊”式的针对每一个问题,单独定制数据可视化设计方案的传统模式,大规模
9、批量创造生成风格化的可视展现;以及,如何根据用户的数据分析任务与需求自动推荐合适的可视化展现方式。主要的研究趋势:海量、异构、时变、多维数据的可视化展示方案;可视化在可解释性深度学习领域的应用;自动可视化生成技术的研究;基于形式概念分析理论的知识可视化方法;可视化模式识别;整体可视与局部详细可视相结合的新方法研究等。1.2 可视化发展历程 图 1 可视化发展历程 19 世纪世纪-19 世纪中叶:现代图形学设计世纪中叶:现代图形学设计雏形雏形 十九世纪前叶,因为受视觉表达方法创新的影响,统计图形及专题绘图领域应用得到快速发展。目前,我们看到的绝大多数统计图形都是在这一时间段被发明的。同期,因政府
10、开始着重关注人口、教育、犯罪、疾病等领域,数据的收集整理范围明显扩大,超乎以往的社会管理方面的数据被收集起来用于社会分析。1801 年英国地质学家 William Smith 绘制了第一幅地质图,引领了一场在地图上表现量化信息的潮流。这一时期,数据的收集整理从科学技术和经济领域扩展到社会管理领域,对社会公共领域数据的收集标志着人们开始以科学手段进行社会研究。与此同时科学研究对数据的需求也变得更加精确,研究数据的范围也有明显扩大,人们开始有意识地使用可视化的方式来尝试研究、解决更广泛领域的问题。19 世纪中叶世纪中叶-末期:数据末期:数据图形图形绘制绘制发展加速发展加速 在十九世纪中叶,统计图形
11、、概念图等概念迅猛发展,此时的人们已经掌握了整套统计数据可视化工具,数据可视化领域发展进入了加速期,随着数字信息对社会、工业、商业直至交通规划的影响不断增大,欧洲开始着力发展数据分析技术。一群学者发起的统计理论给出了更多种数据的意义,数据可视化迎来了它历史上的第一个发展加速期。统计学理论的建立是可视化发展的重要一步,此时数据由政府机构进行收集,数据的来源变得更加规范化。随着社会统计学的影响力越来越大,在 1857 年维也纳的统计学国际会议上,学者就已经开始对可视化图形的分类和标准化进行讨论。不同数据图形开始出现在书籍、报刊、研究报告和政府报告等正式场合之中。这一时期法国工程师 Charles
12、Joseph Minard 绘制了多幅有意义的可视化作品,被称为“法国的 Playfair”,他最著名的作品是用二维的表达方式,展现六1919世纪世纪-1919世纪中世纪中叶叶现代图形学设计现代图形学设计雏形雏形1919世纪中叶世纪中叶-末期末期数据图形绘制发数据图形绘制发展加速展加速2020世纪世纪-2020世纪中世纪中叶叶停滞期停滞期19501950-19741974复苏复苏19751975-20112011科学计算可视科学计算可视化、信息可视化化、信息可视化相继相继诞生诞生20122012-至今至今基于大数据的可基于大数据的可视化视化 3 种类型的数据,用于描述拿破仑战争时期军队损失的统
13、计图(见图 2)。1879 年,Luigi Perozzo绘制了一张 1750-1875 年瑞典人口普查数据图,以金字塔形式表现了人口变化的三维立体图,此图与之前所看到的可视化形式有一个明显的区别在于:开始使用三维的形式,并使用彩色表示了数据值之间的区别,提高了视觉感知。在对这一时期可视化历史的探究中发现,数据来源的官方化,以及对数据价值的认同成为了可视化快速发展的决定性因素,当时几乎所有的常见可视化元素都已经出现。并且在这一时期出现了三维的数据表达方式,这种创造性的成果对后来的研究有十分突出的作用。图 2 拿破仑进军莫斯科的历史事件 20 世纪世纪-20 世纪中叶:世纪中叶:停滞期停滞期 2
14、0 世纪的上半叶,随着数理统计这一新数学分支的诞生,追求数理统计严格的数学基础并扩展统计的疆域成为这个时期统计学家们的核心任务。数据可视化成果在这一时期得到了推广和普及,并开始被用于尝试着解决天文学、物理学、生物学的理论新成果,Hertzsprung-Russell 绘制的温度与恒星亮度图成为了近代天体物理学的奠基之一;伦敦地铁线路图的绘制形式如今依旧在沿用(如图 3 所示);E.W.Maunder 的“蝴蝶图”用于研究太阳黑子随时间的变化。然而,这一时期人类收集、展现数据的方式并没有得到根本上的创新,统计学在这一时期也没有大的发展,所以整个上半叶都是休眠期。但这一时期的蛰伏与统计学者潜心的研
15、究才让数据可视化在本世纪后期迎来了复苏与更快速的发展。图 3 1933 年 Henry Beck 设计的伦敦地铁图 4 1950-1974:复苏复苏 从 20 世纪上半叶末到 1974 年这一时期被称为数据可视化领域的复苏期,在这一时期引起变革的最重要的因素就是计算机的发明,计算机的出现让人类处理数据的能力有了跨越式的提升。在现代统计学与计算机计算能力的共同推动下,数据可视化开始复苏,统计学家JohnW.Tukey 和制图师 Jacques Bertin 成为可视化复苏期的领军人物。JohnW.Tukey 在二战期间对火力控制进行的长期研究中意识到了统计学在实际研究中的价值,从而发表了有划时代
16、意义的论文“The Future of Data Analysis”,成功的让科学界将探索性数据分析(EDA)视为不同于数学统计的另一独立学科,并在 20 世纪后期首次采用了茎叶图、盒形图等新的可视化图形形式,成为可视化新时代的开启性人物。Jacques Bertin 发表了他里程碑式的著作Semiologie Graphique。这部书根据数据的联系和特征,来组织图形的视觉元素,为信息的可视化提供了一个坚实的理论基础。随着计算机的普及,上世纪六十年代末,各研究机构逐渐开始使用计算机程序取代手绘的图形。由于计算机的数据处理精度和速度具有强大的优势,高精度分析图形已不能用手绘制。在这一时期,数据
17、缩减图、多维标度法 MDS、聚类图、树形图等更为新颖复杂的数据可视化形式开始出现。人们尝试着在一张图上表达多种类型数据,或用新的形式表现数据之间的复杂关联,这也成为这一时期数据处理应用的主流方向。数据和计算机的结合让数据可视化迎来了新的发展阶段。1975-2011:科学计算可视化、信息可视化:科学计算可视化、信息可视化相继相继诞生诞生 这段时期,计算机成为数据处理的一个重要工具,数据可视化进入了新的黄金时代,随着应用领域的增加和数据规模的扩大,更多新的数据可视化需求逐渐出现。二十世纪七十年代到八十年代,人们主要尝试使用多维定量数据的静态图来表现静态数据,八十年代中期出现了动态统计图,最终在上世
18、纪末两种方式开始合并,致力于实现动态、可交互的数据可视化,动态交互式的数据可视化方式成为新的发展主题。数据可视化的这一时期的最大潜力来自动态图形方法的发展,允许对图形对象和相关统计特性的即时和直接的操纵。这一时段初期就已经出现交互系统,通过调整控制来选择参考分布的形状参数和功率变换。这可以看作动态交互式可视化发展的起源,并推动了这一时期数据可视化的发展。2012-至今:基于大数据的可视化至今:基于大数据的可视化 步入 21 世纪互联网数据量猛增,人们逐渐开始对大数据的处理进行了重点关注。之后全球每天的新增数据量就已经开始以指数倍膨胀,用户对于数据的使用效率也在日益提升,数据的服务商开始需要从多
19、个维度向用户提供服务,大数据时代就此正式开启。2012 年,我们进入数据驱动的时代。人们对数据可视化技术的依赖程度也不断加深。大数据时代的到来对数据可视化的发展有着冲击性的影响,继续以传统展现形式来表达庞大的数据量中的信息是不可能的,大规模的动态化数据要依靠更有效的处理算法和表达形式才能够传达出有价值的信息,因此大数据可视化的研究成为新的时代命题。我们在应对大数据时,不但要考虑快速增加的数据量,还需要考虑到数据类型的变化,这种数据扩展性的问题需要更深入的研究才能解决;互联网的加入增加了数据更新的频率和获取的渠道,而实时数据的巨大价值只有通过有效的可视化处理才可以体现,于是在上一历史时期就受到关
20、注的动态交互的技术已 5 经向交互式实时数据可视化发展。综上,如何建立一种有效的、可交互式的大数据可视化方案来表达大规模、不同类型的实时数据,成为了数据可视化这一学科的主要的研究方向。1.3 可视化呈现的设计标准 一份优秀的可视化设计应该满足以下几项标准,如表 1 所示:表 1 可视化呈现的设计标准 Faithfulness(信)Expressiveness(达)Elegance(雅)保证展现数据准确性 有效且精准地呈现数据 保证数据呈现的美观性,增强数据呈现的艺术效果,符合审美规则 6 2.技术篇技术篇“One picture is worth thousand words.”(一张图胜过千
21、言万语)这句谚语已经充分描绘出了图形包含内容之多,传递信息效率之高。研究发现,人类从外界获得的信息约有 80%以上来自于视觉系统,当大数据以十分直观的可视化图形形式,展示在分析者面前时,分析者往往能够一眼洞悉数据背后隐藏的信息并转化知识以及智慧。虽然较为简单的数据可视化形式,已经出现了数个世纪,但大量被人们使用和重视却是在近数十年内,部分原因是现今的可视化工具越来越容易被大众所使用,同时随着互联网等行业的兴起,线上数据量呈现爆炸式增长,人们对可视化图形的需求与日增强,运用到可视化技术的频率增高。可视化技术也在顺应需求,不断被更新迭代,从最初的数据可视化衍生出科学可视化、信息可视化,基于上述技术
22、又衍生出了可视分析。本章节主要从数据可视化技术出发,对其包含的科学可视化、信息可视化和可视分析学来进行可视化技术层面的简单介绍。2.1 数据可视化(Data Visualization)据 2018 年 4 月 25 日消息,IDC(International Data Corporation)预测,全球数据总量预计 2020 年达到 44 个 ZB,我国数据总量将达到 8060 个 EB,占全球数据总量的 18%。面对如此庞大的数据量,人类分析数据的能力却要远远小于获取数据的能力。造成这一局面的原因不单单在于与日俱增的数据量,同时其高维、多元源、多态等特性,也为人类分析数据带来不小的挑战。数
23、据可视化是帮助人类分析数据的手段之一,它借助人类的视觉感知与认知能力,能够十分有效地传达丰富的、极易被隐藏的信息,对人类分析数据起到辅助的作用。正如本报告1.2 章节写到,当下的数据可视化技术基于计算机科学的快速发展,同时其运用计算机图形学、人机交互等技术,将采集到的数据转化为可识别的图形或视频,将具有价值的信息反馈给用户。用户再使用可视化交互工具进行数据分析,进一步将数据升华为知识。传统统计分析或者数据挖掘经常将数据变得简化、抽象,这使得数据集真实的结构被隐藏起来,而数据可视化却弥补了这个弊端,它真实还原了数据集的结构,甚至还在其基础上针对数据细节做出了进一步增强。基于陈为等人编写的数据可视
24、化、刘世霞等人发表的A Survey on Information Visualization和其他学者发表的论文,当下主流观点将数据可视化视为科学可视化与信息可视化的统称。数据可视化包括了科学数据处理的科学可视化与抽象、非结构化信息的信息可视化两个分支。科学可视化带有空间坐标与几何信息的三维空间测量数据、医学影像数据等,其研究重点关注在如何有效呈现数据中几何、拓扑和形状特征。信息可视化是抽象的、非结构化、非几何的数据。基于数据分析的重要性,人们选择将可视化与分析结合,便形成了可视分析学。因此,数据可视化的主要分支包括了科学可视化、信息可视化和可视分析学。7 2.1.1 科学可视化(Scien
25、tific Visualization)科学可视化是可视化领域最早、最成熟的一个跨学科研究与应用领域。1987 年,由布鲁斯麦考梅克等众研究者撰写的美国国家科学基金会报告科学计算之中的可视化对于可视化领域具有重大的奠基意义。此后科学可视化的概念出现。科学可视化的研究重点是带有空间坐标和几何信息的医学影像数据、三维空间信息测量数据、流体计算模拟数据等。由于数据的规模通常超过图形硬件的处理能力,所以如何快速呈现数据中包含的集合、拓扑、形状特征和演化规律是其核心问题。科学可视化面向的领域包括自然科学,如物理、化学、气象气候、航空航天、医学、生物等学科,这些学科通常需要对数据和模型进行解释、操作与处理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 可视化
限制150内