(2)知识数据有效组织。对于知识的有效组织对研究知识之间的关系具有重要意义。目前知识的冗余和重复性成为阻碍知识管理和学科分析的重要挑战,
(2)知识数据有效组织。对于知识的有效组织对研究知识之间的关系具有重要意义。目前知识的冗余和重复性成为阻碍知识管理和学科分析的重要挑战,必须对于这些问题进行客服才能实现比较理想的学科梳理和推进。然而,目前的一些处理办法都比低效,往往需要人力的大规模投入,不能充分利用机器的优良特性,从而造成大量的物质和精力浪费。当学科知识库中的知识量变得庞大时候,需要通过一定的组织来保证知识访问的性能不会下降剧烈,同时考虑到查询的并发性,使用文件存储数据不利于数据同时共享,数据冗余太大也会造成数据的不一致。因此,必须设计高校的存储系统存储和查询知识数据库,从而使得开销较小[22]。
(3)可视化数据的获取与显示。学科知识库的可视化一般是基于图进行的,通过使用不同的图元素进行关系的表示构建,对于知识概念和关联进行统一的表示和归纳。而数据的来源一般是通过人为的添加和增量产生,或者通过爬取其他数据库的知识内容作为本数据库的知识源之一。关于知识的梳理,一个重要问题就在于其格式的统一性。目前异构数据越来越广泛,对于格式的限制似乎变得更加松散,因此,往往不能使得知识形式具有比较好的统一显示,给学习者造成很多不便。对于这一类的研究,是为了方面知识的可视化获取和显示,帮助操作者能够高效处理大规模的数据和异构知识[23]。
(4)前端显示技术。前端的显示技术主要指的是前端的绘图技术,包括Canvas、 Flash动画和SVG技术。目前来说,前端技术的选取需要考虑一下几个方面:
兼容性,兼容性主要是指的工具的兼容性,以浏览器为例,不同的浏览器可能具有不同的标准,因此显示的形式也是不同的,需要对于其可视化的过程进行适配处理,保证在不同的硬件和软件环境下,可以比较理想地进行统一标准的可视化显示[17]。
动态交互性。用户体验和动态交互性是密切相关的,比如用户可能在操作过程中使用不同的响应事件,如鼠标点击,移动等,因此,针对图像中的任何一点像素,需要能够显影所有的鼠标键盘事件,这对动态交互性具有重要意义。
性能方面,前端可视化要求图形的绘制渲染必须足够的高效,由此才能带给用户比较好的使用体验,因此,针对浏览器性能的提升非常有意义。目前的性能优化方案主要集中在GPU的优化加速,从而提高浏览器或个别插件的运行速度。
2.4 平台支持
可视化技术往往涉及复杂的计算和数据处理,因此可视化技术的发展离不开基础平台的支持,目前高性能计算、云计算等新兴产业学科发展迅速,为可视化技术提供了有利的支持,目前可视化技术主要依托于云计算平台,通过平台提供的计算资源完成数据的运算处理,一些兴起的可视化平台也是在此类基础的云计算平台之上建构出来的[10]。
遵循Apache开源标准的Hadoop平台目前在业界得到了广泛的应用,这一系统最初有谷歌设计实现,目前在开源社区被广大开发者贡献完善,一些知名公司,如IBM。百度、阿里等也纷纷投入了人力来维护和研发此类基于Hadoop平台的云计算项目,该类云平台能够为学科可视化提供有力的资源和计算支持。但是需要注意的是Hadoop只是一个编程框架,不能直接进行学科可视化的操作,但是按照该框架的原则,可以使用比较简单的编程模型,迅速开发出适合生产环境的学科可视化系统。关于Hadoop的基本架构主要如图2.1所示。
Hadoop所基于的MapReduce实现多层次并行处理,可以实现数据处理的多核扩展,通过协调数据大小、通信模式和交互过程等方面,从而实现了高效的并行处理,能够打破串行信息处理的瓶颈。