Intranet GIS概述

 

中国科学院地理所信息室 修文群 宋先锋

返回

 


一、Intranet GIS的组成

所谓Intranet GIS是指在Intranet的信息发布、数据共享、交流协作基础之上实现GIS的在线查询和业务处理等功能。其中Web分布式交互操作是工作重点。

Intranet GIS的基本组成包括:

·WWW、Mail、FTP服务器;

·Browser/Plugins;

·页面描述语言HTML、VRML;

·Web交互技术,如Java、CGI、Active X;

·GIS数据库管理,如ARCSTORM、SDE。

二、Intranet GIS的特色

由于速率、安全性及面向业务处理等关键要素,Intranet GIS将首先在Intranet上获得广泛应用,利用Java、CGI、Plugins等开发技术,使企业用户直接通过Browser对GIS数据进行访问,实现检索查询、制图输出、编辑修改等GIS基本功能。

1.传统GIS的弊端

多数GIS系统都是基于文件共享的低级分布式结构,数据集中存放于服务器,由空间数据库系统进行统一管理,在客户端采用GIS桌面系统进行远程文件调用。所存在的主要问题是:

·文件服务器结构的处理能力完全依赖于客户端,其效率低下。

·客户端的任何操作都要将服务器文件远程复制到本地进行。当多用户并发操作时,网上存在多个备份,因此,数据的完整性难以控制;大量数据频繁传输,易造成网络瓶颈,降低系统性能。

·成本高。企业用户使用GIS仅限于一般功能,而每个客户端都要配备昂贵的专业GIS软件,这无疑是巨大的浪费。

·GIS桌面系统操作复杂,操作人员需要有专业基础和经过专门培训,不适合企业级及大众化应用。

2.Intranet GIS的优势

·大规模降低成本,全面取代GIS桌面系统。

·将企业成员的交流合作与GIS专业操作有机地结合,构成企业群体生产力。

·用页面取代窗口,使系统简单易用,降低了专业操作的难度。

·充分利用网络资源,对于复杂的处理,诸如大规模查询,则交由服务器执行,而数据量较小的简单操作则由客户端完成。这是一种理想的全局优化模式。

 

三、功能实现

1.通用网关接口(CGI)

Intranet GIS最先使用的方法是CGI技术。GIS厂商在其成熟产品的基础上兼容发展Intranet解决方案,通常采用CGI方案,即提供专用空间数据库的Web接口。CGI是一种连接应用软件和Web服务器的标准技术,是HTML的功能扩展。HTML超文本是一种不可编程的静态文本,它的设计原则是显示数据和文件,而不是处理数据,因而不能用来产生动态的信息,缺乏交互性。但是,灵活易用的CGI程序与HTML的结合实现了交互式的动态通信。例如,为了让用户存取数据库中的信息,CGI可以被用来连接网络服务器中的数据库服务器,在系统中起桥梁作用。1997年ESRI推出了MapObjects Internet Map Server,使用HTML将客户端的请求传给Web服务器,而Web服务器则通过专用的CGI访问GIS服务器,GIS服务器承担了所有的查询、计算工作,将结果构建成一个HTML文档反馈给Web服务器,再将HTML文档传给客户端浏览器。

由于CGI是网络服务器上可执行的程序,任何人要访问相应的网络服务器,都可以运行CGI程序。基本上所有的计算机语言都可以用来扩展CGI程序,最常用的几种包括C、C++、Perl和VB。Web一出现,CGI技术很快就被用于构造能产生动态地图的Web网站。根据程序的特点,GIS CGI技术方法可分为以下两类:

(1)CGI启动制图软件以批处理方式运行

一个典型的例子是美国施乐公司的地图服务器。它是由一个简单的制图软件经修改后成为以批处理方式运行的程序,可以根据命令行参数产生各种不同的地图。其运行结果通常以GIF格式返回给用户。这种系统的好处是程序简单、运行速度比较快。但由于它的简单,比起商业化的制图软件则显得能力不足,然而大多数商业GIS软件并没有设计成以批处理方式运行。例如,尽管ARC/INFO可以以批处理方式运行,但要把它作为网络服务器后端制图软件是不切实际的,因为ARC/INFO的启动时间较长,而且如果没有用户的介入则很难处理复杂地图。

(2)CGI启动后端GIS程序

很多GIS软件是基于图形用户界面、用“事件”(Event)驱动的,一旦启动,就可以一直运行等待触发事件。这种系统有许多优点,而且网络浏览器也是利用图形用户界面由事件驱动的。一个网络浏览器上的事件,通过CGI很容易传到后端GIS软件上,CGI和后端GIS软件的信息交换通过进程间通信协议IPC来完成。常见的IPC协议有传统Unix上的远程过程调用RPC、Windows的动态数据交换DDE及实体连接和嵌入OLEMAC机上的Apple Event。利用这种CGI方法,只要用户在网络浏览器上按一下,信息就通过交互网络传回到网络服务器上,然后由CGI程序将此信息通过IPC传至后端的GIS软件。例如,可以要求GIS软件将地图中的某个地区放大,然后将放大后的地图屏幕图像传给用户。

这种方法的优点在于,运行速度较前一种快,因为它不需要每次启动后端的GIS软件,同时可以利用商业化GIS软件产生出高质量的地图。事实上,GIS软件的所有功能都可以被利用起来。

但这种方法仍有许多不足之处。首先,很难同时运行多个CGI程序;其次,这种方法需要制图软件一直处于运行状态,这不仅要求GIS软件所在的服务器一直联机,而且也消耗不少计算机资源。另外,从服务器方面驱动的CGI必须用某个特定的数据库服务器的专用SQL语言手工编写数据库接口,还有网络安全问题和有限的交互性问题。这种系统的例子有ESRI的Internet Map Server(http://www.esri.com)、MapInfo的Proserver(http://www.mapinfo.com))。

2.Plugins GIS插件

基于CGI的系统仅提供给用户端有限的GIS功能,传给用户的信息都是静态的,而且用户的GIS操作都需要由服务器来处理。解决这个问题的方法是把一部分服务器上的功能移到用户端上,这样不仅加快了用户操作的反应速度,而且也减少了网上的流量。标准WWW浏览器只提供了一些最基本的浏览和导航功能,而缺乏处理地理空间数据的能力。

方法之一是安装能与网络浏览器交换信息的专门GIS软件。这种增加网络浏览器功能的方法就叫插入法(Plugins)。为便于其它软件厂商发展插入型软件,Netscape公司专门提供了一套应用程序接口(API)。目前这种插入软件已被普遍采用,在多媒体领域尤为明显。这种插入软件不但可以增加网络浏览器处理地理空间数据的能力,使人们更容易获取地理数据,而且可以减少网络服务器的信息流量,从而使服务器更有效地为更多的用户服务,因为大多数用户的数据处理功能可以由网络浏览器插入软件来完成。美国ARGUS制图公司的地图显示软件MapViewer(http://www.argusmap.com)就属于这类插入软件。Autodesk公司的Whip!(http://www.autocad.com)可支持通用浏览器访问AutoCAD数据的能力。与传统的应用软件类似,插入软件也需要先安装再使用,因而传统软件中不同版本之间的不兼容性及版本管理问题仍然存在。

Autodesk为Intranet提供了一种新的二维矢量文件格式DWF及被称为Whip!Plugins的浏览工具,以便用户能有效地从Intranet下载工程技术及设计类的数据资料。借助这些新技术,用户可以查阅二维矢量数据,并可利用高速缩放和平移功能迅捷地浏览内容复杂而详尽的图形文件。此外,对嵌入的URL的支持可允许用户在Intranet中与其它站点建立直接的联系,从而使世界各地的设计人员能够通过Internet在设计项目上进行合作。

3.Java Applet

尽管插件可以和网络浏览器一起有效地处理空间数据,但这种方法仍有不少缺陷。首先,它将导致用户端负担过重,因为几乎每个软件厂商都希望它的软件能与交互网兼容。显然这不符合标准网络浏览器的设计思想。其次,众多插入软件的管理会成为信息技术部门的一个大问题,因为无论任何人,只要可以联入互联网就都可以接收最新的插入软件。为解决上述问题,互联网程序语言应运而生。目前最普及的互联网程序语言是Java,另一种语言是由微软公司提出的Active X。与Java相比,Active X目前还没有解决非常重要的网络安全问题。

互联网程序语言与前面所述的几种方法的不同之处主要在于,允许可执行程序从网络服务器上传到用户机器上,并直接在用户机器上执行,从而省略了一整套传统软件的安装过程。由于程序是在用户端执行的,因而避免了用户和服务器之间不必要的信息流量,提高了整个网络的运行效率。另外,这种方法让用户可以自由地处理每个地理实体,而不只是获取一幅由服务器处理好的静态图像。

 

四、设计思想

1.GIS网络协议

开发一组支持传输GIS空间数据的网络协议对GIS在Intranet中的生存和发展十分重要。作为HTTP协议的扩充,开发基于HTTP的GIS数据通信协议是较好的解决办法。

·HTTP的可扩展性和面向对象的特性使构造新的协议简单易行。

·TCP/IP与HTTP是非常流行的协议,而处理专题信息的GIS网络协议难以得到广泛认可。

·与HTTP捆绑的GIS协议可迅速遍布Intranet。

2.Intranet GIS多源数据的集成

在Intranet普及之前,GIS系统集成的重要性就已被专家们意识到了,并且提出了全关系化、面向对象等解决方法,但是这些方法在多元数据的集成和专题模型与GIS系统的集成方面都存在着一些问题。随着Intranet的广泛应用,GIS面对的是一个松散的开放性的网络,它蕴藏着无穷的信息资源。Intranet GIS如何访问外源数据库,并从中迅速检索出Intranet GIS所需要的信息,是Intranet GIS系统集成的新的内涵。

Intranet GIS系统集成应包括两个方面,即建立与外源数据的动态链接;利用元数据库实现数据与处理方法集的统一封装。方法集是由一系列字符串表示的数学公式,用户可以动态编辑这些公式。

3.多线程模型

GIS用户会注意到,在应用程序读/写文件或执行耗时较长的复杂的检索、计算和图形刷新时,整个应用程序会处于阻塞状态,用户只能被动等待。网络用户亦会注意到,网络的带宽非常有限,多个用户同时访问同一服务器则会导致网络性能急剧下降;网络传输和I/O操作只能占用小部分CPU资源,而大部分CPU时间被闲置;此外,慢速的I/O操作与耗时、复杂的查询或计算一样,用户须被动地等待一项任务完成后再执行其它比较迫切的任务。所有上述问题都是由于应用程序采用了单线程运行机制的缘故,因此,为了合理地利用网络与机器资源,Intranet GIS需要建立支持高度并发性的多线程模型。

4.平台独立性

Intranet是一个开放性的网络,与其相连的主机运行着各种各样的平台,这些操作系统唯一的共性是对TCP/IP协议的支持。在当前标准和开放系统备受推崇的时代,跨平台和可移植性在一定程度上决定了Intranet GIS的可应用性。

 

五、数据模型

Intranet GIS的内部数据采用了面向对象的数据模型,包括点、线、多边形和注释四种基本空间对象类型,每种对象类型包括空间数据和属性数据。图层对象由多个空间对象类型组成,属于同一空间坐标系的图层组成一幅地图。

Intranet GIS与外部数据的动态链接采用了两种方式,即对网络中的GIS空间数据的访问采用GIS空间数据协议;对Web数据库的访问采用JDBC或Java SQL的访问方式。Intranet GIS与Web数据库的动态链接主要表现在与关系型数据库的链接方面,这是由于政府、企业等组织的最有价值的信息一般都存储在Sybase、Oracle、Database等商业数据库中,这种先期的信息管理方式将促使政府、企业继承原平台继续投资。另外,关系型数据库推出了适应处理多媒体数据的Data Blade技术,同时,各种关系型数据库均推出了比较完善的Intranet解决方案。

 

六、计算模式

1.分布式并行计算

Intranet GIS采用浏览器/服务器的计算模式,它支持数据分布和操作分布。对于数据分布,一般是指数据在客户端的分布。但是,Intranet GIS利用Java提供的URL对象访问网络上的数据库/文件,其访问方式就如同访问本地文件系统一样,这样,Intranet GIS获取数据就绕开了繁忙的Web 服务器。对于操作分布,Intranet GIS在客户端运算,承担了服务器的部分工作量,从而提高了整个系统的执行效率,避免了服务器的瓶颈问题。

2.多线程并行式计算

单线程系统依靠一个无穷的事件循环模型来顺序控制系统的例程处理,而多线程模型是一种支持高度并发性的系统模型。由于多个任务很少同时长时间占用CPU,因此,多线程模型将多个任务分为若干个独立的线程并发执行,充分利用了系统资源。

Java的多线程机制使Intranet GIS的并行式计算成为可能。Intranet GIS支持I/O吞吐、查询计算、图形刷新和用户界面等多线程的并发执行。其中I/O线程的优先级最低;查询计算时,图形刷新和用户界面响应的优先级最高。在一定的时间内,Java的抢占式执行方式使优先级高的线程获得了更多的执行时间,因此,Intranet GIS通过赋予与用户交互性强的任务以较高的线程级别来增加前台作业的速度,从而减少了用户的等待时间;耗时较长的操作则赋予较低的线程级别,置于后台,利用CPU的闲散资源来完成。