“空间数据”在决策支持中的应用

 

倩洋

返回


一、数据的空间属性

 

据估计,80%以上的数据都具有空间属性,而对这些空间数据(例如,地图数据)的管理已经成为了许多企业信息系统管理的一个重要组成部分,其应用十分广泛。

 

业界几乎所有的专业人士都不同程度依赖空间信息进行决策支持,他们采用空间数据库系统捕捉、存储空间数据,并推广应用到数据仓库和数据集市,用户在使用过程中能够非常方便地利用这些数据进行数据分析。
通常我们能够通过带有经纬度的坐标系统(x,y)来描述一个汽车站,用直线描述街道以及用一系列线段描述汽车线路,然后应用系统就能够很好地解释带有地理属性的数据,例如点、线和路径。而在计算机的处理中,通常需要采用系统软件引擎将对象模型化,使得它们能够很好地将人们所熟识的东西表现出来,同时也就大大提高了系统的可维护性和易用性,通常我们会通过传统的面向对象的技术来达到这个目的。因此,为了更好地理解商业上所需要的空间数据,我们根据对某数据更新的频率和数据访问的次数对数据进行分类。x坐标代表数据的访问次数,y坐标代表数据的更新频率。空间数据可以用来表示简单对象,(例如点的经纬度);也可以进一步表示地址或者复杂对象(例如城市、公园和高速公路)。
可以看出数据访问频率的差距很大,慢的可以是几年甚至几十年访问一次,例如档案数据(物体自然属性、存储信息等);快的可以是一分钟上千次,例如对于销售信息的处理。实时或者类实时数据(销售变化、客户电话技术支持或者突发性事件报告)更新速度是非常迅速的。通过对这些数据的处理,为用户揭示数据之间的关联,为决策人员提供一个良好的辅助进而制定行之有效的运营政策。
如果想要合理地管理、存储与访问这些数据,就需要管理系统具有很强的数据交互处理能力,并具有很好的安全保密性,同时帮助用户更直观揭示每一个数据对象的含义。用户需要应用系统能够在最短的时间内以最简洁的方式提供准确的信息。

二、通用坐标系统

空间数据应用的关键在于这些空间数据是否能够在普通数据库中进行索引。例如,经纬度坐标可以用来表示地球上任意一点所包含的许多相关数据,如海拔、土地归属、人口分布、坡度以及其他相关文件信息。在这里,空间数据就是地理空间数据。但是空间数据绝不仅仅限于地理空间数据。空间数据可以被广泛应用在项目设计、汽车维修、石油化工以及生物工艺等,而这些空间数据已经逐渐为IT业务部门的经理们所熟悉。
目前,许多企业级的空间数据应用系统还只是停留在为大家所认识的阶段,尽管在许多情况下其使用是十分必要的。大部分管理人员仍然认为空间数据应用仅仅是类似“我所在的位置200英里范围内客户分布情况如何?”之类的广义查询。管理人员也才刚开始学习如何将空间数据的应用与企业应用系统结合在一起。实际上,空间数据包括任何在普通空间坐标系统中能够被索引到的数据。
一个企业级的空间应用系统要求能够将任何数据移植到普通的坐标系中,这个过程包括对数据的准确分类和注册,以及使所有的数据能够与一个空间坐标系建立关联(地理编码)。而对于图形数据来说,则要求应用系统要对图形数据进行重新定位,以便能够清晰地将图形数据在普通坐标系中定位。这一系列工作,包括数据分类、注册以及重新定位的实现,就能够保证数据库中的每一个对象被准确无误地叠加在地图上。这样也同时大大减少了数据的冗余,实现数据挖掘以及数据的可视化分析。例如,任何一个企业都拥有自己的客户数据库。地理编码过程可以对每一条客户记录叠加经纬度信息,这样经纬度客户信息就可以被影射到图层上(光栅图)。

三、应用系统

下面的几个例子说明了空间数据库应用系统发展所面临的挑战,这些例子包括:美国市政府交通部门、运输部门以及美国的一个零售公司。
1、政府交通部门
对于一个城市,交通道路的建设一直是一个非常严峻的问题。随着城市建设的发展,居民的居住地点更新非常迅速,对于交通道路改善的需求也越来越大。政府公共事务及交通发展处理部门希望通过发展交通管理系统来解决这个问题。
为此,美国市政府交通部门安装了近200万个传感器来监视交通流量变化、在飞机上配置高稳定性录像装置,在主要的交通路口装配录像器并在每一辆公共汽车上安装GPS装置,最大限度减少交通阻塞。交通管理部门以及各交通管理站可以得到电子的或者是纸张文档(例如传感器的特性以及城市交通条例等)和交通流量图表,而录像则通过网络由录像中心向各地传送。
尽管这些工作均能够被完成,但是大量数据仍然是在不同的平台、不同的管理系统下管理和存储,这就要求管理部门的人员必须将这些数据进行再整理。因此对于数据的合理应用就得依靠使用人员对于不同系统、不同平台的使用经验,这对于其他人来说是非常不容易的。最终系统的运行效率和维护往往因为管理人员对于其他平台和系统的熟悉程度而受到限制。
2、运输部门
美国National Express公司每一天都要向全世界各地递送约250万个包裹。为了完成每天的工作,公司每天要出动3000辆卡车和500架飞机。如果能够为每一名运输人员提供最短路径,将会大大提高公司的工作效率。National Express公司将GPS和远程监控技术运用到了最短路径制定的问题上。GPS数据通过安装在每一个运输工具上的传送装置传送到总控制室,并在地图上显示,为控制和分析人员提供一个非常全面和完整的当前车辆运输情况数据的显示。应用系统将每一辆卡车所走过的路线都记录下来,每一条街道和每一个十字路口每经过1英里或5英里就生成一幅栅格图象,这样根据不同的包裹生成各自的运送路线。
National Express决定将路径优化模式与数据库集成。根据包裹车所经过的取包裹的路线以及不同的目的地,由这些优化模式来定义最优的运输线路。一旦路线出现问题,系统会进行报警,同时会自动为控制人员显示出一条最佳路径。对不同的路径按照不同的比例尺进行显示,控制人员就能够通过不同的角度来分析路径的优化程度。这样公司的控制人员就可以为运输人员在最短的时间内提供出最短路径。
3、分销部门
在分销业务中数据量大(本地数据、地区数据以及国内数据)、数据类型复杂(字符、图形、录像、文本等),空间数据决策支持系统能够帮助他们做房地产管理、风险分析、市场分析以及投资优化等工作。
美国Nationalmart公司是一家拥有上千家零售店的分销商,如何能够使每一家零售商店都能最大限度地扩大销售,获得最大的利润,是其所关心的问题。通常分销商会收集所有零售商店的相关信息,包括零售商店的照片、地理位置、货物存储量、销售计划、房屋租借时间、该地区人口分布情况以及客户分布情况等等,这些数据包罗万象。为了能够制定更好的运营策略,Nationalmart公司必须要对这些数据进行整理和有效地应用。另外,对于每一个零售店都要分别建立相应的销售计划、会计手续等。所有这些数据都可根据其空间属性进行分析。
Nationalmart决定建立一套能够进行空间分析的数据仓库,管理、查询、恢复以及索引数据,通过不同的方式来分析数据。例如公司的决策制定人员也许希望能够在一张地图上看到所有Mid-Atlanta地区的零售商店,而且通过在地图上点击相应的零售商店能够得到该店的照片、销售计划和租借时间等数据。这样决策人员就可以根据人口分布、商店的地理位置以及货物储量进行分析。最终决策人员希望能够了解消费者的购买本公司产品的愿望,优化产品在不同区域之间的分布。通过对这些相关数据的分析,决策制定人员就能够制定出行之有效的运营策略,同时根据不同零售商店的情况将产品进行合理分配。