互 联 信 息 空 间 InterSpace

北 京 大 学 信 息 科 学 中 心
唐 世 渭 杨 冬 青 王 军

返回


---- 从 根 本 上 说, 数 字 图 书 馆(D-Lib) 是 为 了 解 决 网 络 环 境 下 数 字 化 信 息 的 组 织、 查 询 与 服 务 问 题。D-Lib 所 处 理 的 对 象 是 网 络 上 的 数 字 信 息, 它 希 望 提 供 类 似 于 传 统 图 书 馆 的 良 好 的 信 息 服 务, 如 有 序 化 的 组 织、 结 构 化 的 存 储、 高 效 准 确 的 检 索、 友 好 的 咨 询 等。 传 统 图 书 馆 提 供 这 些 服 务 的 基 础 是 对 收 藏 资 料 的 严 密 的 分 类 组 织, 如 编 目、 著 录、 索 引 等。 但 是 在 网 络 环 境 下, 数 字 化 收 藏 并 不 具 备 这 些 特 点。 目 前,Internet 的 主 要 问 题 就 是 查 找 困 难, 而 造 成 这 一 困 难 的 根 本 原 因 有 两 个:

----网 络 上 大 量 的 信 息 都 是 无 组 织 的。

----由 网 络 互 联 在 一 起 的 分 布 的 信 息 仓 储 是 异 构 的, 各 自 提 供 不 同 的 检 索 方 法, 难 以 实 现 跨 仓 储 的 统 一 查 找。 信 息 仓 储 是 指 网 络 上 各 种 各 样 大 大 小 小 的 信 息 资 源 集 合, 小 到 个 人 的 信 息 收 藏, 大 到 一 个 单 位 的 企 业 数 据 库。 例 如, 专 业 的 联 机 检 索 系 统、 大 学 图 书 馆、 搜 索 站 点 等 都 是 信 息 仓 储。 每 一 个 仓 储 都 是 一 个 相 对 独 立 的 信 息 空 间, 并 带 有 各 自 的 信 息 处 理 方 式。

----以 上 两 个 问 题 是D-Lib 体 系 结 构 致 力 于 解 决 的 问 题。 对 于 前 者, 一 方 面 是 设 计D-Lib 中 的 基 本 管 理 单 位 — — 数 字 对 象 的 信 息 结 构, 这 在 前 面 已 做 了 介 绍; 另 一 方 面 是 提 供 一 个 合 理、 灵 活 的 组 织 框 架 和 协 议, 每 个 仓 储 在 本 地 对 各 自 的 信 息 进 行 组 织, 并 施 以 相 应 的 筛 选、 索 引、 联 合 等 控 制。 在 此 基 础 上, 再 在 各 信 息 仓 储 间 进 行 互 联, 以 解 决 第 二 个 问 题。 这 样 的 信 息 仓 储 也 称 为 信 息 空 间。

----可 以 把 当 前 的Internet 看 成 是 一 个 协 议 环 境, 这 个 协 议 环 境 将 分 布 的、 异 构 的 各 个 信 息 网 络 联 接 起 来, 实 现 数 据 跨 网 的 透 明 传 输。 它 的 基 本 功 能 是“Inter Net”( 网 络 互 联), 以 提 供 物 理 机 器 间 的 数 据 通 信。 而D-Lib 是 将 信 息 空 间 互 联 起 来 的 一 个 应 用 环 境, 其 目 标 是 在 分 布 的、 异 构 的 信 息 空 间 之 间 提 供 对 知 识 的 透 明 操 作, 满 足 用 户 的 信 息 需 求。 它 的 基 本 功 能 是“Inter Space”( 信 息 空 间 互 联), 以 提 供 跨 仓 储 的 信 息 处 理。 在 这 样 的 互 联 信 息 空 间 中, 用 户 从 多 个 信 息 源 中 将 信 息 以 多 种 方 式 关 联 起 来。 也 就 是 说, 如 果 把 当 前 的Internet 看 成 是 整 个 信 息 空 间 的 物 理 层, 那 么,D-Lib 就 是 这 个 信 息 空 间 的 逻 辑 层。 当 前 的 Internet 如 同 一 个 没 有 索 引 卡 片 的 图 书 馆,D-Lib 就 是 要 给Internet 加 上 一 个 无 形 的、 统 一 的 索 引 目 录。 使 整 个 网 络 成 为 一 个 单 一 的、 虚 拟 的、 有 组 织、 有 结 构 的 信 息 集 合, 提 供 统 一 的 跨 仓 储 的 无 缝 查 找。

----InterSpace 是 由DLI( 美 国 数 字 图 书 馆 启 动 项 目) 一 期 项 目 中 的 伊 利 诺 以 大 学(UIUC) 提 出 来 的, 他 们 实 现 了 一 个InterSpace 的 原 型 系 统。

项 目 的 研 究 内 容

 

----UIUC 的InterSpace 项 目 研 究 用 于 索 引 科 学 技 术 文 献 的 信 息 基 础 结 构, 使 对 多 个Internet 信 息 源 的 查 找 如 同 一 个 单 一 的 联 邦 的 数 字 图 书 馆。 该 项 目 开 发 一 个 对 多 媒 体 信 息 进 行 语 义 索 引 的 原 型 环 境, 语 义 索 引 依 靠 对 概 念 和 类 目 的 统 计 聚 簇 来 实 现。 基 于 语 义 索 引 的 交 互 式 导 航 使 对 大 量 的、 不 同 的 信 息 收 藏 的 检 索 能 在 一 个 更 深 的 层 次 进 行。 在 概 念 抽 取、 概 念 空 间 计 算、 类 目 图、 概 念 赋 予 等 自 动 化 技 术 的 支 持 下, InterSpace 原 型 实 现 跨 主 题 域、 媒 体 类 型 和 收 藏 量 的 可 伸 缩 的、 交 互 的 语 义 互 操 作。

----InterSpace 寻 求 将 互 异 的 分 布 式 信 息 资 源 统 一 在 一 个 一 致 的 模 型 里。 作 为 一 个 实 体,InterSpace 是 一 个 互 联 的 信 息 空 间 的 集 合, 每 一 个 成 员 的 信 息 空 间 包 含 了 某 社 区 或 某 主 题 域 的 知 识。 一 个 信 息 空 间 是 一 个 互 连 的 对 象 的 集 合。 网 络 上 的 每 一 份 电 子 文 献, 文 本 的 或 多 媒 体 的, 在 信 息 空 间 中 都 表 示 为 一 个 对 象。 该 模 型 的 基 本 抽 象 是 一 个 特 殊 的 对 象, 即 信 息 单 元(IU), 它 是InterSpace 系 统 中 组 织 的 基 础 单 位。 在IU 的 基 础 上, 系 统 提 供 对 复 杂 互 操 作 应 用 的 丰 富 的 支 持。 标 准 的 服 务 包 括: 对 象 间 互 联、 远 程 执 行、 对 象 缓 存 以 及 对 复 杂 对 象 的 支 持。 InterSpace 力 图 在 一 个 灵 活 的、 一 致 的、 可 伸 缩 的 系 统 中 表 示 所 有 的 数 据 或 对 象 类 型。

系 统 的 体 系 结 构

 

----InterSpace 系 统 由 三 层 组 成: 应 用 层 提 供 与 用 户 的 接 口; 应 用 编 程 环 境 层(APE) 包 括 编 写 各 类 高 层 应 用 所 需 的 通 用 服 务, 为 在InterSpace 中 编 写 程 序 提 供 了 一 组 简 单 的 通 用 对 象( 如 文 献 和 数 据 库) 和 一 组 通 用 高 级 服 务( 如 出 版 控 制 和 收 藏 分 析); 系 统 编 程 层(SPE) 包 括 信 息 空 间 和IUs 的 基 本 功 能, 这 是 InterSpace 的 核 心, 也 是 我 们 讨 论 的 重 点。

----IUs 是InterSpace 系 统 的 基 本 抽 象, 它 们 把 所 有 的 数 据 类 型 封 装 起 来。 类 型 强 制 器 用 于 克 服 在 未 知 类 型 间 转 换 的 困 难, 它 引 入 了 一 个 包 装 系 统, 用 于 封 装 外 来 对 象, 使 它 们 表 现 得 像 内 部 对 象 一 样。 查 找 和 索 引 作 为InterSpace 的 一 个 基 本 部 分 被 提 供, 大 多 数 复 杂 的IUs 产 生 一 个 可 索 引 的 版 本, 使 其 可 在 InterSpace 中 被 查 找。 显 示 和 交 互IUs 提 供 一 种 或 多 种 方 式 与 用 户 交 互。 这 些 交 互 单 元 称 为 视 图(Views), 视 图 可 以 互 相 嵌 入。 通 信 是 由 一 组 独 立 且 互 操 作 的 成 员 控 制 和 完 成 的。 结 构 类 型 系 统 负 责 管 理InterSpace 中 的 对 象 类 型, 它 包 括 一 个 完 全 的 对 象 描 述 语 言。 永 久 对 象 存 储 器 保 存 系 统 中 的 所 有 对 象, 并 负 责 其 他InterSpace 结 点 和 其 自 身 的 交 互。 外 部 服 务 将Internet 的 服 务 和 标 准 的 网 络 通 信 映 射 到InterSpace 中, 以 允 许InterSpace 对 象 和Internet 空 间 直 接 通 信。

信 息 单 元

 

----InterSpace 中 每 一 个 用 户 可 见 的 对 象 都 是 一 个 信 息 单 元 对 象 的 一 个 后 代 或 实 例。IU 是 系 统 中 所 有 对 象 的 基 础 构 造 单 位, 包 括 索 引 引 擎 对 象、 数 据 转 换 器 对 象 等。 所 有 的IUs 具 有 三 种 能 力, 即 显 示 自 身、 链 接 自 身 和 索 引 自 身。

----InterSpace 中 的 对 象 有 几 种 显 示 和 交 互 方 式。 对 象 与 一 个 或 几 个 视 图 对 象 相 关 联, 由 视 图 对 象 提 供 对 对 象 的 操 作 手 段。 多 重 同 时 的 对 象 视 图 可 被 嵌 入 到 一 个 给 定 的IU 的 任 意 个 独 立 视 图 中 去, 视 图IUs 也 支 持 检 查 用 户 输 入 数 据 的 正 确 性。

----IUs 间 的 链 接 可 涉 及 一 个、 多 个IUs 或 被 置 于 一 个IU 链 表 的IUs 集 合。 链 接 一 个IU 在 用 户 看 来 就 是 将 一 个 对 象 嵌 入 另 一 个 对 象。 链 接 系 统 完 全 独 立 于 继 承、 版 本 和 域 系 统。

----索 引 和 查 找 是 紧 密 相 关 的 操 作。 由 于IU 对 其 自 身 索 引, 而 使 该IU 可 被 查 找。 有 几 种 不 同 层 次 与 方 法 的 查 找, 根 据 被 查 找 数 据 的 性 质 可 选 择 不 同 的 查 找 手 段, 例 如 对 文 献 用 全 文 查 找, 对 二 维 地 图 用 坐 标 查 找。

----IU 对 象 有 一 系 列 的 属 性, 包 括 所 有 权 和 可 访 问 性。IUs 可 被 命 名, 每 个IU 都 有 一 个 数 字ID。IUs 可 拥 有 自 身 的 版 本,IUs 也 可 以 是 函 数 的 单 位, 可 像 独 立 的 程 序 一 样 被 调 用, 这 样 的IU 被 称 为 方 法IU。

----所 有 权 和 可 访 问 性 在InterSpace 模 型 中 通 过 访 问 器 的 抽 象 捆 绑 在 一 起。 访 问 器 是 被 置 于 某 个 给 定 的IU 的 访 问 器 表 中 的IUs。 当IUs 试 图 去 访 问 某 个IU 时, 系 统 利 用 该 访 问 器 表 检 查 其 权 限。 除 了 代 表 某 个 用 户 或 用 户 组 的IU, 其 他 任 何 IU 都 可 被 置 于 访 问 器 表 中, 例 如, 当 一 个 方 法IU 被 置 于 该 表 中 时, 该IU 就 可 被 访 问。IUs 可 被 若 干 个 用 户 拥 有, 每 个 都 具 有 不 同 的 访 问 权 限。

----IU 可 有 不 同 的 版 本。 当IU 变 更 自 身 时, 原 始 的 版 本 就 保 存 起 来 并 赋 予 新 的ID 标 号, 新 的IU 保 持 原 来 的ID 标 号, 称 为 当 前 的IU 版 本。 每 个IU 版 本 都 有 两 个 时 戳, 生 成 时 戳 和 变 更 时 戳, 变 更 时 戳 总 是 更 新 为 最 近 一 次 的 变 更 时 间。 当 请 求 某 个IU 时, 返 回 的 缺 省IU 是 当 前 的IU 版 本。 当IU 的 请 求 带 有 时 间 参 数 时, 根 据 该 时 间 选 择 相 应 的 版 本 返 回。

----IUs 存 在 于 被 引 用 为 域(Domains) 的 其 他 IUs 内。 域 类 似 有 文 件 系 统 中 的 目 录 或 程 序 设 计 语 言 中 的 模 块。 域 定 义 了 包 含 一 组IUs 的 名 字 空 间。IUs 可 属 于 一 个 或 多 个 域, 它 们 可 被 多 个 域 所 共 享。 这 样, 域 即 作 为IU 的 定 位 手 段, 又 作 为 包 装 一 组 相 关IUs 的 方 法。

----方 法IUs 是InterSpace 系 统 组 织 函 数 的 基 本 单 位。 方 法IUs 由 一 个 解 释 或 编 译 函 数 构 成。 大 多 数 的 方 法IUs 作 为 其 他IUs 的 组 成 成 员 包 含 于 其 中。 用 类 的 方 法 来 组 织 方 法IUs, 使IUs 具 有 了 更 大 的 灵 活 性 和 可 伸 缩 性。

----一 言 以 蔽 之,InterSpace 是 建 立 于 统 一 对 象 模 型IU 之 上 的 一 个 系 统,IUs 用 于 定 义 系 统 中 的 所 有 功 能。 利 用 IU 抽 象,InterSpace 系 统 实 现 了 灵 活 性 和 高 集 成 性。 再 加 上 应 用 环 境 及 其 查 找、 索 引、 链 接、 访 问 控 制、 包 装 等 功 能, 为 强 大 的 互 操 作 的 应 用 开 发 提 供 了 一 个 坚 实 的 基 础。