(这条文章已经被阅读了 89 次) 时间:2000-12-04 16:34:06 来源:黄果 (黄果) 转载
再 建 巴 比 塔
─ ─ 冯 志 伟 研 究 员 谈
我 国 机 器 翻 译 发 展 历 程
本 报 记 者 黄 果
——————————————————————————–
—-在 圣 经《 创 世 纪》 中 记 载, 古 代 各 地 的 人 说 的 语 言 都 是 相 同 的, 人 类 在 体 力 与 智 力 上 发 展 都 很 快, 并 要 合 力 建 造 通 往 天 界 的 巴 比 塔, 在 这 座 塔 建 成 之 时 便 可 以 脱 离 上 帝 的 控 制。 上 帝 得 知 后 十 分 恐 慌, 连 夜 将 人 类 的 语 言 分 成 许 多 种, 这 样 在 建 造 巴 比 塔 时 就 没 有 办 法 进 行 交 流, 于 是 建 塔 的 事 也 就 不 了 了 之 了。 机 器 翻 译 就 是 要 用 计 算 机 来 翻 译 文 字, 重 新 修 建 巴 比 塔。 为 了 了 解 我 国 机 器 翻 译 领 域 研 究、 开 发 和 市 场 的 历 史, 记 者 走 访 了 国 家 语 言 文 字 工 作 委 员 会 语 言 文 字 应 用 研 究 所 冯 志 伟 研 究 员, 他 长 期 参 与“863” 机 器 翻 译 的 评 测 工 作, 对 这 一 段 历 史 有 着 深 刻 的 了 解。
立 项 伊 始
—-我 国 的 机 器 翻 译 是 从50 年 代 中 期 开 始 起 步 的,1956 年, 在“ 中 国 科 学 发 展 远 景 规 划” 中 提 出 了 两 个 亟 待 解 决 的 问 题: 一 是 要 学 习 西 方 先 进 国 家 的 科 学 技 术, 进 行 科 技 文 献 的 翻 译 工 作; 二 是 未 来 的 机 器 翻 译 可 以 用“ 数 学 方 法” 来 描 述 语 言 的 面 貌, 以 便 于 趋 向 精 确, 让 计 算 机 可 以 处 理, 这 就 要 建 立 自 然 语 言 的 数 学 理 论, 两 者 的 结 合 自 然 就 产 生 了“ 机 器 翻 译”, 于 是“ 机 器 翻 译、 自 然 语 言 翻 译 规 则 的 建 立 和 自 然 语 言 的 数 学 理 论” 这 个 课 题 就 被 批 准 立 项 了。
—-1959 年, 我 国 第 一 个 机 器 翻 译 系 统 诞 生 了, 这 就 是 中 国 科 学 院 语 言 研 究 所 与 计 算 技 术 研 究 所 合 作 的 俄 译 汉 的 翻 译 系 统, 这 个 系 统 还 很 不 成 熟, 当 时 只 做 了9 个 不 同 类 型 的 句 子 翻 译 的 实 验, 所 采 用 的 机 器 是 我 国 早 期 自 行 研 制 的104 机, 当 时 还 没 有 解 决 计 算 机 的 汉 字 信 息 处 理 问 题, 外 围 设 备 也 差, 无 法 在 屏 幕 上 显 示 翻 译 好 的 汉 字, 只 能 输 出 穿 孔 纸 带, 外 行 人 根 本 看 不 懂, 所 以 谈 不 上 什 么 实 用 性; 但 是, 这 个 成 果 证 明 了 用 机 器 帮 助 人 把 外 文 翻 译 成 中 文 是 可 行 的, 因 此, 当 时 的《 科 学 通 报》 发 表 了 这 个 有 重 要 学 术 价 值 的 成 果。
—-1960 年 初, 语 言 研 究 所 与 北 京 外 语 学 院 提 出 了 一 个 英 汉 翻 译 的 方 案, 但 没 有 实 际 上 机 实 验。 此 外, 北 京 俄 语 学 院、 广 州 华 南 工 学 院、 哈 尔 滨 工 业 大 学 也 分 别 成 立 了 机 器 翻 译 研 究 组, 进 行 俄 汉 或 英 汉 机 器 翻 译 的 试 验。 在 文 化 大 革 命 初 期 和 中 期, 机 器 翻 译 研 究 被 迫 暂 停 了。
出 现 转 机
—-文 革 后 期 的748 工 程, 对 机 器 翻 译 重 新 给 予 重 视。1975 年, 成 立 了 由 情 报 所、 语 言 所、 计 算 所、 冶 金 部、 林 业 部、 核 工 业 部、 化 工 研 究 院、 中 国 医 学 科 学 院 等 单 位 参 加 的 全 国 机 器 翻 译 协 作 研 究 组, 以 冶 金 题 录5000 条 为 试 验 材 料, 制 定 英 汉 机 器 翻 译 方 案 并 上 机 试 验。1976 年 粉 碎“ 四 人 帮” 后, 机 器 翻 译 研 究 全 面 复 苏。1978 年, 在 计 算 所111 机 上 进 行 英 汉 冶 金 题 录 机 器 翻 译 系 统 的 抽 样 试 验, 抽 样20 条, 达 到 了 预 期 的 效 果。 当 时 用 机 器 翻 译 系 统 翻 译 整 篇 文 章 还 比 较 困 难, 因 此 这 个 机 器 翻 译 系 统 主 要 用 于 翻 译 外 文 资 料 的 题 目。
—-1982 年 对 机 器 翻 译 研 究 而 言 是 一 个 重 要 的 转 折 点, 在 这 一 年,PC 机 被 应 用 在 机 器 翻 译 的 研 究 开 发 上。 以 前 的 研 究 都 是 采 用 大 型 机, 而 只 有 少 数 单 位 才 有, 于 是 没 有 条 件 的 单 位 只 好 到 中 国 科 学 院 计 算 中 心 上 机, 机 时 费, 一 年 要 交 几 万 元, 这 么 大 的 投 资 给 开 发 人 员 的 心 理 压 力 也 十 分 大。 使 用 PC 机 后, 研 究 人 员 节 省 了 大 量 的 经 费 和 时 间。
走 向 大 众
—-军 事 科 学 院 曾 经 开 发 出“ 科 译 一 号” 实 用 型 全 文 与 题 录 兼 容 的 英 汉 机 器 翻 译 系 统, 在 富 士 通 中 型 机 上 运 行, 由COBOL 语 言 编 写, 原 型 系 统 运 行 效 果 良 好, 译 文 质 量 较 高。1986 年, 中 软 公 司 发 现 了 这 个 机 器 翻 译 系 统, 就 把 它 买 下 来, 用C 语 言 改 编 成 在PC 上 运 行 的 机 器 翻 译 系 统, 并 且 把 它 商 品 化, 取 名 叫 做“ 译 星”。 译 星 的 诞 生 有 着 特 殊 的 历 史 意 义, 首 先, 它 是 我 国 第 一 个 运 行 在PC 机 上 的 机 器 翻 译 软 件; 其 次, 它 也 是 我 国 第 一 个 商 品 化 的 机 器 翻 译 系 统。 当 时 的 售 价 是 几 千 块 钱 一 套, 几 百 套 的 销 量 给 中 软 公 司 带 来 了 巨 大 的 经 济 效 益。
—-在 此 期 间, 同 时 进 行 研 究 的 还 有 高 立 公 司 与 社 科 院 语 言 研 究 所 联 合 开 发 的 高 立 机 器 翻 译 系 统, 这 是 在 50 年 代 的 工 作 基 础 上, 按 照 比 较 严 格 的 语 言 学 规 则 进 行 开 发, 语 言 模 型 比 较 成 熟。 同 时, 科 学 院 计 算 技 术 研 究 所 陈 肇 雄 等 人 研 制 了“ 快 译 通”, 当 时 香 港 的 权 智 集 团 对 这 个 产 品 评 价 很 高, 认 为 会 拓 展 一 个 大 市 场, 于 是 投 资1800 万 美 元, 建 立 了 科 智 语 言 信 息 处 理 有 限 公 司, 专 门 进 行 机 器 翻 译 系 统 的 开 发。 与 别 的 翻 译 软 件 不 同 的 是, 快 译 通 是 固 化 在 硬 件 的 芯 片 中, 这 个 硬 件 有 点 像 今 天 的 个 人 数 字 助 理(PDA), 只 有 巴 掌 大 小。 让 人 大 跌 眼 镜 的 是, 这 个 产 品 推 出 后 销 路 非 常 好, 当 时 许 多 海 外 华 人 的 子 女 都 不 会 认 中 文、 说 中 文, 而 海 外 华 人 对 中 国 文 化 有 一 种 归 依 感, 认 为 子 女 必 须 继 承 中 国 文 化, 所 以 将 快 译 通 当 作 一 种 高 级 玩 具 买 给 自 己 的 儿 女。
新 巴 比 伦 塔
—-网 络 的 出 现 对 机 器 翻 译 提 出 了 新 的 挑 战, 也 带 来 了 新 的 机 遇。 在 因 特 网 发 展 的 早 期, 网 上90% 的 信 息 是 英 文 的, 不 懂 得 英 语 就 是 一 个 大 难 题 了, 所 以, 人 们 对 翻 译 软 件 的 要 求 就 变 得 十 分 迫 切。
—-在 网 上 做 机 器 翻 译 比 在 单 机 上 做 机 器 翻 译 更 加 困 难, 其 难 点 在 格 式 上, 原 来 做 翻 译 软 件 都 是 基 于 纯 文 本 的 研 究, 没 有 格 式 的 要 求, 而 网 页 是 用HTML 格 式 编 写 的, 有 图 片、 颜 色 和 各 种 字 体, 所 以 机 器 翻 译 时 必 须 把 网 页 转 换 成 纯 文 本 进 行 翻 译, 然 后 再 将 翻 译 后 的 文 字 转 换 成 网 页 的 形 式, 这 其 中 不 能 在 格 式 上 有 所 偏 差。 网 络 机 器 翻 译 对 翻 译 的 速 度 也 提 出 了 更 高 的 要 求。 中 国 的 上 网 费 用 十 分 昂 贵, 如 果 翻 译, 就 要 花 费 大 量 的 时 间 用 来 等 待, 也 使 上 网 费 用 增 高, 因 此, 网 络 用 户 期 待 着 高 速 度 的 机 器 翻 译 产 品 的 出 现。
—-桑 夏 公 司 比 较 早 就 进 行 了 网 络 环 境 下 机 器 翻 译 的 研 究 工 作, 史 晓 东 等 开 发 出“ 光 翻 译 系 统”(Light)。 为 了 推 广 普 及 机 器 翻 译 的 概 念 与 产 品, 桑 夏 公 司 还 建 立 了“ 看 世 界” 网 站。 在 这 个 网 站 上, 只 要 输 入 英 文 网 页 的 网 址, 就 能 马 上 看 到 相 应 的 中 文 译 文, 而 这 一 切 都 是 由“863” 计 划 支 持 研 究 的 桑 夏 机 器 翻 译 产 品 在 后 台 解 决 的。 虽 然 目 前 在 准 确 率、 通 顺 性 上 不 尽 如 人 意, 但 人 们 阅 读 翻 译 后 的 文 字 可 以 明 白 一 个 大 概 的 意 思。 后 来, 桑 夏 公 司 又 在 它 的 机 器 翻 译 系 统 中 加 入 了 原 文 与 译 文 同 屏 对 照 的 技 术, 这 样 即 使 看 不 懂 译 文 还 可 以 再 参 照 原 文, 使 得 信 息 的 获 取 更 加 方 便。
—-人 们 对 于 机 器 翻 译 的 认 识 是 逐 渐 深 化 的, 不 可 能 永 远 停 留 在 同 一 个 水 平 上, 因 而 机 器 翻 译 的 研 究 也 是 没 有 止 境 的, 随 着 研 究 工 作 的 深 入, 机 器 翻 译 的 水 平 将 会 不 断 地 提 高, 它 将 会 受 到 越 来 越 多 的 用 户, 特 别 是 网 络 用 户 的 欢 迎。