(这条文章已经被阅读了 175 次) 时间:2000-10-23 18:00:53 来源:逸佳 (windsor) 转载
由于互联网起源于美国,使得英文成为互联网上资源的主要描述性文字。这一方面促使互联网技术和应用的国际化,另一方面又成为一些非英语文化地区人们融入互联网世界的障碍。为使用中文的人可以在不改变自己的文字习惯的前提下,使用中文来访问互联网上的资源,包括中国互联网络信息中心(CNNIC)在内的一些研究和服务机构都在为此做着不懈的努力。
中国互联网络信息中心自今年1月18日推出中文域名试验系统以来,通过与相关技术组织和其他互联网络信息中心的广泛交流合作,经过深入分析、研究和广泛试验,使得中文域名系统在技术方面取得了突破性进展。
一. 中文域名的技术难点
在中文域名技术实现中,困难主要来自两个方面:一是来自浏览器和现行的域名系统,二是由于中文自身特点。
目前,大多数的浏览器及域名系统软件皆是针对ASCII(英文)域名而设计的,例如:一些汉字的第二个字节与ASCII码字符集中的转义符””的代码相同(均为”0x5C”),因此当我们的中文域名里包含了这个字符(如姟⒎、仭悺、车龋┚投灾形挠蛎的正确解析造成了困难。
现有的网络资源浏览器,不论是英文版的还是中文版的,其内核对英文域名的支持是比较完善的,但是对中文域名的支持能力不够。这是浏览器固有的问题,是每个中文域名提供商都不可避免的问题。
解决浏览器问题的思路主要有两种:
1) 改进浏览器的功能,使它们能较好地支持中文。这是最理想化的方法,但这种方法不是一朝一夕就能实现的。
2) 在过渡阶段,可行的、较完善的解决方法是在用户的操作系统中,安装客户服务程序,以弥补浏览器本身的不足,从而实现对中文域名正常的访问。
中文域名技术中另一个困难来自于中文本身的特殊性。首先,从汉字书写形式上看,由于汉字有简体字(如”国”)和繁体字(如”國”,编码”0x87″,”0xf8″)之分,而简体字和繁体字并不是一一对应的。有时一个简体字对应两三个繁体字(例如,简体的”发”,繁体既有”發”,也有”髮”),反之依然,而且不同的搭配又会有不同的含义。为保证中文域名的互联互通,这一问题也必须解决。另外,从汉字编码方式上看,大陆和台湾采用了不同的汉字编码标准。大陆的标准为GB2312及其扩展GBK(即GB13000),台湾的标准为BIG5。GBK和BIG5采用相似的编码原理,但同样的二进制序列在GBK和BIG5中可能有不同的含义,如”0xb0″,”0xa1″在GBK中是”啊”,而在BIG5中是”陛”。现有的Window9X系统中,当用户在浏览器中的域名部分打入汉字时,操作系统会将汉字的本地编码(GBK或BIG5,依Window版本而定)或UTF-8编码放在域名请求的包中发给其网络配置中指定的解析服务器。要域名服务器识别出域名是GBK或BIG5编码或UTF-8是很困难的。
二. CNNIC中文域名技术优势
CNNIC此次更新的中文域名试验系统是两岸四地技术人员合作的共同智慧结晶。兼容性、开放、互通、符合国际技术标准是CNNIC的域名系统的几个重要特点。
1. 高度兼容,全球通用
CNNIC域名体系将同时提供”中文域名. CN”与纯中文域名(如”中文域名.公司”)两种方案。CNNIC不但将这两种技术完美结合而且也使之同现有的域名系统高度兼容。CNNIC的域名系统是在现有的域名系统上做最小的改变,以保证从现有系统到中文域名系统稳定、可靠、便利地过渡。该系统与现有域名系统兼容,并支持Unix、Linux、Windows等操作系统和各种通用浏览器。也就是说用户可以透过此系统顺利解析想要的中、英文域名,让用户在世界任何一个角落只要输入正确的中文域名皆可以顺利访问相应网址。
2. 繁简转换,两岸互通
支持简繁体的完全互通解析也是CNNIC域名服务的一个特点。例如,一个大陆用户想访问台湾的”宏碁電腦公司”,他完全没有必要在浏览器的地址栏中键入繁体的”宏碁電腦.TW”,而只键入大陆用户熟悉的简体汉字就可以了。而一位台湾用户如想访问大陆的”清华大学”网站,他也同样只需键入繁体的”清華大學”就可以了。
3. 使用方便,适用面广
在使用”中文域名.cn”时,用户可以不必安装客户端程序,用户所使用的ISP服务器也不用做任何的修改,就可以实现对中文域名的访问。如果用户要使用”中文域名.中国”,”中文域名.网络” 等纯中文域名的访问,也可以不必安装客户端程序,只要为用户提供服务的ISP做相应的改动,或者用户改变自己操作系统的DNS的配置使用CNNIC的服务器。
如果用户的ISP存在防火墙限制,用户不能使用本ISP以外的其他域名服务器,情况就会更复杂一些,发向本ISP以外的其他域名服务器的中文域名请求会被防火墙屏蔽,造成访问失败。对于这一问题,CNNIC可以为用户提供一个客户端安装程序,它不仅可以为计算机新手配置好服务器,也可以解决某些浏览器固有的问题,还可以将全中文域名以HTTP请求的方式发送出去,从而绕过防火墙。也就是说在HTTP上建立一个专用通道完成解析。
4. 兼顾多种标准,符合国际趋势
从体系上,CNNIC域名体系完全与国际中文域名技术发展趋势保持一致,提供通用一致的服务器端平台,将与中文域名相关的本地化问题与服务端问题隔离。
从选用的编码格式上兼顾了国际标准(UTF-8)、国家标准(GB2312,GBK)和工业事实标准(BIG5)。CNNIC提供的服务器可支持GBK(包括GB2312)、BIG5、UTF-8、各种ACE编码(如RACE等)形式和ASCII等。编码UTF-5、RACE 属于ACE,UTF-5、RACE 、UTF-8都是转化格式编码, UTF-8保证转化前后ASCII码保持不变,而UTF-5、RACE则可能不同,因此UTF-8编码保证了与ASCII编码的兼容性。如ASCII字符串”abc123″,转为UTF-5编码为”M1M2M3J1J2J3″,转为UTF-8编码为”abc123″。目前微软Window2000已支持UTF-8,负责BIND工作的Internet软件联盟(ISC)也表示新的BIND将支持UTF-8。
灵活的CNNIC体系结构可方便地适应中文域名技术的变化,兼容国际、国家标准。
5. 开放体系,鼓励合作
CNNIC域名体系为其他应用软件提供开放、标准的技术平台,各个应用开放商可在其上开发出与中文有关的各种为中国Internet用户服务的软件和服务项目。
6. 支持中文邮件地址、中文虚拟主机等应用服务
此外中文域名注册后还支持中文电子邮件地址功能、中文虚拟主机、中文代理等等应用服务。与CNNIC合作的软件开发商将提供为电子邮件ISP/IAP和企业内部使用中文电子邮件地址的解决方案。这意味着今后广大用户可以摒弃他们不擅长的英语,而使用自己熟悉的中文发送电子邮件了。
三. CNNIC中文域名使用说明
如图所示:
用户使用各种应用(如www、telnet、ftp、email)键入要访问的中文域名,该中文域名的编码格式可以是GBK,BIG5和UTF-8等多种码制。
用户在使用”中文域名.cn”等以英文结尾的域名时,可以指向一台没有做修改的域名服务器,而且不用做码制的转换,就可以实现对中文域名的访问。例如,一个用户键入”中文域名.cn”时,它不会做转换,而是以本地的码制直接发送给域名服务器,该域名服务器接到请求后,会根据DNS的解析规则,把相应的答案返回给客户。何谓本地码制呢?它取决于用户的操作系统。简单地说,大陆的WIN98用户使用的是GBK码,而台湾的WIN98用户使用的是BIG5码。不论大陆还是台湾的WIN2000用户使用的都是UTF-8码。这些以英文结尾的中文域名正是以用户本地的码制将域名发送给一台未做修改的域名服务器,从而使域名得到正确解析的。同样,发给任何一台按照CNNIC体系规则修改后的服务器也同样是可以得到正确的结果。
用户在使用”中文域名.中国”、”中文域名.公司”等纯中文域名时,就要将DNS的设置指向特定服务器,如ISP按照CNNIC体系规则修改后的服务器,或者直接指向CNNIC提供的服务器,也就是说指向任何一台与CNNIC体系兼容的服务器。这些服务器会将收到的不同编码格式的中文域名统一变换成UTF-8格式。将GBK,BIG5等用户本地的码制统一转换成UTF-8。之所以在特定的服务器中转变编码格式,是为了将不便之处给普通用户屏蔽掉;而统一转换成UTF-8,是因为UTF-8正逐步扩大应用范围,今后的BIND版本(甚至客户端,如windows)也将直接支持UTF-8,这样做是为将来的发展打下了一个良好的基础,这也是CNNIC的优势之一。这样,这台可以处理中文的服务器,会将已转成UTF-8的域名根据DNS的解析规则去询问其它的服务器,直到得到结果为止。
此外,当用户安装上了CNNIC提供的客户端后,会给用户带来极大的方便。因为它不仅会帮助电脑初学者完成对特定服务器的指定,还可以解决某些浏览器的固有缺陷和防火墙的问题,从而保证中文域名访问的成功。更重要的是,在安装了客户端后,它不仅会返回IP地址,还可以根据注册情况返回相应的英文名称。例如,用户键入”网络信息中心.中国”时,它会返回159.226.1.8,或可返回cnnic.net.cn。 这样,为cnnic.net.cn做虚拟主机的软件不用做任何改变,用户就可用”网络信息中心.中国”访问CNNIC原来的虚拟主机网站。
四. 注册方法先进灵活
CNNIC将采用新的、与国际接轨的注册方式进行中文域名注册,例如简化注册手续、变更手续,可以不提交书面申请材料,所有申请完全可在网上实现。
在中文域名注册体制中,CNNIC将借鉴国际成功经验,划分中文域名注册机构为域名系统管理者和域名注册服务商。CNNIC作为中文域名注册管理者,负责维护中文域名注册数据库,以确保互联网络的稳定运作。域名注册服务商将直接面对广大用户,依靠自己的力量和自身的优势更好地为用户提供包括中文域名的注册服务以及其它与中文域名相关的各项服务。CNNIC与域名注册服务商之间的所有通信基于SSL认证加密技术传输。
用户在新的注册系统提示下可以同时注册纯中文域名和带有CN的中文域名。注册自己的中文域名。例如,可以同时注册”中文域名.cn”和”中文域名.中国”。
另一个重要的特色是可以同时注册简体中文域名和繁体中文域名。这样注册后,用户既可以用中文简体访问网站,也可以用中文繁体访问网站,注册系统同时支持GB(GBK),BIG5,UTF8等在华人地区常用的编码格式,这样使用不同操作系统以及不同语言习惯的人都可以使用中文域名。目的在于同时方便两岸四地的用户使用自己熟悉的语言访问对方的网站。这样两岸四地的繁简互通就可以实现,这对推动两岸四地的信息交流将起到极大的促进作用。
请到以下链结查看原文http://www.cnnic.net.cn/news/cdns_tech.shtml