搜索引擎:从信息中搜寻财富(行业风云系列) - 旁白系列——IT舞台的低语 - arshioul

(这条文章已经被阅读了 115 次) 时间:2001-12-24 18:00:30 来源:arshioul (arshioul) 原创-IT

搜索引擎:从信息中搜寻财富(行业风云系列)

搜索引擎,一个网络业最老的商业模式之一,一个成百万网民每天都要使用的服务,现在正在向全面商业化转型。那些具有商业价值却还未被人所知的信息有朝一日会被搜索引擎开采出来,创造出滚滚的财富。

新一代搜索引擎
搜索引擎曾经是互联网盛极一时的标志产物。Asking Jeeves,AltaVista,Google,雅虎等大大小小的搜索引擎曾经给我们希望,承诺我们可以轻而易举地找到我们想要的信息。然而每个尝试在网络上搜索过信息的网民都知道,搜索引擎并非想象中那么好用——要么是找不到信息,要么是泥沙俱下,给你一大堆垃圾信息。
对于商业公司来说,搜索引擎也是吃力不讨好的活儿。分门别类储存大量现存信息已是不堪负担,何况网络上的信息正在以光速的速度增长。对IT技术和商业管理来说,搜索信息的模式实在是一大挑战。
IT市场分析公司IDC今年秋天出具的一份报告表明,前期被大肆宣传为“使用简便易用,搜索结果丰富”的搜索引擎技术正在被信息更集中的局域网取代,因为用户知道在大多数搜索系统的表现与他们的期望值相差太大。
一般的公共搜索引擎只能查到HTML格式,即超文本标示格式语言的网页,主要是因为搜索引擎的自动排序软件spiders蜘蛛程序,只能接受这种格式的网页。这意味着,在企业内部的局域网上,任何没有使用HTML格式书写的信息将无法被外部的搜索引擎查到。
这些“沉没”的信息包括Powerpoint幻灯片文件、Word文档、PDF文件、各种各样的电子邮件内容,诸如CRM客户关系管理或者ERP企业资源管理这样的应用软件产生的数据库也是无法查到的,多媒体内容方面,数量正在高速发展的视频、音频文件通常也被排除在搜索引擎之外。
好在搜索引擎技术发展迅速,未来公共搜索引擎能够弥补上述的缺陷。在过去的几个月中,搜索引擎经过了商业化,技术上有了更新的成果。新型的搜索引擎能够接受几十种软件格式,诸如智能搜索和个性化搜索的特色把它们与过去的搜索引擎区别了开来。

搜索引擎挖掘信息资源的金矿
在多数网民的印象中,门户模式与搜索引擎是合而为一的,像雅虎,本身是搜索引擎,后来建起了新闻服务和聊天室,又如国内有名的门户网站新浪,最早是新闻比较好,后来也加强搜索引擎的服务。
但是现在按照业界一些流行的观点,门户模式、搜索引擎最好分开做。门户模式管理好内容服务,搜索引擎的核心部分技术外包。事实上搜索引擎的技术外包在行业内不是什么秘密,雅虎自己的搜索技术一般,它就采用Google的技术;新浪也没有在搜索引擎上花太大的力气,而是把技术服务外包给了3721。
搜索引擎的专业分工为这个行业分支的商业化创造了条件。利用有限的企业资源,搜索引擎能够在用户界面、应用基础、嵌入技术、集成服务等多方面与商业企业合作。搜索引擎从门户的阵营中分离出来,独立走出商业化的道路。
AltaVista搜索软件公司的欧洲区副总裁马克说,商业公司内各种格式的电子文件中,平均80%的信息未经整理,使用起来效率很低。“这就是搜索引擎所能带给企业的价值。利用相同的技术,我们可以在零乱的信息中给公司挖掘出一座大金矿。”
AltaVista针对商业客户的搜索软件今年6月上市,该软件能用30种语言,搜索200多种文件格式。“企业拥有搜索引擎,就建立了一张信息资源的全景图。通过一张完整的、可搜索的目录,信息在企业系统中的分布一目了然。”
支持多语言,可搜索各种格式文件是最近商用搜索引擎竞争的卖点之一,还有其它一些搜索引擎公司专注于一两种特定格式文件的搜索。例如,Screening Room公司允许用户利用其技术,专门搜寻视频、音频文件,而驻扎于剑桥大学的初创公司NCorp专门从事格式化数据库的搜索服务。
NCorp的创始人兼首席执行官尼克说公司的核心搜索业务仅限于IT业内,能够使用标准查询语句SQL的专业人士。“标准化数据库数量不如非标准化数据库那么多,但是它们有很大的发展潜力,以后肯定有很大的搜索需求。我们就看准了这个市场,准备逐步培育它。”
公司出品的搜索引擎Ijen不仅令初学者容易上手,而且能够提供给专家比SQL语句更优化的查询结果。“SQL语句能够为具有准确标准的查询问题提供答案,例如‘公司本月的销售额是多少’。但是它无法解决智能化的模糊问题,例如‘哪位员工最适合执行该计划’。”

搜索引擎的商业应用
不少商业公司对搜索引擎的效率仍然表示怀疑,但是专家说,新一代搜索引擎的初始排序速度非常快,花费时间很少。例如著名的财经新闻集团路透社,它应用搜索引擎在36小时内对200万个文件进行了排序。“新的搜索引擎非常易用,公司可以从网上下载,自己就可以调试,30天后就能使用,几乎可以不依赖外部的技术支持。”
Verity的市场总监西蒙也认为搜索引擎根据企业要求的功能,准备时间有长有短,但是相比CRM或者ERP这样的项目,搜索引擎只是一个小工程。“你安装好系统后,就可以开始排序了。执行程序就是了。”
当然,专业用户对搜索引擎的信息检索准确性要求非常苛刻,所以在引擎技术、数据容量升级的同时,开发厂商对信息原材料的提炼也做出了努力。他们深入到企业中,了解他们组织信息的过程和特征,并且参考前人的工作成果和资料修改了个性化的搜索方式。
这种努力渐渐有了成果。有的商业搜索引擎有了分级功能,按照人们对文件关注程度的高低次序排列文件,有的则是从使用者出发,按照同一级别的雇员关注程度高低排序文件,还有的搜索引擎将文件注释与专家推荐功能结合,用户不必打开文件就能对文件大致有个了解。
“多数人最多读30个文件,所以搜索结果不是越多越好,而是不管你用什么方法,要把最适合要求的30个文件找出来,放在列表的最前面。”搜索引擎公司Convera的负责市场开发的副总裁柏恩·布莱默说。该公司的母公司Excalibur技术公司最近与英特尔的互动媒体服务分部刚刚合并,合并后公司的第一家子公司就是Convera。
因为搜索引擎专业化发展而出现的新技术趋势真是不胜枚举。另一家公司Fast Search把数据即时预警功能集成到搜索功能中,其创意极其新颖。公司创始人兼CTO约翰·莱维克说,“我们能够即时过滤任何数据流。例如股票报价或者天气预报,并且产生即时报警报告。”
这家公司主要的目标是金融企业的分析系统和内容网站的即时新闻,据他们估算,这些公司的信息更新速度大约是每秒钟更新5个文件。“我们引擎完全是即时更新的,新信息一出来,就可以查到。”
作为企业局域网的一部分,搜索引擎涉及很多企业敏感的商业信息,因此信息安全也是十分重要。搜索引擎都考虑到了这一点,把使用权和控制权,分布到分散式系统上,每个子系统都拥有自己独立的帐号、主群和进入许可。“搜索引擎能够同时搜索多个文件,但是从安全考虑,每个文件都有独一无二的安全等级。

搜索引擎成热点
各方面性能的提高使搜索引擎即将成为企业信息系统的一部分。它就像一辆车的马达,放在企业信息战略框架中,与IT应用技术、知识管理体系和企业智能系统一起,构成了企业内部的信息神经网络。
目前搜索引擎开发商主要是争夺世界前2000强的公司,他们财大气粗,出手豪阔,但是从市场反馈看,一些中小型的公司也对搜索引擎非常感兴趣。例如Inktomi有像太阳微系统公司这样的大客户——需排序多达7000万个文件,也有一些小客户——排序文件只有3000个。
随着商业需求的不断增大,网络与商业企业趋向无缝结合,搜索引擎有了用武之地,搜索引擎企业外包,公共搜索引擎收费摆上了议事日程。市场分析家预计搜索引擎市场将持续增长,在今年底市场价值将达到150亿美元,但是这个新兴的技术市场也面临激烈的竞争。
“很多开发商意识到简单添加一个搜索功能不足以开掘互联网的信息价值,达不到内外网络信息共享的目的。”“最好的解决方案是开发厂商将搜索技术与商业战略构架集成在一起,集成得越完美,获得市场成功的可能就越大。
搜索引擎的攻城略地也蔓延到了移动商务领域,PDA、手持设备和手机日后都能使用搜索引擎,搜索引擎可以变得无处不在。从某种意义上说,单纯“今天你有否雅虎”这种口号已经死了,但是“今天你有否搜索”这个提法在很长一段时间将代表业界的发展趋势,具有蓬勃的生命力。

文章评论:搜索引擎:从信息中搜寻财富(行业风云系列) - 水瓶座 - 2001-12-25 10:54:13

呵呵,3721还有这等本事,恐怕是他愿意,新浪也未必愿意吧。老兄,如果这篇文章不是你翻译或转载的,就请调查清楚事实再说话。这应该是业界记者的良好风范呀,呵呵。