(这条文章已经被阅读了 105 次) 时间:2001-02-27 18:06:15 来源:舒迅 (shuxun) 原创-IT
精选式垂直搜索引擎–“IT罗盘”
“IT罗盘”是以精选式IT垂直搜索为特征的第二代搜索引擎,于2000年9月初正式推出,2000年1月中旬进行了一次较大规模的改进。
服务垂直化是互联网发展的大势所趋,根据赛迪网咨询部2000年末的《国内搜索引擎市场调查报告》数据显示:搜索引擎用户查询IT类(包括计算机软硬件及通讯、网络等)信息,将近6成;从事IT技术开发的网民,其在网上经常搜索的主要信息为IT类信息,占93%,列经常搜索信息第一位;高端用户中信息主管80%左右经常搜索IT类信息,从事技术支持的网民中有76%左右经常搜索IT类信息。赛迪网的“IT罗盘”垂直定位于IT,分类科学,查询简捷,具备网站、网页、目录、新闻、滚动新闻等多种检索方式,结合了网站的分类检索、和网页精确检索等方面的优势,全面、系统、精确、完整地提供有关IT行业领域的信息资源和服务,更贴切地满足用户需求,是一个目前中文领域内真正意义上的IT垂直搜索引擎。
互联网的迅速发展,导致网上信息爆炸性增长,据国外权威机构统计,目前有2/3的网民对搜索时返还的大量信息感到厌烦,宇江咨询调研部的《关于网民使用搜索引擎状况的调查》数据表明:有60%的网民希望搜索时获得精选过的结果。“IT罗盘”是目前国内唯一的提供收录网站人工评级,为用户提供经过专业人员描述、评价的信息第二代精选式搜索引擎。国内搜索引擎用户有36%的情况是查询某一类内容,当用户搜索某一类网站时,“IT罗盘”会把此类网站按严格的质量评价体系,给出星级级别,更大程度上方便用户获取更有价值的资源,从而极大减少了搜索用户在无用信息、垃圾信息中浪费的时间和精力。
目前“IT罗盘”设有IT相关目录1100个,收录经专业编辑分类评级的IT网站14000个,IT相关网页150万,实时抓取动态IT新闻。目录、网站、网页、实时新闻数量均处于国内同一领域第一的位置。“IT罗盘”抓取程序每天可成功抓取30万有效页面,远远超过国内同类产品水平。智能化的中文语言处理技术极大地提高了搜索的准确性和查全率;信息索引基于字和词,较好的解决了单纯基于字或单纯基于词的缺点,更加符合中文用户的搜索习惯;智能的相关度评价算法保证检索结果的准确性,采用了基于内容和基于链接分析的方法进行相关度评价,能够客观的分析网页所包含的信息,从而最大限度保证检索出的结果与用户查询串有很高的相关性。全天24小时,采用机器智能抓取与人工加工过滤相结合的方式,更新资源,并充分保证检索结果的正确性和可连接性。分布式结构、容错设计保证系统的高可用性、高扩展性、高性能和高稳定性,多台机器分布协作,并行的完成搜索、分析、索引、检索等任务。当用户进行检索时,平均响应时间低于0.5秒;支持所有通用的多个关键词组合检索方式、支持目录下搜索、热点关键词、特定关键词搜索时返还编辑推荐网站。
目前国内绝大部份知名搜索引擎均采用百度公司和Google的数据库,采用百度的包括新浪搜索、搜狐/Chinaren、21cn、硅谷动力、263、广州视窗、TOM等,采用Google的包括网易、雅虎中文,采用同一个搜索引擎开发商的网站它们的网页检索结果基本上是完全相同的,而“IT罗盘”采用世纪永联技术,无论从网站、网页、新闻检索上者与同类搜索引擎有较大不同,为国内互联网用户提供一个更多的选择。