Google入门 - 搜索教程 - 陆元婕

(这条文章已经被阅读了 181 次) 时间:2001-04-23 13:27:09 来源:陆元婕 (jannylu) 原创-IT

Google由Larry Page和Sergey Brin设计,于1998年9月发布测试版,一年后正式开始商业运营。Google由于对搜索引擎技术的创新而获奖无数,如美国《时代》杂志评选的“1999年度十大网络技术’之一、《个人电脑》杂志授予的“最佳技术奖’、The Net授予的“最佳搜索引擎奖’等。Google现为全球80多家门户和终点网站提供支持,客户遍及20多个国家。Google所擅长的是易用性和高相关性。Google提供一系列革命性的新技术,包括完善的文本对应技术和先进的PageRank排序技术,后者可以保证重要的搜索结果排列在结果列表的前面。
2000年年初,Yahoo!宣布将不再采用Inktomi的搜索服务,而转而将Google作为其搜索引擎技术提供商,此举使Google 声名大噪。 目前Google已与网易公司(www.163.com)达成协议,自9月15日起,网易采用Google的技术向用户提供新一代的中文搜索引擎,Google的中文搜索引擎是收集亚洲网站最多的搜索引擎之一,这也是Google拓展全球信息市场的重要基础。根据双方协议,网易的用户不仅能够通过Google访问2400万个中文页面,还可以访问其全部目录中超过13亿的Web文件。目前,Google的用户已经可以使用包括中文、法语、德语、意大利语和西班牙语在内的25种语言进行搜索。Google公司正在雄心勃勃地筹备更丰富的服务内容,如日语、朝鲜语和其他客户化定制的搜索引擎服务。
在Google的帮助页面中,有很多详尽的功能介绍。这里只挑选几个说明一下。

一、应当了解的知识
1、 Google的搜索结果中提供的几项很有用的服务
“网页快照”——即当搜索内容站点或网页不存在时,用户可以调 用Google事先为用户储存的大量应急网页,经Google处理后,搜索项均用不同颜色标明,另外还有标题信息说明其存档时间日期,并提醒用户这只是存档资料。实际上Google将检索的网页都做了一番“快照”然后放在自己的服务器上,这样做的好处是不仅下载速度极快,而且可以获得互联网上已经删除的网页。

“手气不错”——即“手气不错™” 按钮自动将您带到Google推荐的网页。您无须查看其他结果,省时方便。 例如,要查找北京大学,只需输入: 北京大学再点击“手气不错”按钮,Google 就直接带您到www.pku.edu.cn– 北京大学的正式主页。

“相似网页”——点击“相似网页” 连接时, Google侦察兵便开始寻找与这一网页性质类似的网页,一般都是同一级别的网页。例如:若这页是某大学的首页,那么Google侦察兵就会寻找其他大学的首页。但如果这页是某大学计算机科学系,Google侦察兵就去找其他大学的计算机科学系,而不是其他大学的首页。Google侦察兵可以“一兵多用”。如果您对某一网站的内容很感兴趣,但又嫌消息不够,Google侦察兵会帮您找到其他有类似资料的网站;如果您在寻找某种产品的信息,Google侦察兵会提供给您相关信息,供您比较,做出选择;如果您在某一领域做学问,Google侦察兵会成为您的助手,帮您快速找到大量资料。 Google侦察兵已为成千上万网页找到相似网站,但越是有个性的网页,其相似页就越少。例如:您独树一帜的个人主页就很难有相似页。同样,如果某公司有多个网址 (如 company.com 和 http://www.company.com), Google侦察兵可能无法对某一网址提供足够的信息。但这种情况实属罕见,Google侦察兵将是您出色的助手。

2、 使用Google搜索应掌握的基本知识
‘AND’的使用
在Google查询时不需要使用’and’,因为Google会在关键词之间自动添加’AND’。Google提供符合您全部查询条件的网页。如果您想逐步缩小您的搜索范围,只需输入更多的关键词。

不支持“OR”
由于Google 不支持’OR’搜索,所以Google无法接受“或者包含词语A,或者包含词语B”的网页。如:您要查询“牛奶”或“鸡蛋”,就必须分两次查询。一次查牛奶,一次查鸡蛋。

不使用’词干法’,也不支持’通配符’(*)搜索——需要输入完整的词语
就是说Google只搜索完全一样的字词。例如:查询’googl’ 或 ‘googl*’,不会得到类似’Googler’ 或 ‘googlin’的结果。不信您可以试试’airline’和 ‘airlines’ 这两组词。不过,这对于中文似乎无所谓。

忽略部分词语
通常,Google忽略“http”和“com”等字符,以及数字和单字,此类字词过于频繁出现于大部份网页,不仅无助于查询,而且大大降低搜索速度。
用“ ”可将这些字词强加于搜索项,但“ ”之前必须留一空格。

支持“-”功能
有时候,排除一些关键词比增加关键词更有利于缩小查询范围。Google支持此项“-”功能,用以有目的地删除某些无关的网页,但减号之前必须留一空格。

冒号功能
某些词后面添加冒号,在Google中便具有了特殊功能。Google支持这样的特殊操作符。
比如link: site:

专用语查询

只要在专用词语上加上双引号,就可以准确地进行查询。这一方法在查找名言警句或专有名词时显得格外有用。 此外一些标点符号如“-”、“”、“ ”、“=”、“,”“’”也可作为短语连接符。例如:尽管没有加引号,mother-in-law仍作为专用语处理。

3、 Google的特殊功能简介
查询电话号码
Google的搜索栏中最新加入了电话号码和美国街区地址的查询信息。
个人如想查找这些列表,只要填写姓名,城市和省份。
如果该信息为众人所知,你就会在搜索结果页面的最上方看到搜索的电话和街区地址
你还可以通过以下任何一种方法找到该列表:
名字(或首位大写字母),姓,电话地区号
名字(或首位大写字母),姓,邮递区号
名字(或首位大写字母),姓,城市(可写州)
名字(或首位大写字母),姓,州
电话号码,包括区号
名字,城市,州
名字,邮递区号

查找PDF文件
Google推出了PDF文件的搜索新功能,这标示着Google在隐形网页的搜索取得了成功。我们知道,PDF文件的资源并不象HTML文件那样丰富,但是由于PDF文件通常包含大量的信息资源,因此它也是组成互联网资源的重要部分。尽管大多数的主要搜索引擎都希望能够对隐形网页进行搜索,但是他们的的数据库中不包含PDF文件的有关信息。

为什么这些搜索引擎不能搜索PDF文件呢?
与HTML语言的文件相比,PDF文件生成包含更复杂的技术,因此索引起来会比较麻烦。比如说,简单的HTML文件可能只有一两页,但即使很小的PDF文件也常常包含数十页的内容。

在Google中如何查找PDF文件?
目前,在Google中搜索资料时,会提供pdf文件的搜索结果。由于PDF文件需要特殊的阅读器,Adobe acrobat reader,因此Google提供的PDF文件的搜索结果与HTML的大不相同。你可以看到在搜索结果前以蓝色文本显示 [PDF]。另外,原来的相似网页功能会被替换成 文本形式(Text Version)。如果点击Text Version,会看到内容是以文本形式显示的,显然,Goolgle事先将Pdf文件做了格式转化。为什么Google要这样做呢?实际上只有转化成文本形式,Google才能对Pdf文件也采用类似网页的排序方法,同样才能对PDF文件进行关键字的匹配。此外,Google的这种做法可以使用户在不启动Adobe Acrobat的时候也能看PDF文件,这样就可以节省计算机资源,同时也能加快速度。
如果我不想看pdf文件的搜索结果该怎么办呢?
很简单,输入 –inurl:pdf 就可以了。

Google目前大约已经索引了1300万个PDF文件,尽管这仍然只是隐形网页的很少部分,但这的确揭示了Google在探索隐形网页方面的决心与能力。

股票报价?
用Google查找股票和共有基金信息,只要输入一个或多个NYSE,NASDAQ,AMEX或
共有基金的股票行情自动收录机的代码,也可以输入在股市开户的公司名字。
如果Google识别出你查询的是股票或者共有基金,它回复的链接会直接连到高质量的金融信息提供者提供的股票和共有基金信息。
在你搜索结果的开头显示的是你查询的股市行情自动收录器的代码。如果你要查找一家公司的名字(比如,INTEL),请查看“股票报价”在Google搜索结果的金融栏里会有那个公司的主页的链接(比如,WWW.INTEL.COM)。
Google是以质量为基础来选择和决定金融信息提供者的,包括的因素有下载速度,用户界面及其功能。

找找谁和你链接
有些单词如果带有冒号就会有特殊的意思。比如link:操作员。查询link:siteURL,就会显示所有指向那个URL的网页。举例来说,链接www.Google.com会向你显示所有指向GOOGLE主页的网页。但这种方法不能与关键字查询联合使用。

查找站点
单词site后面如果接上冒号就能够将你的搜索限定到某个网站。具体做法是:在c搜索栏中使用site:sampledomain.com这个语法结构。比如,在斯坦福找申请信息,输入:
admission site:www.stanford.edu
语法格式:
site : 网址 关键词
或者 关键词 site : 网址

注意事项:
1、site:后边跟的冒号必须是英文的“:”,中文的全角冒号“:”无用

2、url前不能带http://

3、url后边不能带斜杠“/”,其实是哪里都不能带/

4、url中不要用www,除非你有特别目的,
用www会导致错过网站内的内容,因为很多网站的频道是没有www的。

其他说明:
1、关键词既可以在“site:”前,也可以在“site:”后,搜索结果是一样的
但是不管谁前谁后,关键词和“site:”之间必须空一格。

2、对于“site:”搜索,关键词一样可以是多个,多个关键词之间以空格隔开

3、支持与其他复杂搜索语法混用,各语法和关键词之间空一格

4、除了网站,还可以搜索网站的频道,但仅限于不用“/”的。

5、一个网站可能有多种语言,
所以选择“搜索所有网站”和“搜索中文(简体)网页”是有差别的
当然,如果指定的网站只有一种语言,怎么选择就都一样了

用途:
1、可用于限制网站类型,学术资料在edu、org中会更精练,政府相关的在gov中也许更容易找。

2、用了edu、org、net、gov之类的域名后缀,并不会搜索所有含这个后缀的网站。
只会搜索以这个后缀结尾的网站,带cn、us、si等各国家和地区域名后缀的edu.jp、
gov.us、org.it等是不搜的,所以你要另外搜

3、搜索某种语言或某个关键词在指定国家的网站

4、有的网站没有提供站内搜索,或者它的信息结构混乱,内容又多,不好找东西,
那么可以用“site:”对这个网站进行检索。
google的“site:”功能比多数网站自己的站内检索还要好用,如果你查的不是
动态数据库,而且对时效性要求不高的话。

5、搜索不欢迎你搜索和免费使用的网站、数据库的部分内容

6、用“site:”搜索死链接网站、已关闭网站内的信息

查找字典释意
查找字典释意的方法是在搜索栏中输入你要查询的内容。在我们根据要求找到所有的字典释意都会标有下划线,位于搜索结果的上面,点击链接你会找到字典提供者根据要求给出的相关定义。

用GOOLGE查找地图
想用Google查找街区地图,在Google搜索栏中输入美国街区地址,包括邮递区号或城市/州(比如165大学大街PALO ALTO CA)。通常情况下,街区地址和城市的名字就足够了。
当Google识别你的要求是查找地图,它会反馈给你有高质量地图提供者提供的链接,使你直接找到相关地图。我们是以质量为基础选择这些地图提供者。值得注意的是Google和使用的地图信息提供者没有任何关联。

(文中关于site的用法说明选自搜索引擎9238的文章)