网站批量查询是利用程序自动化的方式来快速获取多个网站的信息。其技术原理主要包括以下几个步骤:
网站批量查询的主要优势包括:
但它也存在一些局限性和风险:
如何使用搜索引擎
随着因特网信息按几何式增长,这些搜索引擎利用其内部的一个叫SPIDE(蜘蛛)的程序,自动搜索网站每一页的开始,并把每一页上代表超级链接的所有词汇放入一个数据库,供用户来查询。 现在互联网上大大小小的搜索引擎大约有几百个之多,而且每个都声称自己是最好的。 要是随便抓起来就用,只会是事倍功半,甚至 越搜索越糊涂。 所以,花一点工夫挑选恰当的搜索工具,是万万省不得的。 1、快速查询速度当然是搜索引擎的重要指标,优秀的搜索工具内部应该有一个含时间变量的数据库,能保证所查询的信息都是最新的和最全面的。 2、准确准确性高是我们使用搜索引擎的宗旨。 好的搜索引擎内部应该含有一个相当准确的搜索程序,搜索精度高,查到的信息总能与我们的要求相符。 3、易用易用也是我们选择搜索引擎的参考标准之一,一个搜索引擎是否能搜索整个互联网,而不仅仅限于万维网?搜索结果出来之后,我们能改变描述的长短或者改变显示结果页面的数量吗?能否实现这些功能,应该是选择搜索引擎的重要考虑因素。 4、强劲理想的搜索引擎应该既有简单查询的能力,也应该有高级搜索的功能。 高级查询最好是图形界面,并带有选项功能的下拉菜单,可以使用像AND(或&号),OR(或|号),NOT(或!号)以及()等操作符来连接词或词组,这样可以缩小搜索范围,甚至可以限定日期、位置、数据类型等。 各个搜索引擎都提供一些方法来帮我们精确地查询内容,使之符合我们的要求。 不同的搜索引擎,提供的查找技巧和实现的方法各有不同,但一些常见的技巧是差不多的。 (一)简单信息查找 简单查找是最常用的方法,当我们输入一个关键词时,搜索引擎就把包括关键词的网址和与关键词意义相近的网址一起反馈给我们。 例如,查找科技一词时,模糊查找就会把科学、科委、技术等内容的网址一起反馈回来;(二)使用双引号进行精确查找 简单查找往往会反馈回大量不需要的信息,如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来(即在英文输入状态下的双引号),这样得到的结果最少、最精确。 例如在搜索引擎的Search(查询)框中输入电脑技术,就等于告诉搜索引擎只反馈回网页中有电脑技术这几个关键字的网址,这会比输入电脑技术得到更少、更好的结果。 (三)使用加减号限定查找很多搜索引擎都支持在搜索词前冠以加号(+)限定搜索结果中必须包含的词汇,用减号(-) 限定搜索结果不能包含的词汇。 例如:要查找的内容必须同时包括盐城、信息、网络3个关键词时,就可用盐城+信息+网络来表示;再例如:要查找电脑,但必须没有技术字样,就可以用电脑-技术来表示。 (四)使用逻辑词辅助查找比较著名的搜索引擎都支持使用逻辑词进行更复杂的搜索设定,常用的有:AND(和)、OR( 或)、NOT(否, 有些是AND NOT)及NEAR(两个单词的靠近程度),恰当应用它们可以使结果非常精确, 另外, 也可以使用括号将搜索词分别组合,如要查找的内容必须同时包括yancheng、infomation、network3个关键词时,就可用yancheng AND infomation AND network来表示(注意:输入代表逻辑关系的字符时,一定要用半角)。 当你连接到中文Yahoo主页后,可以看见在Yahoo!标题下方是一个文字输入框,在这里可以输入选定的关键词进行快速查找。 页面其它部分的所有文字几乎都以链接方式出现,顶部是一些常用链接,如新闻、财经、天气预报等。 底部是Yahoo自身的一些常用链接,如广告指南、如何登录等等。 中部是主体,按内容分为文化艺术、商业经济、计算机与Internet、教育、娱乐、政府、医疗卫生、新闻媒体、体育、参考资料、国家与地区、自然科学、社会科学、社会文化十四个部分。 目录链接列表按树形结构组织,你可以从点击根链开始,不断深入,最终到达所需的Web页、新闻组、FTP站和其它可由Web访问的资源。 这种列表式分层搜寻易于控制,适合浏览性的查找,但因层次内容太多会感到速度太慢,为此Yahoo提供了另一种选择,那就是利用关键词匹配查询。 在Yahoo的主页或任一个查询结果返回顶部和底部,你都会看见一个输入框。 如果你很清楚你要找的网站(或新闻)主题,你可以在输入框内键入你想要找的关键字串 (Keyword),然后单击右侧的搜寻按钮后,Yahoo就会从它四个方面的数据库中找出相匹配的记录,它们是:Yahoo目录、Yahoo网点、Yahoo网上事件和谈话、最新新闻。 查询结果返回的是一页与关键词匹配的记录列表,最前面的是Yahoo目录链,其后是Yahoo网站,网站记录通常由标题(以链接形式出现)和简介组成。 如果在Yahoo目录和网站中都没有相匹配的内容,Yahoo则自动利用其内置的查询机制进行整个WEB范围的文档查找。 总之,当我们使用搜索引擎时,应该充分利用它们各自的优点,以得到最佳最快捷的查询结果。
www工作的基本原理是什么?
[编辑本段]工作原理 当你想进入万维网上一个网页, 或者其他网络资源的时候,通常你要首先在你的浏览器上键入你想访问网页的统一资源定位符(Uniform Resource Locator),缩写URL,或者通过超链接方式链接到那个网页或网络资源。 这之后的工作首先是URL的服务器名部分,被名为域名系统的分布于全球的因特网数据库解析,并根据解析结果决定进入哪一个IP地址(IP address)。 接下来的步骤是为所要访问的网页,向在那个IP地址工作的服务器发送一个HTTP请求。 在通常情况下,HTML文本、图片和构成该网页的一切其他文件很快会被逐一请求并发送回用户。 网络浏览器接下来的工作是把HTML、CSS和其他接受到的文件所描述的内容,加上图像、链接和其他必须的资源,显示给用户。 这些就构成了你所看到的“网页”。
搜索引擎的原理
全文搜索引擎 在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。 搜索引擎的自动信息搜集功能分两种。 一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。 另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。 由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。 当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户 ■ 目录索引 与全文搜索引擎相比,目录索引有许多不同之处。 首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。 用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。 其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。 而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。 尤其象Yahoo!这样的超级索引,登录更是困难。 (由于登录Yahoo!的难度最大,而它又是商家网络营销必争之地,所以我们会在后面用专门的篇幅介绍登录Yahoo雅虎的技巧)。 此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。 最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。 更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。 目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。 如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。 如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。 目前,搜索引擎与目录索引有相互融合渗透的趋势。 原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。 而象 Yahoo! 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围。 在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。