當前位置:編程學習大全網 - 源碼下載 - 用java 實現壹個搜索功能,要求搜索某個關鍵字,然後把包括這個關鍵字的壹段話輸出到文檔中。qq454284728

用java 實現壹個搜索功能,要求搜索某個關鍵字,然後把包括這個關鍵字的壹段話輸出到文檔中。qq454284728

壹、什麽叫搜索引擎?

在Internet上有上百億可用的公***Web頁面,即使是最狂熱的沖浪者也不會訪問到所有的頁面,而只能看到其中的壹小部分,更不會在這浩瀚的Web海洋中發現妳那即使精彩卻渺小的壹隅。當然妳可以為妳的存在做廣告,可以用大大的字把妳的URL刻在妳的身體上,然後裸體穿過白宮草坪,但妳得保證媒體正好在那裏,並註視到了這壹切。與其這樣做,不如好好去理解搜索引擎是如何工作的?又怎樣選擇和使用"keywords"(關鍵詞)等等。

本文的目的就是讓眾多的頁面設計者在了解搜索引擎的基礎上,尋求如何使自己的頁面在搜索引擎索返回的列表中獲得好的排列層次的方法。

"搜索引擎"這個術語壹般統指真正意義上的搜索引擎(也就是全文檢索搜索引擎)和目錄(即目錄式分類搜索引擎),其實他們是不壹樣的,其區別主要在於返回的搜索結果列表是如何編排的。

1、目錄

目錄(比如Yahoo!)返回的列表是由人工來編排的。

這類引擎提供了壹份人工按類別編排的網站目錄,各類下邊排列著屬於這壹類別的網站的站名和網址鏈接,再記錄壹些摘要信息,對該網站進行概述性介紹(摘要可能是妳提交過去的,也可以是引擎站點的編輯為妳的站點所做的評價)。人們搜索時就按相應類別的目錄查詢下去。

這類引擎往往還伴有網站查詢功能,也稱之為網站檢索,即提供壹個文字輸入框和壹個按鈕。我們可以在文字框中輸入要查找的字、詞或短語,再點擊按鈕,便會在目錄中查找相關的站名、網址和內容提要,將查到的內容列表送過來。目前國內Sohoo、常青藤等都是這種搜索方式。

2、搜索引擎

搜索引擎(如HotBot)是自動創建列表的。

搜索引擎看起來與目錄的網站查詢非常相似,也提供壹個文字輸入框和按鈕,使用方法也相同,而且有些也提供分類目錄,但兩者卻有本質上的區別。

目錄的資料庫中,搜集保存的是各網站的站名、網址和內容提要;搜索引擎的資料庫中,搜集保存的則是各網站的每壹個網頁的全部內容,範圍要大得多。

搜索引擎是以全文檢索的方式工作的。全文檢索查到的結果不是站名、網址和內容提要,而是與妳輸入的關鍵詞相關的壹個個網頁的地址和壹小段文字。在這段文字中,可能沒有妳輸入的那個關鍵詞,它只是某壹網頁的第壹段話,甚至是壹段無法看懂的標記,但在這個網頁中,壹定有妳所輸入的那個關鍵詞,或者相關的詞匯。打個比方說,網站查詢可以查到網上有哪些報紙,如《文匯報》、《大公報》,而全文檢索則可以查到網上這些報紙的每壹篇文章中的詞匯。

3、兩者相結合的搜索引擎

某些搜索引擎同時也提供目錄。包含在搜索引擎中的目錄通常質量比較高,也能從那裏找到許多好站點。因為即使妳把妳的站點提交過去,也並不能保證壹定被加到目錄中去,他們把註意力放在那些已經在別的目錄中存在的站點上,並有選擇地尋找有吸引力的加到自己的目錄中。

搜索引擎和目錄各有各自不可替代的功用。目錄比較簡單,要想獲得壹個好的排列層次,除了妳努力創建壹個好內容的高品質站點外別無他法。搜索引擎復雜得多,它們隨時都在自動地索引眾多WEB站點的最新網頁,所以常常會發現目錄所不能得到的信息。如果妳改動了妳的頁面,搜索引擎還隨時會發現這個變化,並重新排列妳在列表中的位置。而目錄就做不到。下面專門討論搜索引擎的工作原理以及如何提高在搜索引擎列表中的排列位置。

搜索引擎(search engines)是對互聯網上的信息資源進行搜集整理,然後供妳查詢的系統,它包括信息搜集、信息整理和用戶查詢三部分。

搜索引擎是壹個為妳提供信息“檢索”服務的網站,它使用某些程序把因特網上的所有信息歸類以幫助人們在茫茫網海中搜尋到所需要的信息。

早期的搜索引擎是把因特網中的資源服務器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再壹層層地進行分類。人們要找自己想要的信息可按他們的分類壹層層進入,就能最後到達目的地,找到自己想要的信息。這其實是最原始的方式,只適用於因特網信息並不多的時候。隨著因特網信息按幾何式增長,出現了真正意義上的搜索引擎,這些搜索引擎知道網站上每壹頁的開始,隨後搜索因特網上的所有超級鏈接,把代表超級鏈接的所有詞匯放入壹個數據庫。這就是現在搜索引擎的原型。

隨著yahoo!的出現,搜索引擎的發展也進入了黃金時代,相比以前其性能更加優越。現在的搜索引擎已經不只是單純的搜索網頁的信息了,它們已經變得更加綜合化,完美化了。以搜索引擎權威yahoo!為例,從1995年3月由美籍華裔楊致遠等人創辦yahoo!開始,到現在,他們從壹個單壹的搜索引擎發展到現在有電子商務、新聞信息服務、個人免費電子信箱服務等多種網絡服務,充分說明了搜索引擎的發展從單壹到綜合的過程。

然而由於搜索引擎的工作方式和因特網的快速發展,使其搜索的結果讓人越來越不滿意。例如,搜索“電腦”這個詞匯,就可能有數百萬頁的結果。這是由於搜索引擎通過對網站的相關性來優化搜索結果,這種相關性又是由關鍵字在網站的位置、網站的名稱、 標簽等公式來決定的。這就是使搜索引擎搜索結果多而雜的原因。而搜索引擎中的數據庫因為因特網的發展變化也必然包含了死鏈接。

怎樣才能使搜索引擎精確地為人們提供相關的信息應該是它以後發展的方向,而不是只求綜合服務。

搜索引擎指自動從英特網搜集信息,經過壹定整理以後,提供給用戶進行查詢的系統。英特網上的信息浩瀚萬千,而且毫無秩序,所有的信息象汪洋上的壹個個小島,網頁鏈接是這些小島之間縱橫交錯的橋梁,而搜索引擎,則為妳繪制壹幅壹目了然的信息地圖,供妳隨時查閱。

搜索引擎的工作原理

搜索引擎的工作原理大致可以分為:

1、搜集信息:搜索引擎的信息搜集基本都是自動的。搜索引擎利用稱為網絡蜘蛛(spider)的自動搜索機器人程序來連上每壹個網頁上的超連結。機器人程序根據網頁鏈到其他中的超鏈接,就象日常生活中所說的“壹傳十,十傳百……”壹樣,從少數幾個網頁開始,連到數據庫上所有到其他網頁的鏈接。理論上,若網頁上有適當的超連結,機器人便可以遍歷絕大部分網頁。

2、整理信息:搜索引擎整理信息的過程稱為“建立索引”。搜索引擎不僅要保存搜集起來的信息,還要將它們按照壹定的規則進行編排。這樣,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的資料。想象壹下,如果信息是不按任何規則地隨意堆放在搜索引擎的數據庫中,那麽它每次找資料都得把整個資料庫完全翻查壹遍,如此壹來再快的計算機系統也沒有用。

3、接受查詢:用戶向搜索引擎發出查詢,搜索引擎接受查詢並向用戶返回資料。搜索引擎每時每刻都要接到來自大量用戶的幾乎是同時發出的查詢,它按照每個用戶的要求檢查自己的索引,在極短時間內找到用戶需要的資料,並返回給用戶。目前,搜索引擎返回主要是以網頁鏈接的形式提供的,這些通過這些鏈接,用戶便能到達含有自己所需資料的網頁。通常搜索引擎會在這些鏈接下提供壹小段來自這些網頁的摘要信息以幫助用戶判斷此網頁是否含有自己需要的內容。

.

  • 上一篇:Java SSH提示錯誤怎麽解決?
  • 下一篇:快遞小哥暴雪,他們為什麽這麽拼?
  • copyright 2024編程學習大全網