當前位置:編程學習大全網 - 源碼下載 - 深入搜索引擎的譯者序

深入搜索引擎的譯者序

1998年從美國斯坦福大學產生了壹段傳奇的財富神話,這就是今天市值約千億美元的Google。眾所周知,Google 正是由Lawrence Page在斯坦福大學發起的研究項目轉變而來的。正是由於斯坦福大學對全球信息檢索的傑出貢獻,譯者從事相關研究的時候也曾閱讀了大量出自斯坦福大學的課件、論文和推薦教材。

在這些資源 中,《Managing gigabytes》,簡記做“MG”,是其中壹本極其重要的書籍。在譯者集中學習信息檢索的2005年,這本書是斯坦福大學信息檢索和挖掘課程 的首選教材之壹,和MIR 壹起成為全球主要大學信息檢索的主要教材。

MG深入淺出地給出了海量信息數據處理的整套解決方案,包括壓縮、索引和查詢的方方面面。本書理論性較強,公式眾多,很多數據的給出並沒有做具體的解釋,此外還包括壹些文化背景差異帶來的理解障礙。但是作者和譯者聯手為大家奉獻了412個註解,協助大家更好地理解本書。

和MIR不同的是,MG更加具有實踐性,這得益於3位作者精心編寫的MG檢索引擎,該檢索引擎被實踐證明具有很強的易用性和伸縮性,附錄B介紹的新西蘭電子圖書館就使用了MG代碼作為其內核。MG源代碼可以在原著的官網上找到。本書絕大部分算法和思想都在代碼中被完整體現,是不可多得的學習和實踐材料。

本書主要面向信息檢索專業方向的研究生、從事搜索引擎相關工作和其他對搜索技術感興趣的人們,除了從書中獲取嚴謹的理論知識以外,還可在MG源代碼上展開實際的研究。無論從哪壹點來看,本書都是非常好的研究起點。

本書作者Ian H.Witten,Alistair Moffat和Timothy C.Bell均是信息檢索領域赫赫有名的專家,特別是Timothy C.Bell教授在本書的翻譯過程中給予了巨大的幫助,同時譯者也為原著的勘誤做出了貢獻 。

最後要特別感謝包括原著3位作者在內的信息檢索專家們無私地分享了他們的技術成果,並且感謝博文視點出版社大力引進,編輯孫學瑛女士及方方面面工作人員給予的幫助。

最後引用本書中的壹段原話作為結尾:“在信息科學技術的歷史上,從來沒有像今天這樣,創造如此大的價值的如此多的技術卻掌握在如此少的人的手裏。”希望能夠和原著的作者壹樣做出自己壹份微薄的貢獻。

梁斌

2009年2月15日

  • 上一篇:OD找到了程序入口點,怎麽脫殼啊?
  • 下一篇:Android主流視頻播放及緩存實現原理調研
  • copyright 2024編程學習大全網