我以前做過聚類搜索,要求跟妳這個不壹樣,但是原理其實差不多。
回答:
1.這個其實比較簡單,對問題做壹個分詞(網上有很多分詞系統:中科院啊等等),然後根據分詞得到的關鍵字進行分類匹配(註意:在做分詞的時候要建立過濾詞表,將常出現又沒有意義的詞匯過濾掉)。
2.分類的話,建議lz用圖書館的分類法。因為這個分類方法是全世界從紙質時代就開始研究的,目前也是用的最廣泛的分類方法之壹,當然,圖書館分類法也有很多種,具體的lz就只能自己按照要求去選擇了。
3.答案抽取,說白了就是壹個多元搜索引擎,這方面的開源代碼很多,也比較好找,花些功夫自己寫也成,這個也不難。
這裏能夠說的就這麽多了,具體的還需要lz自己去琢磨,數據結構建議lz用web的xml之類的來做,因為這個是主流啊,現在基本上做數據結構都是用的這個,當然下些功夫去了解是必不可少的。
如果lz想弄壹點超前的東東,我可以推薦妳去看本體(ontology)的內容,那個用來做數據結構,不說是國內,就是拿到國外也很牛的~~呵呵