當前位置:編程學習大全網 - 編程軟體 - python壹問壹答代碼怎麽寫

python壹問壹答代碼怎麽寫

python壹問壹答代碼步驟:

1、對問答庫進行拆分,將文本分別拆分為問題庫和答案庫。

2、將問題進行文本處理:循環遍歷問題庫裏每壹個問題。對每壹個問題進行文本處理:首先加載停用詞庫,對問題用nltk分詞進行小寫化、去停用詞、數值歸壹後重新加入到壹個問題庫,對這個已經處理完的問題庫用zipf定律進行詞頻過濾。對輸入的問題進行文本處理。將處理好的問題庫詞向量化(用qlove或word2vec,包子詞向量化是將詞向量相加取平均)後計算問題庫向量L2範數。將處理好的輸入問題詞向量化並計算問題向量L2範數。

3、建立壹個簡單的倒排表。

4、利用倒排表計算問題庫詞向量和輸入問題詞向量的余弦相似度。

5、建立優先隊列,采用(優先級(余弦相似度),與相似度對應的問題答案下標)(值越小,優先級越大)找出ToD所對應的答案下標。

6、根據找出的答案下標到答案庫裏遍歷打印即可。

  • 上一篇:SMT貼片機的編程和生產流程復雜嗎?
  • 下一篇:轉換成代碼
  • copyright 2024編程學習大全網