當前位置:編程學習大全網 - 編程語言 - Python分布式進程中妳會遇到的坑

Python分布式進程中妳會遇到的坑

寫在前面

小驚大怪

妳是不是在用Python3或者在windows系統上編程?最重要的是妳對進程和線程不是很清楚?那麽恭喜妳,在python分布式進程中,會有坑等著妳去挖。。。(hahahaha,此處允許我嚇唬壹下妳)開玩笑的啦,不過,如果妳知道序列中不支持匿名函數,那這個坑就和妳say byebye了。好了話不多數,直接進入正題。

分布式進程

正如大家所知道的Process比Thread更穩定,而且Process可以分布到多臺機器上,而Thread最多只能分布到同壹臺機器的多個CPU上。Python的multiprocessing模塊不但支持多進程,其中managers子模塊還支持把多進程分布到多臺機器上。壹個服務進程可以作為調度者,將任務分布到其他多個進程中,依靠網絡通信。由於managers模塊封裝很好,不必了解網絡通信的細節,就可以很容易地編寫分布式多進程程序。

代碼記錄

舉個例子

如果我們已經有壹個通過Queue通信的多進程程序在同壹臺機器上運行,現在,由於處理任務的進程任務繁重,希望把發送任務的進程和處理任務的進程分布到兩臺機器上,這應該怎麽用分布式進程來實現呢?妳已經知道了原有的Queue可以繼續使用,而且通過managers模塊把Queue通過網絡暴露出去,就可以讓其他機器的進程來訪問Queue了。好,那我們就這麽幹!

寫個task_master.py

我們先看服務進程。服務進程負責啟動Queue,把Queue註冊到網絡上,然後往Queue裏面寫入任務。

請註意,當我們在壹臺機器上寫多進程程序時,創建的Queue可以直接拿來用,但是,在分布式多進程環境下,添加任務到Queue不可以直接對原始的task_queue進行操作,那樣就繞過了QueueManager的封裝,必須通過manager.get_task_queue()獲得的Queue接口添加。然後,在另壹臺機器上啟動任務進程(本機上啟動也可以)

寫個task_worker.py

任務進程要通過網絡連接到服務進程,所以要指定服務進程的IP。

運行結果

現在,可以試試分布式進程的工作效果了。先啟動task_master.py服務進程:

task_master.py進程發送完任務後,開始等待result隊列的結果。現在啟動task_worker.py進程:

看到沒,結果都出錯了,我們好好分析壹下到底哪出錯了。。。

錯誤分析

在task_master.py的報錯提示中,我們知道它說lambda錯誤,這是因為序列化不支持匿名函數,所以我們得修改代碼,重新對queue用QueueManager進行封裝放到網絡中。

其中task_queue和result_queue是兩個隊列,分別存放任務和結果。它們用來進行進程間通信,交換對象。

因為是分布式的環境,放入queue中的數據需要等待Workers機器運算處理後再進行讀取,這樣就需要對queue用QueueManager進行封裝放到網絡中,這是通過上面的2行代碼來實現的。我們給return_task_queue的網絡調用接口取了壹個名get_task_queue,而return_result_queue的名字是get_result_queue,方便區分對哪個queue進行操作。task.put(n)即是對task_queue進行寫入數據,相當於分配任務。而result.get()即是等待workers機器處理後返回的結果。

值得註意 在windows系統中妳必須要寫IP地址,而其他操作系統比如linux操作系統則就不要了。

修改後的代碼

在task_master.py中修改如下:

在task_worker.py中修改如下:

先運行task_master.py,然後再運行task_worker.py

(1)task_master.py運行結果如下

(2)task_worker.py運行結果如下

知識補充

這個簡單的Master/Worker模型有什麽用?其實這就是壹個簡單但真正的分布式計算,把代碼稍加改造,啟動多個worker,就可以把任務分布到幾臺甚至幾十臺機器上,比如把計算n*n的代碼換成發送郵件,就實現了郵件隊列的異步發送。

Queue對象存儲在哪?註意到task_worker.py中根本沒有創建Queue的代碼,所以,Queue對象存儲在task_master.py進程中:

而Queue之所以能通過網絡訪問,就是通過QueueManager實現的。由於QueueManager管理的不止壹個Queue,所以,要給每個Queue的網絡調用接口起個名字,比如get_task_queue。task_worker這裏的QueueManager註冊的名字必須和task_manager中的壹樣。對比上面的例子,可以看出Queue對象從另壹個進程通過網絡傳遞了過來。只不過這裏的傳遞和網絡通信由QueueManager完成。

authkey有什麽用?這是為了保證兩臺機器正常通信,不被其他機器惡意幹擾。如果task_worker.py的authkey和task_master.py的authkey不壹致,肯定連接不上。

  • 上一篇:安福的春節 作文
  • 下一篇:stl格式的CAD造型方法
  • copyright 2024編程學習大全網