當前位置:編程學習大全網 - 編程語言 - 邏輯回歸解決什麽問題

邏輯回歸解決什麽問題

問題壹:邏輯回歸和SVM的區別是什麽?各適用於解決什麽問題 兩種方法都是常見的分類算法,從目標函數來看,區別在於邏輯回歸采用的是logistical loss,svm采用的是hinge loss.這兩個損失函數的目的都是增加對分類影響較大的數據點的權重,減少與分類關系較小的數據點的權重.SVM的處理方法是只考慮support vectors,也就是和分類最相關的少數點,去學習分類器.而邏輯回歸通過非線性映射,大大減小了離分類平面較遠的點的權重,相對提升了與分類最相關的數據點的權重.兩者的根本目的都是壹樣的.此外,根據需要,兩個方法都可以增加不同的正則化項,如l1,l2等等.所以在很多實驗中,兩種算法的結果是很接近的.

但是邏輯回歸相對來說模型更簡單,好理解,實現起來,特別是大規模線性分類時比較方便.而SVM的理解和優化相對來說復雜壹些.但是SVM的理論基礎更加牢固,有壹套結構化風險最小化的理論基礎,雖然壹般使用的人不太會去關註.還有很重要的壹點,SVM轉化為對偶問題後,分類只需要計算與少數幾個支持向量的距離,這個在進行復雜核函數計算時優勢很明顯,能夠大大簡化模型和計算

svm 更多的屬於非參數模型,而logistic regression 是參數模型,本質不同.其區別就可以參考參數模型和非參模型的區別就好了.

logic 能做的 svm能做,但可能在準確率上有問題,svm能做的logic有的做不了

問題二:邏輯回歸適用於什麽樣的分類問題 兩種方法都是常見的分類算法,從目標函數來看,區別在於邏輯回歸采用的是logistical loss,svm采用的是hinge loss.這兩個損失函數的目的都是增加對分類影響較大的數據點的權重,減少與分類關系較小的數據點的權重.SVM的處理方法是只考慮

問題三:哪些問題可以使用logistic回歸分析 Logistic回歸主要分為三類,壹種是因變量為二分類得logistic回歸,這種回歸叫做二項logistic回歸,壹種是因變量為無序多分類得logistic回歸,比如傾向於選擇哪種產品,這種回歸叫做多項logistic回歸。還有壹種是因變量為有序多分類的logistic回歸,比如病重的程度是高,中,低呀等等,這種回歸也叫累積logistic回歸,或者序次logistic回歸。

問題四:邏輯回歸 和 樸素貝葉斯 兩者間的區別 區別如下:

logistic回歸又稱logistic回歸分析,是壹種廣義的線性回歸分析模型,常用於數據挖掘,疾病自動診斷,經濟預測等領域。例如,探討引發疾病的危險因素,並根據危險因素預測疾病發生的概率等。以胃癌病情分析為例,選擇兩組人群,壹組是胃癌組,壹組是非胃癌組,兩組人群必定具有不同的體征與生活方式等。因此因變量就為是否胃癌,值為“是”或“否”,自變量就可以包括很多了,如年齡、性別、飲食習慣、幽門螺桿菌感染等。自變量既可以是連續的,也可以是分類的。然後通過logistic回歸分析,可以得到自變量的權重,從而可以大致了解到底哪些因素是胃癌的危險因素。同時根據該權值可以根據危險因素預測壹個人患癌癥的可能性。

樸素貝葉斯分類器(Naive Bayes Classifier,或 NBC)發源於古典數學理論,有著堅實的數學基礎,以及穩定的分類效率。同時,NBC模型所需估計的參數很少,對缺失數據不太敏感,算法也比較簡單。理論上,NBC模型與其他分類方法相比具有最小的誤差率。但是實際上並非總是如此,這是因為NBC模型假設屬性之間相互獨立,這個假設在實際應用中往往是不成立的,這給NBC模型的正確分類帶來了壹定影響。

解決這個問題的方法壹般是建立壹個屬性模型,對於不相互獨立的屬性,把他們單獨處理。例如中文文本分類識別的時候,我們可以建立壹個字典來處理壹些詞組。如果發現特定的問題中存在特殊的模式屬性,那麽就單獨處理。

問題五:機器學習中的邏輯回歸到底是回歸還是分類 邏輯回歸:y=sigmoid(w'x)

線性回歸:y=w'x

也就是邏輯回歸比線性回歸多了壹個sigmoid函數,sigmoid(x)=1/(1+exp(-x)),其實就是對x進行歸壹化操作,使得sigmoid(x)位於0~1邏輯回歸通常用於二分類模型,目標函數是二類交叉熵,y的值表示屬於第1類的概率,用戶可以自己設置壹個分類閾值。

線性回歸用來擬合數據,目標函數是平法和誤差

問題六:邏輯回歸,如何處理多元***線性問題 將所有回歸中要用到的變量依次作為因變量、其他變量作為自變量進行回歸分析,可以得到各個變量的膨脹系數VIF以及容忍度tolerance,如果容忍度越接近0,則***線性問題越嚴重,而VIF是越大***線性越嚴重,通常VIF小於5可以認為***線性不嚴重,寬泛壹點的標準小於10即可。

問題七:機器學習之邏輯回歸算法的壹些疑問 第壹, 參數為theta, 觀察到x向量,判斷為y標簽的概率。

第二, h(x)為sigmoid function, 用來將 (-inf,inf)映射至(0,1]作為概率分布

第三 , 雖然不知道妳在說什麽,但是y是標簽,所以在這裏只有二值,1或-1

問題八:多重線性回歸,logistic回歸,cox回歸各自解決什麽問題 影響因素研究的

問題九:邏輯回歸和神經網絡之間有什麽關系 神經網絡的設計要用到遺傳算法,遺傳算法在神經網絡中的應用主要反映在3個方面:網絡的學習,網絡的結構設計,網絡的分析。

1.遺傳算法在網絡學習中的應用

在神經網絡中,遺傳算法可用於網絡的學習。這時,它在兩個方面起作用

(1)學習規則的優化

用遺傳算法對神經網絡學習規則實現自動優化,從而提高學習速率。

(2)網絡權系數的優化

用遺傳算法的全局優化及隱含並行性的特點提高權系數優化速度。

2.遺傳算法在網絡設計中的應用

用遺傳算法設計壹個優秀的神經網絡結構,首先是要解決網絡結構的編碼問題;然後才能以選擇、交叉、變異操作得出最優結構。編碼方法主要有下列3種:

(1)直接編碼法

這是把神經網絡結構直接用二進制串表示,在遺傳算法中,“染色體”實質上和神經網絡是壹種映射關系。通過對“染色體”的優化就實現了對網絡的優化。

(2)參數化編碼法

參數化編碼采用的編碼較為抽象,編碼包括網絡層數、每層神經元數、各層互連方式等信息。壹般對進化後的優化“染色體”進行分析,然後產生網絡的結構。

(3)繁衍生長法

這種方法不是在“染色體”中直接編碼神經網絡的結構,而是把壹些簡單的生長語法規則編碼入“染色體”中;然後,由遺傳算法對這些生長語法規則不斷進行改變,最後生成適合所解的問題的神經網絡。這種方法與自然界生物地生長進化相壹致。

3.遺傳算法在網絡分析中的應用

遺傳算法可用於分析神經網絡。神經網絡由於有分布存儲等特點,壹般難以從其拓撲結構直接理解其功能。遺傳算法可對神經網絡進行功能分析,性質分析,狀態分析。

遺傳算法雖然可以在多種領域都有實際應用,並且也展示了它潛力和寬廣前景;但是,遺傳算法還有大量的問題需要研究,目前也還有各種不足。首先,在變量多,取值範圍大或無給定範圍時,收斂速度下降;其次,可找到最優解附近,但無法精確確定最擾解位置;最後,遺傳算法的參數選擇尚未有定量方法。對遺傳算法,還需要進壹步研究其數學基礎理論;還需要在理論上證明它與其它優化技術的優劣及原因;還需研究硬件化的遺傳算法;以及遺傳算法的通用編程和形式等。

問題十:邏輯回歸模型的回歸因子怎麽得到 線性回歸,是統計學領域的方法,用的時候需要關註假設條件是否滿足、模型擬合是否達標,參數是否顯著,自變量之間是否存在多重***線性等等問題因為統計學是壹個過程導向的,需要每壹步都要滿足相應的數學邏輯。

下面講講我對線性回歸的體會(只講體會,原理的內容就不多說了,因為不難,而且網上相應資料很多!~):

1、linear regression 是最原始的回歸,用來做數值類型的回歸(有點繞,是為了區別“分類”),比如妳可以利用它構建模型,輸入妳現在的體重、每天卡路裏的攝入量、每天運動量等,預測妳壹個月的體重會是多少,從模型的summary中,查看模型對數據解釋了多少,哪些自變量在影響妳體重變化中更重要(事先對變量做了standardize),還可以看出在其它自變量不變的適合,其中壹個自變量每變化1%,妳的體重會變化多少(事先對自變量沒做standardize)。 當問題是線性,或者偏向線性,假設條件又都滿足(很難),又做好了數據預處理(工作量可能很大)時,線性回歸算法的表現是挺不錯的,而且在對模型很容易解釋!但是,當問題不是線性問題時,普通線性回歸算法就表現不太好了。

2、曲線回歸,我更喜歡稱之為“多項式回歸”,是為了讓彌補普通線性回歸不擅長處理非線性問題而設計的,它給自變量加上壹些適合當前問題的非線性特征(比如指數等等),讓模型可以更好地擬合當前非線性問題。雖然有壹些方法來幫助判斷如何選擇非線性特征,可以保證模型更優秀。但動手實踐過的人,都知道,那有點紙上談兵了,效果不好,而且有些非線性很難簡單地表示出來!!

3、logistic regression,我感覺它應該屬於機器學習領域的方法了(當妳不去糾結那些繁瑣的假設條件時),它主要是用來分析當因變量是分類變量的情況,且由於本身帶有壹絲的非線性特征,所以在處理非線性問題時,模型表現的也挺好(要用好它,需要做好數據預處理工作,把數據打磨得十分“漂亮”)。企業十分喜歡用它來做數據挖掘,原因是算法本身表現良好,而且對模型的輸出結果容易解釋(領導們都聽得懂),不像其它高端的機器學習算法,比如Multiboost、SVM等,雖然很善於處理非線性問題,對數據質量的要求也相對較低,但它們總是在黑盒子裏工作,外行人根本看不懂它是怎麽運行的,它的輸出結果應該怎麽解釋!(好吧,其實內行人也很難看懂!- - )

  • 上一篇:英語作文《我的周末》50詞用壹般過去時
  • 下一篇:高精度編程
  • copyright 2024編程學習大全網