工作原理
LSTM區別於RNN的地方,主要就在於它在算法中加入了壹個判斷信息有用與否的“處理器”,這個處理器作用的結構被稱為cell。
壹個cell當中被放置了三扇門,分別叫做輸入門、遺忘門和輸出門。壹個信息進入LSTM的網絡當中,可以根據規則來判斷是否有用。只有符合算法認證的信息才會留下,不符的信息則通過遺忘門被遺忘。
說起來無非就是壹進二出的工作原理,卻可以在反復運算下解決神經網絡中長期存在的大問題。目前已經證明,LSTM是解決長序依賴問題的有效技術,並且這種技術的普適性非常高,導致帶來的可能性變化非常多。各研究者根據LSTM紛紛提出了自己的變量版本,這就讓LSTM可以處理千變萬化的垂直問題。