當前位置:編程學習大全網 - 編程語言 - 內容理解算法研究

內容理解算法研究

經過幾年的擴張,無論是AI四小龍艱難的上市之路,各大互聯網公司副總裁回歸學術界,還是算法人員招聘的凍結,算法的熱度都迅速下滑。還有就是整體經濟形勢惡化帶來的影響,這也和算法自身能力的上限有關。在各類學習任務中,算法的性能逐漸進入瓶頸,提高壹般任務效果的梯度逐漸降低。有效的進展依賴於超大規模的數據和模型參數。以壹般的語義表示任務為例,完成壹個超大規模的前期訓練模型的成本達到幾百萬元,大大限制了中小企業參與的機會。

在業務應用方面,經過幾年的不斷建設和各類功能的輸出,對應不同業務依賴方向的內容理解算法在應用和效果上已經比較成熟,帶來驚喜的機會很少。在這種情況下,作為偏後臺支持的角色,如何識別並不斷深化內容理解算法的角色就變得非常重要。本文試圖從價值的角度分析內容理解的生存狀況,探討未來發展的可能性,並對員工的應對方式做出壹些不那麽嚴謹的解釋。

我們壹直把內容理解算法定義為商業的靈丹妙藥,可以隨時隨地插拔。從與內容生產者合作做創意提示,幫助運營者做質量分析、版權保護和相似搜索,幫助搜索算法提升長尾查詢效率,幫助推薦算法提供標簽等細粒度語義特征,根據消費者的負面反饋屏蔽同類型內容(如軟色情、惡心、不喜歡的明星)。因此,我們很自然地將內容理解算法的使命定義為“提高內容流全鏈路的質量和效率”,其中質量包括確定性劣質的去除和高質量內容的免試用或高曝光推薦。效率是指將內容從生產到消費的時間優化到最快,包括協同運營的快速內容篩選和輔助分發算法的人與內容精準匹配。

這裏需要回答的是,在以上相對完整的能力基礎上,內容理解算法能提供的核心價值是什麽?

首先是客戶的定義。內容理解算法的客戶不是運營商,不是分發算法,不是生產者,也不是消費者。而是要回歸最原始的“內容”,讓內容的附加值最大化。

其次,內容流通各個環節所涉及的角色都承載著內容理解算法的價值,無論是運營所引領的平臺意誌的實現,分發算法對內容和消費者的高效匹配,還是生產者和消費者分別從內容供給和消費兩個方面對內容理解算法的訴求。

最後,內容本身是壹個載體,背後是人們對現實世界的描繪。平臺層面有了按需接入內容的邏輯,消費者也有了用腳投票的權利。這裏的內容理解算法不應被視為任何自我傾向,根據業務訴求的多元化能力輸出才是內容理解的核心價值。否則,簡單搬來學術界的開源模式就能堆砌出表面的業務能力,顯然無法滿足業務增長訴求。

因此,我們可以形成壹個價值定義:“內容理解算法的核心價值是根據服務業務在內容全生命周期的多樣化訴求,提供智能化、結構化的理解能力,其衡量標準是上述能力帶來的額外效率提升和成本降低。”

從這個定義來看,內容理解算法似乎是不站在主戰線上的,它的價值是隱式計算的。其實不然。就像壹場戰爭,沖鋒在前的部隊只有幾個,承擔防禦和輔助任務的兵種其實是不可或缺的,這往往決定了戰爭的走向。歷史上有很多因為後勤保障問題導致戰爭走向改變的例子。就像定義中的效率提升壹樣,其實也不是壹票制的方法。因為效率的提升會增加供應商和消費者的規模,也會對內容理解算法的效率提升產生更多的需求。這種正反饋環節也是內容服務快速實現既定目標的重要途徑。

第壹,估值博弈

從小紅書2021,11的估值來看,當時6000萬DAU,人均47分鐘的內容社區,被200億美金的估值所認可,這是壹個早期的內容社區經過長時間的成長所能達到的高度。考慮到壹個相對創新的內容業務,兩到三年內達到5000萬DAU,人均5分鐘,其實很難。按照對標小紅書的邏輯,估值上限是30億美元。假設內容理解算法對業務的貢獻率按3%折算,內容理解的預估估值為9000萬美元。按照10次的簡單營銷率,內容理解年營收900萬美元(按照估值,

900萬美元是壹個很尷尬的數字,因為內容理解算法的成本比較高。從大的角度來說,內容理解算法支出分為三部分。第壹部分是算法人員,由15人的支持團隊計算(看起來有點多,但不足以支撐未來的預期增長,15人其實不夠)。按照壹個人壹年的繳費成本,就是65438+。第二部分是資源消耗。按照百萬內容/天的規模,各種資源(包括機器、存儲、輔助軟件等)的成本。)約為500萬美元/年;第三部分是支持工程師、產品經理、外包貼標支持等。這部分大概是654.38+50萬美元/年。可見,現階段業務發展,內容理解算法力不從心。

按照上述口徑,提高內容理解價值的核心方法包括三個方向。首先,企業價值的增加需要企業DAU和持續時間的穩定增長。第二,內容理解算法的商業貢獻率提升。這裏對內容理解算法的要求比較高,不僅是從內容的質量,生產者的協助,分發流量的效率,商業的整體生態,還是商業的商業化。三是降低成本。這條路的可行性很弱。相反,隨著業務的增長,成本的消耗會進壹步增加。我們能做的就是把成本的增長速度控制在低於業務的增長速度。

“根據業務貢獻來衡量內容理解算法在業務發展初期的價值並不樂觀”。

第二,價值重塑

前壹個視角是閉環業務下的價值衡量,是向更大的視角開放的。內容理解算法之所以構成壹個相對獨立的功能單元,是因為它提供的能力是相對通用的。例如,標簽識別算法不僅可以用於小紅書,還可以用於Tik Tok和Aauto faster等內容業務。

所以在支持具體業務的過程中,沈澱壹個通用算法輸出其他類似業務的價值,是內容理解算法的另壹扇門。這裏面臨的另壹個問題是,如果是頭部商家,就必須要求內容理解算法為其量身定制,而中小商家願意為內容理解算法支付的價格是有限的。這個問題的核心解決方案是在定制頭部業務能力時提供最通用的能力,通過對大量中小業務形成價值輸出,實現數量級的堆疊。

另外,為了區分成熟業務和創新業務,對於成熟業務,內容理解算法對業務的輕微提升可能是非常明顯的。以JD.COM平臺為例,如果內容理解算法通過圖片搜索或段落識別,使商業交易提升0.1%,每年也將是上億元的價值增值。對於創新業務,內容理解算法要深入業務,從內容的全生命周期為業務提供硬核能力,幫助業務實現生產者和消費者身體感的明顯提升,最終帶來業務的正反饋增長。早期,Tik Tok依靠酷炫的AI特效系統實現了用戶規模的快速增長。

“目前內容理解算法放大價值的有效方式是在親自服務頭部業務的過程中,沈澱泛化能力,輸出盡可能多的同類型服務。為成熟業務尋找業務增長的某些增長點,創新業務尋找適合業務快速增長的硬核能力。”

作為壹個沈浮六年的內容理解算法老手,我對內容理解算法的未來持謹慎樂觀的態度。原因有三。第壹,這壹輪深度學習帶來的算法改進空間變得有限;第二,互聯網用戶進入股票時代後,頭部的內容會更加密集,從追求效率到運營的精細化和粘性維護;三是展望未來可能出現的下壹代內容消費模式。

第壹,算法改進空間相對有限

在過去的幾年中,內容理解算法的演變可以分為三個方向。壹個是從傳統的手工特征到神經網絡特征的升級。通過大數據和計算能力,效果明顯提升,算法人員的準入門檻大大降低。第二,對內容的理解從單壹模式升級為多模式&;基於圖形神經網絡的跨模態推理能力:再次,極大規模數據的模型學習,即基於大規模預訓練模型的統壹內容表示方法,催生了變形金剛家族的不斷壯大。

然而,算法的性能正在逐漸接近瓶頸,在讀圖、情感分析、標簽識別等算法任務上與人類還有壹定的距離,而這種距離在短期內似乎沒有明確的突破機會。相反,行業開始從監督學習走向無監督學習,試圖利用海量數據來學習背後的範式,本質上是在偏離追趕人類的能力。

以變壓器為例。幾百億數據的訓練,壹次要消耗幾百個GPU,而且要經過幾周的訓練時間才能有明顯的效果提升,這還不包括精調網絡的令人沮喪的時間成本。另外,下遊任務要想得到預期的效果,還需要進壹步的遷移學習。從外觀上看,只是為算法學習提供了壹個更好的起點。

我們經歷了壹個合作的過程,在這個過程中,業務在等待我們變得更加理性。AI算法從來不是救世主,而是生產力更強的工具。當然,我們也不應該過於悲觀。至少在過去的幾年裏,蓬勃發展的算法體系帶來了從業人員入職門檻的極大下降。公眾對AI算法的廣泛理解也促成了內容理解算法相對長期的生命力和成長。

二、存量用戶時代內容社區的運營模式

互聯網在中國的使用,意味著各大內容商必須進入存量用戶階段。存量用戶面臨的困境是粗放式增長不再出現,用戶群體開始細分,用戶粘性變得更加困難,需要內容社區進行精細化運營。精細化運營背後的表現是對效率的需求下降,取而代之的是對用戶心智和長期戰術的耐心。在這種情況下,內容理解算法將成為分散在眾多業務需求列表中的功能支撐點,獨立出來的機會在減少。

“從算法學習的角度來說,人的創造力、玩法設計、交互屬性是地面真實的天花板,所以保持此刻的工具屬性相對合理。”

第三,下壹代的內容消費模式

互聯網時代的內容消費經歷了從文字到圖像,再到視頻的升級。每壹次內容消費升級背後的輸出,都爆發為內容理解算法。那麽下壹代的內容消費模式是怎樣的呢?

該行業目前正在押註元宇宙,facebook甚至更名為Meta。過去有幾波VR/AR熱潮。似乎除了壹些線上的成人網站和線下的遊戲設備,並沒有足夠的輸出來顛覆我們的日常生活方式。

人類顯然需要在更高的層面上感知外部環境,與他人進行無時空差異的互動,但是否由“元宇宙”承載,則不得而知。如果以元宇宙為載體,那麽虛擬世界中超大規模內容消費下的情感識別、觸感生成、自然交互、生態健康管理和負載減輕,將是內容理解算法可以嘗試征服和深化的全新地帶,也將承擔更為核心的角色。

“下壹代內容理解消費模式有機會成為內容理解的下壹個主戰場,但目前形勢並不明朗,需要保持耐心思考和觀望”。

第四,其他可能性

拋開頭部綜合AI廠商如百度、騰訊、阿裏巴巴、華為等企業作為內容理解多樣性需求輸出的第壹極,還有內容理解算法作為平臺能力輸出的第二極,比較著名的有AI四小龍(商湯、曠視、易圖、從雲),以及深度融合民生各領域的工業AI能力輸出。

醫療AI解決了因醫療資源不足而無法滿足就醫需求,人工問診時間長等問題。壹個典型的案例是冠狀病毒肺炎-Moonshot眾包協議,該協議由500多名國際科學家參與,旨在加速冠狀病毒肺炎-19抗病毒藥物的研發。

教育AI解決了優質教育資源缺乏和師生信息不對稱導致的分配不公。雖然國家在力推教育雙減新政策,但教育作為壹項基本的個人權利,應該得到更好的滿足。知名企業有松鼠AI、猿輔導等。

制造業AI解決了設備、數量、功能增加,調度配送困難,需求側個性化需求等問題。通過使用AI、自動化、IOT、邊緣計算、雲、5G等手段,充分利用生產車間的海量價值數據,將人們從簡單重復的勞動中解放出來,從事更高層次的任務,幫助提高產量的同時降低不良率。壹些知名企業是創新和創新的工業人工智能在香港上市。

除此之外,還有各種壹直在智能駕駛、智慧城市、芯片AI等產業領域努力的公司。他們正在充分發揮大數據和AI算法的能力,為各大行業帶來無盡的創新能力。

回到內容理解算法現有的生存環境,還是有壹些潛力可以挖掘的。在下壹代內容消費到來之前,我們可以做得更好,與上下遊形成良性聯動,在當前的舞臺上展現更好的風采。

壹.產品

內容理解算法這個產品是不是剛需,有點爭議。有人說算法輸出速度比較慢,讓昂貴的產品角色參與構造本身會很浪費。個人認為內容理解算法對應的產品角色是必須具備的,因為龐大的業務體系背後,如果沒有自上而下的面向業務需求的內容理解算法體系的設計和建設,是非常容易不習慣業務賦能的。

產品需要考慮的核心問題是如何衡量長期和短期的投入。算法是壹項精細的工作,對結果的期望是不確定的。因此,需要管理業務期望,並及時與業務需求進行交互。為了保證算法在業務中的最終使用效果,前期可以通過簡化半成品算法的版本或產品方案進行快速試錯,有助於業務決策,為算法的長期叠代贏得空間。此外,為算法的長期叠代設計有效的樣本數據回流機制,通過配置輸出盡可能多的試錯法給業務,實時監控業務投入使用後的效果,都是產品需要思考的工作。

二、操作

運營應該是內容理解算法中參與最頻繁的壹方,內容理解算法的評估標準和業務適配需要運營來構建和監控。內容理解算法是內容供給生態和消費生態運營的智能助手,從內容結構化標簽的角度提供和運營各種分析和使用方法,如內容審核、內容圈子選擇、內容人群定投等。

處理運營對內容理解算法提出了很高的要求,如何快速衡量需求的合理性和可行性非常關鍵。有時內容理解算法過度投入,導致上線效果不佳,影響業務發展。有時對算法的實現效果缺乏信心,或者在生產使用中缺乏杠桿,導致需求被拒絕,從而導致業務失去寶貴的試錯機會。因此,內容理解算法要很好地把握內容操作的環節,能夠和操作壹起定義全鏈路算法能力,從應用的角度促進算法需求的合理有序發展。

第三,生產者

制作人對平臺很重要,巧婦難為無米之炊。運營和分發算法再牛逼,沒有優質的內容生產源,業務也不可能持續增長。正常情況下,2000個優質制作人加上幾萬個普通制作人,可以支撐幾千萬個DAU的生意。如何服務好這些生產者,對平臺來說非常重要。

目前,內容理解算法與制作者的交互方式主要包括幾個方面。壹種是內容制作過程中對制作方的內容元素的智能推薦,比如話題、片頭、配樂推薦等。二是改善內容展示效果,如濾鏡、貼紙、美顏、畫質增強等。三是從質量層面對生產者進行引導和管控,包括從商業角度發布給生產者的內容不被平臺采納的原因、高熱趨勢內容的消費清單、內容的版權保護等。

從制作方的角度來說,從平臺獲取盡可能多的流量或商業價值才是根本追求,所以往往會有不斷的探索平臺規則來獲取利益,比如放出大量的擦邊球或危言聳聽的內容。內容理解算法需要在內容供給規模越來越大的情況下,幫助平臺維持健康的生態和有效的流量分配,同時給予生產者盡可能多的指導。這種互相廝殺的關系也給內容理解算法帶來了不小的挑戰和生存空間。

第四,分配算法和消費者

把分發算法和消費者放在壹起的核心邏輯是,內容理解算法在大多數情況下需要通過分發算法和消費者打交道。從消費者的角度來看,高活躍用戶代表了主流心智,如何服務好這個群體關系到商家的生死存亡。中低活躍用戶是平臺的增量,不斷強化這些用戶的平臺粘性是重點任務(會有壹部分用戶逃離這裏,為了維持平臺的心智,這部分犧牲是可以接受的)。分發算法承擔了負載減輕後,根據用戶長期和短期興趣推薦海量內容的使命。分發算法需要堅持平臺的意誌,用於內容流量分配來影響消費者的身感和心智,給平臺帶來無窮的活力。

在早期以編輯為主的內容分發模式中,消費者是被教育的對象,他們壹天能看到的新鮮內容很少,導致消費者的瀏覽深度和時長有限。在個性化推薦模式下,用戶的興趣被大大放大,由於相關內容和新鮮內容的快速推送,消費者會感受到強烈的沈浸式消費感。然而,內容的多樣性、消費者感知的持續維護和興趣的擴大變得非常重要,這對分發算法的準確性提出了很高的要求。提供分發算法的細粒度識別能力,是內容理解算法施展才華的機會。內容是否有很好的分發潛力來增加分發流量?內容適合什麽受眾?用戶無序瀏覽背後的核心利益是什麽?軟色情/如何準確識別部分人不喜歡的內容(蛇蟲寵物)進行分發監管等問題是分發算法難以觸及的。這些命題是內容理解算法可以深入研究並影響內容分發和消費的重要方面。

特定場景除外(如互動玩法、個性化封面圖等。),內容理解算法要遵守其在內容生命周期中的參與廣度。當涉及到內容的分發和消費時,內容理解算法應該將自己定義為分發算法不可或缺的輔助工具,而不是試圖取代它。從內容理解算法的角度來看,分發算法可以約等於消費者。以餐廳運營為例,配送算法是chef,根據消費者的口味、食材、菜譜提供個性化的餐飲服務。內容理解算法可以控制食材質量,開發新的菜譜,必要時提供半成品菜品。與消費者的交互由分發算法處理。畢竟術業有專攻,內容理解算法可以在內容的深度理解和消費者洞察上做壹個垂直的深度,提供更多的可能性,包括生態、多樣性、內容保存等等。

內容理解算法和分發算法的理想狀態是正和博弈,零和博弈對雙方都沒有意義。所以這裏對內容理解算法的額外要求是在內容消費場景下建立相對客觀的評價體系,通過對算法的標準化評價加速上線進程,通過不斷的快速試錯為分發算法提供更多的槍支彈藥。

動詞 (verb的縮寫)工程&;數據分析

壹個英雄有三個幫派,壹群小夥伴站在內容理解算法後面。算法生產的大規模工程基礎設施和算法洞察的數據分析能力,可以幫助內容理解算法更好的發展。在內容爆炸式增長的今天,壹個高效的算法工程系統非常關鍵,甚至是拉開不同公司差距的最重要手段之壹。有壹個很明顯的例子。在業界舉辦的各類算法大賽中,只要大型互聯網公司參加,基本都會稱霸榜單,這背後是模型訓練效率的強大先發優勢。擁有100級GPU並發培養能力的大學少之又少。另外,以通用的向量檢索函數為例,需要大量的工程優化方法,才能在有限的計算能力和內存消耗下,穩定運行數百億的向量索引能力,而這個函數對於算法的高效使用非常重要。

數據分析對於內容理解算法有許多應用。根據消費的統計行為,構建面向內容興趣的用戶畫像,提供內容消費的風向和趨勢方向,分層耦合內容標簽的合理隸屬關系,算法上線前的有效性分析,算法上線後的持續監控和異常報警。

內容理解算法需要做的是針對業務領域進行壹個完整的架構設計,從算法效率的角度,包括算法服務效率、算法洞察視角等方面的聯動工程&;數據分析提供了強大的生產力,通過規模和系統厚度構建了足夠的技術門檻。

2021這壹年,對於中國互聯網乃至中國社會來說,都是不壹樣的壹年。隨著全球經濟不景氣,國與國之間人為壁壘的構築,剛剛遭遇國內人口增長停滯,國家對互聯網平臺的強力控制,互聯網用戶滲透高峰。

內容理解算法背後的AI算法體系也受到了壹些波折,但從整體情況來看,AI算法體系和產業化仍在向前發展。在基礎理論R&D系統中,發表的論文、舉行的會議、舉行的競賽和參與者的數量都有所增加。這兩年的遇冷主要是受市場環境的影響,AI占總投資的比例還在上升。國內方面,全球經濟的技術封鎖進壹步堅定了中國自主創新的決心和信心。中國的“十四五”規劃已經明確提出了大數據、人工智能、VR/AR的產業發展規劃,AI產業仍有很強的潛力值得挖掘。

作為壹個依賴於業務的內容理解算法,需要有清晰的自我認知和定位。我們的核心價值觀是什麽?如何有效定義和量化?作為服務於業務的眾多角色中的壹員,如何做好與其他角色的良性互動?以上問題背後的答案代表了內容理解算法的核心作用。現在算法領域有壹股投機風,流行什麽就做什麽,比如宣稱不需要數據標註的無監督學習,宣稱可以有效對標大量標註樣本的小樣本學習,宣稱單個算法模型可以遍布全球的多模態預訓練學習。如果從問題抽象簡化的角度去研究基礎理論體系和算法學習範式是沒有問題的,但是如果商科學生也把這樣的概念掛在嘴邊就有問題了。沒有業務場景的核心需求就談技術創造新業務,是對客戶的壹種傲慢,屬於典型的機制。

作為深度融合業務的內容理解算法,應該基於業務場景和算法的可行性來探索業務賦能的核心技術。即使需要很長時間去打磨能夠產生正商業價值的算法技術,也要敢於投入建設,在算法研發的過程中不斷思考商業的更多可能性,逐步將商業的不確定性轉化為技術的相對不確定性。對於長期不能為商業做出貢獻的算法,要堅決放棄深入研究。當然作為技術跟進是沒問題的。

從目前的情況來看,內容理解算法的發展確實遇到了壹些困難,但我們可以對未來保持謹慎樂觀,期待下壹代內容消費模式的到來。同時要盡可能提煉業務場景進行能力輸出和強化,放大現有股票的商業價值,通過算法本身的不斷構建,為未來可能的時刻做好技術儲備。

  • 上一篇:作業小五數學題目 ``
  • 下一篇:組裝電腦選什麽牌子好?
  • copyright 2024編程學習大全網