當前位置:編程學習大全網 - 編程語言 - 專訪數庫科技CEO劉彥

專訪數庫科技CEO劉彥

現代管理學之父德魯克說過,每個企業都是 社會 的“器官”,用來解決 社會 問題。

如果說企業是器官,那麽連接器官的“血管”就是“ 產業鏈網絡 ”。如同血管連接了全身壹樣,產業鏈網絡則將我們的 社會 實體緊密相連。通過這條網絡,經濟“血液”得以流動,時時傳輸著利益與風險。

可以想見,如果在數據層面打造這樣的產業鏈網絡,實體經濟中的每個個體均可在數據關系層面互連互通,從而形成模擬實體經濟運轉規律的數據網絡體系。進壹步地,在這樣的基礎上建模,則必將在各行各業創造巨大的應用空間。

但建造又談何容易,僅僅把上市公司的數據披露做標準化處理、梳理上下遊關系,就已經是壹個復雜而耗時的浩蕩工程。將超過4000萬家非上市企業鏈接到這張產業網上,同時將已標準化處理的供應鏈、企業圖譜、實時新聞資訊、宏觀、行業、航運、海關、產銷等另類數據根據產業節點組裝,形成上下遊產業邏輯關系,則更是幾乎不可能完成的任務。

然而,有壹家企業熬過了這樣漫長而艱苦的歷程,它首創了SAM產業鏈圖譜,覆蓋了從上市公司到非上市公司幾乎所有的數據信息及實時資訊,並按照產業節點及上下遊邏輯關系組裝,形成了完整的產業鏈數據體系。在經歷了10年的砥礪琢磨與積累後,數庫 科技 終於在金融 科技 及產業數字化浪潮中迎來了“開花結果”的時刻。

如今,各大頭部券商、銀行,甚至是摩根大通、穆迪這樣的國際知名機構,都成為了數庫 科技 的服務對象。同時,數庫 科技 的相關產品還在政府、媒體等各大領域逐壹滲透。

那麽,是什麽樣的信念,支撐著數庫 科技 做成了這樣的產業鏈全生態網絡?它的未來又將走向何方?

信息論告訴我們,IT的本質是“信息傳播的技術”,它前所未有地延伸了我們各類感官所觸及到的廣度和深度,極大地縮短了信息傳播時間。過去幾十年,IT產業獲得了空前發展,誕生了谷歌、亞馬遜、IBM等全球大公司。

屬於IT的時代還在前進著,但壹些變化卻促成它發生了演進,逐漸衍化出“ DT ”的概念。 所謂DT(數據 科技 ),就是讓機器更進壹步,承擔思考、決策工作。

信息傳播越來越快、越來越高效的當下,信息量早已呈指數級增長,直到發生“信息大爆炸”。試想壹下,當妳所從事的領域,1秒的信息增量比以往1年的還要多,當這些信息不止以數字,而是以音頻、文本、圖像等全維度呈現時,妳或許很快就會迷失在信息的海洋裏,變得力不從心。

舉個例子,壹個負責給客戶提供實時資訊的業務人員,若是僅憑人力,該如何做到海量信息精準推送?如果還是參照IT時代“機器負責傳播,人腦負責處理”的思維運作,那麽這意味著,以前可以由壹個人勝任的信息處理和分析工作,現在可能用10個人都不夠。

好在總有人提前洞見了問題所在,及時轉變了思維。正如數庫 科技 CEO劉彥所形容的, “在球場上,妳不能跟著球跑,而只有提前站在落地點的人,才有可能接到球” ,數庫 科技 就是這樣的“接球手”。

在企業數據服務領域,從“IT”到“DT”的演進早已開啟。以往的幾十年,我們都在努力讓“流程自動化”。各類ERP、CRM等業務處理軟件,歸根到底,都是用流程表單、數字表格等形式規範並表達運營流程,讓企業參照固定的範式運轉,並同步產生運營數據。

而在同期的海外市場,企業早已越過了“ 流程自動化 ”,而進化到“ 決策自動化 ”。

例如彭博已經能利用自然語言處理、大數據處理等先進技術,分析人流、社交媒體信息表現的“情緒”,並利用這種情緒數據幫助投資者在市場中獲得先機。再例如,美國銀行已經能從幾百萬貿易信息中,提取有效信息,並精準推送給用戶。這些原本由人腦做的分析和決策工作,現已用機器代勞。

洞察了國外金融機構的發展趨勢,數庫 科技 早在10年前就下了賭註。 “我們多年投入,賭的就是這樣壹個從‘IT’到‘DT’,從‘流程自動化’到‘決策自動化’的演變” ,劉彥說道。

“壹方面,數據是決策的依據,在DT時代,隨著各類決策場景的數字化,數據本身的獲取成本及質量將直接對決策能力形成制約。再好的決策引擎,沒有高質量且成本可控的數據“燃料”,也將難以為繼”,

“另壹方面,數據行業門檻高、投入大且見效慢,拼的都是基本功。因此,當我們決定將全部的人工智能技術投入數據‘冶煉’的時候,我們就知道迎接我們的將是壹段崎嶇的旅程,但壹旦成功,帶給我們的也將是優質的商業模式及突出的商業場景拓展能力。畢竟,決策無處不在,而決策自動化所必須的數據也將無處不在。”等待的過程註定是艱苦的。數庫 科技 的前10年,都在投入研發、磨礪技術,只為日後薄發之時。在無數次翻閱報表、統計數據,無數次從散亂的文本中抓取信息、叠代更新,無數次對著底稿分發-匯總-再分發-再匯總後,數庫 科技 終於在叠代了數個版本後,打造了強大的“產業鏈網絡”。

劉彥向我們現場展示了其產品成果。例如,當我們隨便點開壹家公司時,其系統不僅能展現此公司多年經營狀況,還能將其整條產業鏈,乃至所有相關聯的 社會 實體經營信息、實時新聞壹網打盡。

2018年,當中美貿易戰打響,壹系列金融開放政策密集出臺的時候,數庫 科技 終於等來了屬於它的時代。

這時起,大量海外機構湧入,參與國內金融競爭。開放環境下,國內機構迫切需要向“決策自動化”的海外金融公司學習,提高運營效率。壹時間,機構對數據分析的能力要求急劇提升,銀行、券商等紛紛開啟了金融 科技 改革。

而數庫 科技 早就厲兵秣馬、嚴陣以待。當某頭部券商率先在市場尋求技術合作時,數庫 科技 作為唯壹壹家可以提供成熟產品的 科技 企業,自然備受青睞。在2019年,數庫 科技 終於迎來了首次業務規模井噴的時刻,1年內業務量增長了5倍!在尚未過去的2020年,數庫的業務量又將實現5倍以上的增長,應用場景進壹步多元化,印證了各類決策場景對高質量數據服務的強需求。

數據 科技 的時代終究來臨了。在這裏等候了多時的數庫 科技 ,是 如何讓機器幫助人們“思考”與“決策”的呢?

IT時代的數據處理工具,雖然能提供統壹標準、統壹口徑的數據,但歸根到底卻沒有解決 數據快速量產問題

當海量信息湧入時,由於匱乏先進的算法技術,傳統數據商只能靠人力堆砌,處理信息問題。因此,隨著信息量呈指數級增加時,傳統數據商的成本也在直線上升。效率,始終是制約傳統數據商發展的心頭大患。同樣是數據供應商,數庫 科技 的玩法卻截然不同。

(圖:數庫 科技 數據生產引擎系統DAS)

以SAM產業鏈為例,我們可窺見數庫獨特的高 科技 玩法。SAM全稱Segment Analysis Mapping,中文釋義為“數庫產業鏈數據體系”。其將中國大陸,香港及美國市場全部上市公司業務分布及產品集披露進行標準化,確保上市公司在業務及產品緯度實現高度可比。其中包括A股、港股、美股、新三板、發債企業等累計2.5W+家上市公司;全量工商註冊非上市公司累計4000W+家,實現了全領域的企業覆蓋。

SAM產業鏈的每壹條產品線與國際標準GICS直接對接,將GICS四層產品分布直接擴充至11層。擁有超過5000+個標準化產品節點,70000+個上下遊產業關系,這也是目前國內唯壹壹個針對全部公司自下而上的產業鏈架構!目前全球僅彭博,Factset和數庫擁有完整產業鏈數據體系,而其中數庫專註於中國市場並提供更豐富的產業節點,擁有極強的市場競爭力!

(圖:SAM產業鏈示例)

“SAM產業鏈就如同通用數據底座,應用到特定場景時,能如拼樂高積木壹般與其他數據接口迅速拼裝與搭建”,劉彥如是概括道。

劉彥進壹步向我們展示了SAM的應用方法,在這張產業鏈網絡上,妳可以找出任意兩家企業的關系,而不用擔心存在“數據孤島”的問題。

舉例來說,某手機公司和某工業品公司,看似毫不相關,但或許它們上遊的某個原材料是相同的,又或許它們的股東之間有著千絲萬縷的聯系,於是風險、利益便可以通過這張產業鏈網絡傳遞。正如“蝴蝶效應”壹般,某個手機公司的小小動態,也可能引起某個工業品公司發生震動。

(圖:手機產業鏈示例)

如此細密的產業鏈網絡,是如何編織而成的呢?

由數庫 科技 自研算法驅動的兩大核心技術——數據生產引擎和自然語言處理,壹個負責數據快速量產,壹個負責數據抓取,兩者為其產品提供了強有力的支持。

首先,數庫率先基於機器學習技術實現了數據自動化量產,將數據提取、清洗、標準化、質檢等流程無縫銜接,形成高度自動化處理能力。數據生產引擎不斷從文檔中解析並生產高質量精準圖譜型數據,這些圖譜型數據形成金融知識庫,與前端自然語言處理引擎結合,在實時資訊處理層面不斷提升解析精準度。而自然語言處理引擎在實時資訊文本中不斷抓取到的新概念或新想法又能持續反哺至金融及產業知識庫中,反向賦能數據生產引擎並提升其數據生產精準度,從而實現金融及產業知識庫的持續自我進化。

(圖:後端數據生產與前端資訊采集實現相互反哺及自我進化)

如此循環,數據庫便能在無人幹預的情況下,讓金融及產業知識庫如“滾雪球”般越做越大,而其算法也在不斷自我叠代中愈加精準。最終,這些富有“意義”的數據,被系統以產業角度編排,更新進入產業鏈網絡。

如是,數庫 科技 基於“產業+企業”的全景畫像 便形成了。可以想見,其應用場景將十分廣闊。

除了為券商做輿情分析、風險控制,數庫 科技 的產品已經擴展到銀行、政府、媒體等各類群體中。對銀行而言,其產業鏈網絡能揭示潛在的風險傳遞過程,助其做風險控制;對新聞社、企業來講,這意味著消息精準推送、產業鏈精準營銷;對政府而言,意味著產業監控、產業政策評估、智慧招商;對於量化投資機構,則意味著更高質量的新聞輿情因子數據,全面提升Alpha收益……

(圖:數庫 科技 某政府機構“產業大腦”解決方案)

(圖:數庫 科技 某大型央企產業監控平臺方案)

(圖: JPMorgan基於數庫 科技 新聞數據撰寫的量化研究報告,報告獲取請訪問:/doc.html)

紮實的數據處理功底及可快速組裝的數據及算法模塊,構築了數庫的技術護城河,而不斷積累進化的金融及產業知識庫,則構成了數庫的業務護城河。

回頭來看,數庫當初選擇數據‘冶煉’這條道路的執著是正確的。隨著金融機構、政府及企業數字化轉型步伐加速,深厚的數據功底及核心能力將協助數庫加速拓展落地新應用場景,並持續優化成本結構,打造具備長期競爭力的商業模式。

?數庫相信,以控制為出發點的IT時代,正在走向激活生產力為目的的DT數據時代。 數據與算力的結合,將會成為新時代的第壹生產力。

而今,數據 科技 的時代終於在金融、政務、企業服務等領域迎來爆發。為此等待了10年的數庫 科技 ,也終於等到了屬於它的時代。前壹個十年,數庫 科技 磨出了產業鏈數據生態網絡這把“利劍”,後壹個十年,數庫 科技 將披荊斬棘,開辟它的高增長之路!

  • 上一篇: 數據科技時代已來
  • 下一篇:MariaDB 和 Mysql 怎麽選
  • copyright 2024編程學習大全網