每經記者:孫嘉夏 每經實習記者:黃海 每經編輯:董興生
“這個世界不存在魔術,不存在一個大模型‘啪’得一瞬間把所有問題都解決了。”
7月6日至8日,2023世界人工智能大會在上海舉辦。6日下午,數庫科技創(chuàng)始人兼總裁沈鑫在大會現場接受了《每日經濟新聞》記者專訪。

沈鑫 圖片來源:企業(yè)供圖
數庫科技成立于2009年,是一家專注產融數字化的數據科技公司,主要在金融及產業(yè)領域提供基于產業(yè)邏輯的智能數據產品與系統(tǒng)服務,幫助金融機構、企業(yè)集團、政府部門解決業(yè)務場景中的數據和系統(tǒng)需求。
本次大會期間,數庫科技將發(fā)布融合統(tǒng)一產品圖譜體系與大模型的概念型產品“istari”。記者現場觀察到,用戶輸入問題后,istari可以將需求轉化成統(tǒng)一產品知識圖譜(UPG)相關的查詢,并呈現出相關的專業(yè)產業(yè)知識以及各個知識點之間的關系。
據沈鑫介紹,目前,istari主要通過大模型來做產業(yè)關系的推演?!耙郧拔覀冎挥袉渭兊纳舷掠侮P系,今天大模型可以通過各種各樣的資訊,來反推除了產業(yè)關系之外潛在的經營聯(lián)系?!?/p>
在談及通用大模型是否會取代行業(yè)大模型時,沈鑫表示,通用大模型如果真的做到垂直領域,經過很高級別的訓練之后,可以做得很好?!暗菃栴}在于,能夠真正供大模型使用的高質量的數據是非常缺乏的……(做得好的)幾家肯定不會把數據貢獻給別人,所以(通用大模型取代行業(yè)大模型)其實是一個漫長的過程,沒有大家想象得那么快。
以下是部分問答實錄:
NBD:對于當今市場而言,產業(yè)鏈數據價值體現在哪里?
沈鑫:我們講數據想要用好,必須要數數相連,要有連接邏輯,產業(yè)關系是唯一一個可以連接中國所有企業(yè)的關系。我跟你之間哪怕沒有金錢往來,有了金錢往來那叫供應鏈,(但)直接和間接,兩個企業(yè)之間一定會有產業(yè)的傳導路徑。
我們把產業(yè)數據網絡搭起來以后,第一,它本身是個數據集,你可以看到企業(yè)上下游的情況,可以做企業(yè)定位,它可以單獨當成一個數據集來用,同時它又是一個數據編制的核心邏輯,我們可以把宏觀行業(yè)的信息、公司相關的信息、某一個產品的產能價格等定到產品節(jié)點上。
本來是孤島式的數據現在有了邏輯,再去疊加模型的時候,你會發(fā)現它的判斷就更加精準。所以我們主要是做數據融合和數據組裝。通過各種各樣的大數據線索把這些數據融合起來建模,得出一個決策的結論,讓我們的客戶能夠在最佳的市場時機去切入這些企業(yè),去授信也好,去服務也好,找到企業(yè)生命周期中最好的介入時間點。

圖片來源:每經實習記者 黃海 攝
NBD:公司過去這十年中遇到最大的難點是在哪?
沈鑫:其實難點很多,為什么講數據行業(yè)實際上門檻比較高,首先想做好數據融合,數據就要做到高度的結構化和標準化,這件事情就有點像石油冶煉一樣,怎么把粗的、顆粒的數據變成更加結構化、更加精細的,我們叫“好料子”,這有個提煉的過程。
在過去的十多年,我們用很多的人工智能技術,通過工程化建設打造自己的數據工廠,這個數據工廠會把一些非標數據轉換成高度結構化和標準化的數據。在開始的時候,機器生產數據肯定是不如人的,它需要很多年的積累,但今天它已經突破了邊界,生產的精度已經超過人了。
我們相信的一點是,要用工業(yè)化的思維來經營一家企業(yè),我們不能回到勞動密集型老路上去。
NBD:如何看待大模型的應用?
沈鑫:這個世界不存在魔術,不存在一個大模型“啪”得一瞬間把所有問題都解決了。它本身是一個效率工具,我們現在會把大模型的一些技術融入到數據生產端,進一步去提升生產效率。這個實際上是我們看待大模型的一個點,就是不要為了技術而技術。
NBD:如何看待通用大模型和行業(yè)大模型之間的應用場景沖突?
沈鑫:如果通用大模型發(fā)展到極致的話,我覺得也就不存在什么行業(yè)大模型,但這是一個非常漫長的過程。
能夠真正供大模型使用的高質量數據是非常缺乏的。你看我們行業(yè)里,能把金融相關數據標準做到很高的公司,可能掰手指頭都數得出來,而這幾家肯定不會把數據貢獻給別人。所以它其實是一個漫長的過程,沒有大家想象得那么快。
另外一個點,很多的場景是不需要用到大模型的。可能在咨詢服務類的場景中大模型有很大的用場,但是在金融這種對數據要求很嚴謹的行業(yè)內,大模型實際是沒有意義的,因為回饋是相對比較模糊的。
每日經濟新聞