想要搞ai大語言模型平台,其實是一件很困難的事情。
雖然自從chatgpt震撼麵世之後,國內便迅速跟風,接連出現了數個類似的語言模型。
甚至於如果放寬要求,將所有嘗試著跑馬圈地的公司都計算其中的話,單隻是國內,就達到了‘百模大戰’的程度。
各種各樣的‘大模型’,甭管是獨立存在的,還是掛羊頭賣狗肉的,總之把看上去還像那麼回事的‘大模型’加在一起,總量甚至超過了一百三十個!
這其中便有鄭弘毅偷偷摸摸搞的一個試驗品。
受限於資金體量和公司這幾年連續步入頹勢的影響,鄭弘毅根本不敢大張旗鼓的進入到這個全新的賽道之中。
生怕稍有不慎,一旦發展不好的話,再給本就狀況不佳的公司當頭一棒。
到時候若是股價一瀉千裡,那樂子可就大了。
可即便隻是偷偷摸摸搞的試驗品,過程中遭遇的那些困難,依舊讓鄭弘毅感到頭大。
其中最麻煩的就是成本問題!
單純構建模型的起始費用並不算高,大概一千萬到一千五百萬左右,就能粗略的搭建出一個大模型平台。
可基於大模型對硬件和訓練的需求,可以明顯的發現,隨著模型的規模越來越大,訓練的成本也會越來越高昂!
首先最起碼的一個成本就是數據!
大語言模型是在包含龐大數據量的大規模數據集上進行訓練的,除了開源數據集以外,任何公司想要訓練出合格的大語言模型,都必須具備自身長期積累的各種數據集。
並且數據成本還涉及到數據的清洗、標記、組織和存儲。無論是管理成本還是處理成本,都不是普通公司能玩得轉的。
更讓鄭弘毅頭皮發麻的是,想要搞好一個大語言模型,硬件成本同樣是個天文數字!
目前被普遍應用在大語言模型上的gpu、既微處理器,是英偉達a100。
由於大語言模型對於gpu的巨大需求量,導致英偉達a100的價格水漲船高,從官方標定的一萬五千刀售價,直接飆升到了三萬刀,並且就算是這樣,你也很難買到。
因為a100被全麵禁售了……
這還隻是單片的售價!
按照chatgpt目前的體量,想要滿足chatgpt的需求,至少需要三萬到四萬片gpu……
而如果用戶規模進一步擴大,最終達成足以支撐全球用戶訪問的目標,那需要的gpu數量,起碼還得再提升一百倍,達到四百萬片以上……
如此規模的硬件使用,意味著每天光是電費的消耗,就能嚇的人心肌梗塞!
原本在搞清楚了相關大語言模型的成本需求後,鄭弘毅便已經打算放棄這個賽道的競爭了。
以三六五公司目前的狀況和對資金的吸引力來說,在這種如同資金黑洞一般的賽道裡,若是強行打算介入的話,那唯一的結果就是成為炮灰。
可偏偏……在他已經打算放棄的時候,他發現了‘無界維度’平台!
剛發現‘無界維度’平台時,鄭弘毅並沒有放在心上,隻以為是和許多小公司搞出來的平台一樣,屬於掛羊頭賣狗肉的東西。
但簡單的使用了下後,鄭弘毅便敏銳的察覺到,這‘無界維度’平台和他想的完全不同!