千萬不要為了節約成本而選擇小模型,特別是開源模型 原創
?“ 大模型和小模型是從功能上來區分的,而不是參數上 ”
我們在工作的過程中,應該多多少少都遇到過這樣的事情;那就是老板為了節省成本,然后找了一些不專業或者一些漏洞百出的工具給我們用;最后的結果就是成本沒節約下來,然后還出了一大堆亂七八糟的事。
這可真的是羊肉沒吃著,還惹了一身騷;成本沒節約,最后還耽誤時間,身心俱疲。
為什么不建議使用小模型?
首先聲明一下,這里的小模型不是指參數體量小的模型,是指功能太差,無法滿足業務場景的模型;更有甚者很多小企業老板會選擇一些開源模型,自己部署,就為了省錢。
但他們卻不知道,這里的“節省成本”并沒有真正節省成本,反而大大地增加了成本。
使用小模型會面臨著哪些問題?
使用小模型最大的問題就是,其性能不足,而且由于沒有專業的團隊維護,導致其會出現各種亂七八糟的問題。
以作者本人來說,公司最近的一個AIGC(AI生成內容)產品中,有一個文字生成視頻的功能,這也是大模型應用中比較常見的一個功能。
然后使用的就是社區里的一個開源模型,而這種開源模型只能自己來部署,因此還專門買了算力機去部署。
而關于大模型的部署與運維,在前面的文章中也提到過,復雜性和工作量就不用細說了,感興趣的可以查看文章??關于大模型在企業生產環境中的獨立部署問題??。
關于這個文字生成視頻的功能,說句實話,浪費了大量時間和精力開發的產品,效果真的是一言難盡;而且,這個模型使用的還不是傳統的類似sora這種真正的視頻生成模型,而更像是生成一張圖片,然后增加了動態的效果。
而且,不只是模型本身的效果問題,也是為了節約成本選擇的算力機并不是知名企業提供的算力,而是找的一個不知名企業的算力云機器,結果就是性能差的要死;跑在上面的服務經常莫名其妙的被殺掉,系統莫名其妙的重啟。
而這就間接導致了各種各樣的莫名其妙的問題,然后就需要浪費大量的時間和精力去排查;看到這里有些人可能會說,知道是算力機不穩定,肯定先查算力機啊?
但事實上問題出現的表象和算力機一點關系都沒有,甚至你會懷疑是不是自己代碼寫的有問題,亦或者是不是某個中間件出問題了。
而這種亂七八糟,奇奇怪怪的問題不但耽誤大量的時間和精力,最重要的是它會讓我們特別的煩躁;本來簡簡單單就能解決的問題,然后中間出現一堆莫名其妙的bug,耽誤進度,更影響心情。
最重要的一點是什么?
人的時間和精力都是有限的,當你把大量的時間和精力浪費在一些亂七八糟的事情之上后,你的核心業務就會受到影響。
首先,使用小模型帶來的各種各樣的問題,直接導致你本來有半年的時間開發核心功能,結果被奇奇怪怪的bug耽誤了一大半時間;然后核心功能可能就會被做的亂七八糟的,甚至是匆匆忙忙的上線。
然后,技術人員就不得不花大量的時間去四處救火,最后形成惡性循環。
在前面的文章中作者曾說過,大模型+小模型是現在企業開發的主流模式;這里說的大模型+小模型是指性能足夠的前提下,而不是說你隨便找一個根本無法滿足業務需求的模型,不但如此還要花費大量的時間去運維,這就更不值得了。
在基于大模型開發上層應用的過程中,除了大模型服務商之外,對絕大部分企業來說,使用第三方模型是最好的選擇。
一個穩定的模型能夠給你節省大量的時間和精力,這時你就有更多的時間把核心業務處理好,這也是為什么很多大企業會把一些非核心業務外包出去的原因之一。
?
本文轉載自公眾號AI探索時代 作者:DFires
