千萬不要為了節約成本而選擇小模型，特別是開源模型原創

AI探索時代

發布于 2024-10-18 15:30

瀏覽

0收藏

?“ 大模型和小模型是從功能上來區分的，而不是參數上 ”

我們在工作的過程中，應該多多少少都遇到過這樣的事情；那就是老板為了節省成本，然后找了一些不專業或者一些漏洞百出的工具給我們用；最后的結果就是成本沒節約下來，然后還出了一大堆亂七八糟的事。

這可真的是羊肉沒吃著，還惹了一身騷；成本沒節約，最后還耽誤時間，身心俱疲。

為什么不建議使用小模型？

首先聲明一下，這里的小模型不是指參數體量小的模型，是指功能太差，無法滿足業務場景的模型；更有甚者很多小企業老板會選擇一些開源模型，自己部署，就為了省錢。

但他們卻不知道，這里的“節省成本”并沒有真正節省成本，反而大大地增加了成本。

使用小模型會面臨著哪些問題？

使用小模型最大的問題就是，其性能不足，而且由于沒有專業的團隊維護，導致其會出現各種亂七八糟的問題。

以作者本人來說，公司最近的一個AIGC(AI生成內容)產品中，有一個文字生成視頻的功能，這也是大模型應用中比較常見的一個功能。

千萬不要為了節約成本而選擇小模型，特別是開源模型-AI.x社區

然后使用的就是社區里的一個開源模型，而這種開源模型只能自己來部署，因此還專門買了算力機去部署。

而關于大模型的部署與運維，在前面的文章中也提到過，復雜性和工作量就不用細說了，感興趣的可以查看文章??關于大模型在企業生產環境中的獨立部署問題??。

關于這個文字生成視頻的功能，說句實話，浪費了大量時間和精力開發的產品，效果真的是一言難盡；而且，這個模型使用的還不是傳統的類似sora這種真正的視頻生成模型，而更像是生成一張圖片，然后增加了動態的效果。

而且，不只是模型本身的效果問題，也是為了節約成本選擇的算力機并不是知名企業提供的算力，而是找的一個不知名企業的算力云機器，結果就是性能差的要死；跑在上面的服務經常莫名其妙的被殺掉，系統莫名其妙的重啟。

而這就間接導致了各種各樣的莫名其妙的問題，然后就需要浪費大量的時間和精力去排查；看到這里有些人可能會說，知道是算力機不穩定，肯定先查算力機啊？

但事實上問題出現的表象和算力機一點關系都沒有，甚至你會懷疑是不是自己代碼寫的有問題，亦或者是不是某個中間件出問題了。

而這種亂七八糟，奇奇怪怪的問題不但耽誤大量的時間和精力，最重要的是它會讓我們特別的煩躁；本來簡簡單單就能解決的問題，然后中間出現一堆莫名其妙的bug，耽誤進度，更影響心情。

最重要的一點是什么？

人的時間和精力都是有限的，當你把大量的時間和精力浪費在一些亂七八糟的事情之上后，你的核心業務就會受到影響。

千萬不要為了節約成本而選擇小模型，特別是開源模型-AI.x社區

首先，使用小模型帶來的各種各樣的問題，直接導致你本來有半年的時間開發核心功能，結果被奇奇怪怪的bug耽誤了一大半時間；然后核心功能可能就會被做的亂七八糟的，甚至是匆匆忙忙的上線。

然后，技術人員就不得不花大量的時間去四處救火，最后形成惡性循環。

在前面的文章中作者曾說過，大模型+小模型是現在企業開發的主流模式；這里說的大模型+小模型是指性能足夠的前提下，而不是說你隨便找一個根本無法滿足業務需求的模型，不但如此還要花費大量的時間去運維，這就更不值得了。

在基于大模型開發上層應用的過程中，除了大模型服務商之外，對絕大部分企業來說，使用第三方模型是最好的選擇。

一個穩定的模型能夠給你節省大量的時間和精力，這時你就有更多的時間把核心業務處理好，這也是為什么很多大企業會把一些非核心業務外包出去的原因之一。

本文轉載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/HSeDfYq5Va3efsce7JbGPw???

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

模型

開源模型

贊

回復

舉報

回復

相關推薦

大模型應用落地：如何選擇合適的 Embedding 模型？

玄姐聊AGI ? 5172瀏覽 ? 0回復
小模型和開源正在成為AI發展的變數

51CTO技術棧 ? 2340瀏覽 ? 0回復
大模型 VS 小模型

NLP工作站 ? 3424瀏覽 ? 0回復
不要沉迷大模型的技術與理論，學習大模型的方法——從做一個小應用開始

AI探索時代 ? 2884瀏覽 ? 0回復
小扎深夜炸場！Meta首個開源多模態模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點來了！

51CTO技術棧 ? 3461瀏覽 ? 0回復
不要上來就大模型，從訓練一個小模型開始

AI探索時代 ? 2943瀏覽 ? 0回復
AI界的"小而美"：Mistral AI的最新力作如何重新定義邊緣計算 | 多智能體協作讓大語言模型訓練效率暴增

sbf_2000 ? 2642瀏覽 ? 0回復
QVQ-72B，如期而至！繼QWQ后，通義千問又開源視覺推理大模型！

NLP工作站 ? 2787瀏覽 ? 0回復
為啥強化學習開始成為了大語言模型（LLM）的新寵？

智駐未來 ? 2983瀏覽 ? 0回復
大模型之嵌入與向量化的區別是什么？

AI探索時代 ? 2494瀏覽 ? 0回復
微軟開源最強小模型Phi-4，超GPT-4o、可商用

Aceryt ? 2463瀏覽 ? 0回復
微軟開源小模型Phi系列：技術演進、能力突破與未來展望

上堵吟1 ? 3413瀏覽 ? 0回復
選擇哪個Batchsize對模型效果最好？

石映飛云 ? 2027瀏覽 ? 0回復
開源版o1！中國大模型讓國外陷入瘋狂，成本猛降90%

Aceryt ? 3311瀏覽 ? 0回復
小而美！1B模型如何通過測試時優化逆襲405B LLM？

arnoldzhw ? 2259瀏覽 ? 0回復
DeepSeek 模型架構的特殊選擇

amei2000go ? 2052瀏覽 ? 0回復
為了狙擊Manus，OpenAI開源了首個Agent SDK

Halo咯咯 ? 2889瀏覽 ? 0回復
AMD開源30億小參數模型，媲美Qwen-2.5

Aceryt ? 1691瀏覽 ? 0回復
千億模型做不到的事，7B小模型實現了？阿里這次開源有點狠！

蜂耘網iphoneyun ? 1930瀏覽 ? 0回復

AI探索時代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

千萬不要為了節約成本而選擇小模型，特別是開源模型原創

為什么不建議使用小模型？

目錄

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

千萬不要為了節約成本而選擇小模型，特別是開源模型 原創

為什么不建議使用小模型？

目錄

千萬不要為了節約成本而選擇小模型，特別是開源模型原創