作為近期作為大火的 AI 產(chǎn)品,Deepseek(簡(jiǎn)稱DS) 已經(jīng)成為現(xiàn)象級(jí)的爆款,朋友圈幾乎都被刷屏,大家都在探索將 DS 深入千行百業(yè),看如何能發(fā)揮出更大價(jià)值。作為數(shù)據(jù)庫(kù)從業(yè)者,我也在思考這個(gè)問(wèn)題,看 DS 能做點(diǎn)啥。圈里已經(jīng)有幾位朋友做了分享,我將從使用者的角度來(lái)談?wù)剬?duì) DS 的使用印象。這里我將DBA的工作簡(jiǎn)單分為三個(gè)方向(數(shù)據(jù)庫(kù)架構(gòu)、開發(fā)DBA、運(yùn)維DBA),每個(gè)方向提出若干場(chǎng)景,看看它的表現(xiàn)如何。
1. DeepSeek 是什么及如何用好
在我們開始之前,先看看什么是DeepSeek,這里部分引用來(lái)自清華大學(xué)的一篇DS入門文章《DeepSeek:從入門到精通》中的內(nèi)容。
1).DeepSeek 是什么
DeepSeek是一家專注通用人工智能(AGI)的中國(guó)科技公司,主攻大模型研發(fā)與應(yīng)用。其主要產(chǎn)品DeepSeek-R1,是其開源的推理模型,擅長(zhǎng)處理復(fù)雜任務(wù)且可免費(fèi)商用。在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升模型推理能力在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上表現(xiàn)出色。其面向用戶或開發(fā)者,提供包括智能對(duì)話、文本生成、語(yǔ)義理解、計(jì)算推理、代碼生成補(bǔ)全等應(yīng)用場(chǎng)景,并支持聯(lián)網(wǎng)搜索與深度思考模式;同時(shí)支持文件上傳,能夠讀取各類文件及圖片中的文字內(nèi)容。
2).如何用好DeepSeek
DS 功能很強(qiáng)大,那么如何用好它呢?網(wǎng)上可以搜到很多教程,這里重點(diǎn)推薦使用優(yōu)化提示詞的方式來(lái)解決。提示詞,是根據(jù)你輸入給模型的問(wèn)題或指令,為了讓 DS 更好地理解你的需求并給出滿意的發(fā)福,可以有一些技巧。這里推薦使用“四步提問(wèn)法”,來(lái)設(shè)計(jì)好你的提示詞。
在這一公式中,通過(guò)讓 DS 扮演特定的角色,輔助以提供上下文信息;明確你的問(wèn)題或任務(wù),并引導(dǎo) DS 需考慮的問(wèn)題;最終設(shè)定回答形式。
2. DeepSeek 在數(shù)據(jù)庫(kù)方向應(yīng)用
1).面向數(shù)據(jù)庫(kù)架構(gòu)
作為數(shù)據(jù)庫(kù)架構(gòu)師,經(jīng)常會(huì)面臨架構(gòu)選型、方案對(duì)比、難點(diǎn)攻關(guān)等工作。這里選擇了兩個(gè)常見的場(chǎng)景,一是對(duì)技術(shù)路線對(duì)比分析;二是針對(duì)數(shù)據(jù)庫(kù)選型的一個(gè)場(chǎng)景。問(wèn)題通過(guò)一個(gè)實(shí)際場(chǎng)景為出發(fā)點(diǎn),考察 DS 對(duì)場(chǎng)景理解及對(duì)技術(shù)本身的了解程度。
Q:問(wèn)題
作為一名數(shù)據(jù)庫(kù)架構(gòu)師,你所負(fù)責(zé)的ERP系統(tǒng)數(shù)據(jù)規(guī)模越來(lái)越大,你考慮將數(shù)據(jù)進(jìn)行拆分。在技術(shù)路線上可選擇分庫(kù)分表的中間件路線或原生分布式數(shù)據(jù)庫(kù)的方向。在綜合考慮研發(fā)、運(yùn)維、成本等方面的多種因素,如何做出設(shè)計(jì)?請(qǐng)根據(jù)上述問(wèn)題,通過(guò)表格形式描述選擇過(guò)程,并給出最終結(jié)論?
Q:問(wèn)題
作為數(shù)據(jù)庫(kù)架構(gòu)師,你需要為企業(yè)的CRM系統(tǒng)做數(shù)據(jù)庫(kù)改造選型。目前國(guó)產(chǎn)數(shù)據(jù)庫(kù)有很多,請(qǐng)從通過(guò)國(guó)測(cè)的信創(chuàng)數(shù)據(jù)庫(kù)中,選擇一款分布式數(shù)據(jù)庫(kù),并給出選擇理由。需包含針對(duì)其他分布式數(shù)據(jù)庫(kù)的對(duì)比情況,通過(guò)表格形式呈現(xiàn)。
從 DS 的問(wèn)題回答來(lái)看,無(wú)論是從廣度和深度,DS 較真正的數(shù)據(jù)庫(kù)架構(gòu)師還有較大的距離,其對(duì)業(yè)務(wù)理解能力及對(duì)發(fā)散架構(gòu)問(wèn)題的收斂、歸納能力尚不足以承擔(dān)這一能力。其輸出內(nèi)容,可作為部分參考來(lái)使用。
2).面向數(shù)據(jù)庫(kù)開發(fā)
開發(fā)DBA,是DBA日常面臨的最為繁重的工作,主要是來(lái)支持研發(fā)人員的各類數(shù)據(jù)庫(kù)開發(fā)訴求,包括但不限于設(shè)計(jì)、優(yōu)化、部分開發(fā)等等。這里選擇兩個(gè)場(chǎng)景,一是針對(duì)執(zhí)行計(jì)劃的解讀及優(yōu)化;二是針對(duì)數(shù)據(jù)庫(kù)內(nèi)計(jì)算邏輯的開發(fā)能力。
Q:問(wèn)題
下面是Oracle數(shù)據(jù)庫(kù)的一段執(zhí)行計(jì)劃,請(qǐng)幫我描述整個(gè)執(zhí)行過(guò)程,并給出優(yōu)化建議?
SQL> explain plan for select * from emp where emp_id=111;
SQL> select * from table(dbms_xplan.display);
---
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
---
| 0 | SELECT STATEMENT | | 1 | 28 | 2 (0)| 00:00:01 |
| 1 | TABLE ACCESS BY INDEX ROWID| EMP | 1 | 28 | 2 (0)| 00:00:01 |
|* 2 | INDEX UNIQUE SCAN | EMP_PK | 1 | | 1 (0)| 00:00:01 |
4.png
Q:問(wèn)題
要實(shí)現(xiàn)對(duì)一張Oracle數(shù)據(jù)庫(kù)的t1表的state字段更新為1,這張表規(guī)模在1億條,更新時(shí)需盡量減少表的鎖定時(shí)間,考慮使用批量綁定技術(shù)來(lái)完成。具體表的結(jié)構(gòu)如下:
create table t1( id int primary key,state int);
這部分 DS 的回答還是驚艷到我了,在針對(duì)具體問(wèn)題的分析上,DS 的表現(xiàn)明顯優(yōu)于上面抽象歸納總結(jié)能力。通過(guò)其輸出內(nèi)容,很多原來(lái)需要DBA介入解決的問(wèn)題,完全可以通過(guò)研發(fā)人員自己來(lái)解決。這些能力完全可以通過(guò)SQL IDE集成,方便并加速研發(fā)人員更快、更好地進(jìn)行開發(fā)工作。
3).面向數(shù)據(jù)庫(kù)運(yùn)維
運(yùn)維DBA,主要是為企業(yè)數(shù)據(jù)庫(kù)平穩(wěn)運(yùn)行保駕護(hù)航的,這是一個(gè)比較考驗(yàn)經(jīng)驗(yàn)的崗位,很多老DBA正是憑借多年豐富經(jīng)驗(yàn),可以快速定位、解決問(wèn)題,也正是DBA的價(jià)值所在。這里選取了兩個(gè)場(chǎng)景,一是在線DDL變更問(wèn)題;二是運(yùn)維腳本的開發(fā)工作。
Q:問(wèn)題
作為一名DBA,需要針對(duì)線上生產(chǎn)環(huán)境的一張表增加字段,需要注意避免對(duì)業(yè)務(wù)造成影響,應(yīng)該注意哪些問(wèn)題,通過(guò)表格的形式反饋?
Q:問(wèn)題
請(qǐng)使用shell腳本,編寫一段程序,實(shí)現(xiàn)備份MySQL數(shù)據(jù)庫(kù),需包含全量備份、增量備份部分?
2.png
從 DS 的回答來(lái)看,其對(duì)數(shù)據(jù)庫(kù)的理解達(dá)到了一定程度但較資深DBA尚有差距。針對(duì)問(wèn)題,其會(huì)考慮方方面面的影響,這也是 DS 推理能力的強(qiáng)點(diǎn);但對(duì)于技術(shù)本身理解程度尚有不足。在腳本開發(fā)中,其表現(xiàn)明顯較好,會(huì)考慮諸多問(wèn)題及解決。
3. DeepSeek 對(duì)個(gè)人、廠商及企業(yè)影響
DeepSeek 的出現(xiàn),確實(shí)大大加速 AI 的應(yīng)用,對(duì)行業(yè)、企業(yè)及個(gè)人都會(huì)帶來(lái)深遠(yuǎn)的影響。下面談?wù)勎业睦斫?/p>
1).對(duì)個(gè)人的影響
通過(guò)上面的示例,可以看到 DS 確實(shí)能夠起到一定作用,比較而言,對(duì)DBA的影響是“開發(fā)DBA>運(yùn)維DBA>數(shù)據(jù)庫(kù)架構(gòu)師”。針對(duì)越明確、越具體的問(wèn)題,DS 的表現(xiàn)越好;而對(duì)于需要理解業(yè)務(wù)、綜合分析的問(wèn)題,DS 的不足明顯。這也對(duì)DBA的發(fā)展提出了更高的要求,一方面需要擴(kuò)大知識(shí)范圍,將知識(shí)體系化;另一方面需要加深對(duì)所處行業(yè)的理解,提高將業(yè)務(wù)與技術(shù)有效集合起來(lái)的能力。
2).對(duì)廠商的影響
對(duì)廣大數(shù)據(jù)庫(kù)廠商而言,DS 的出現(xiàn)在改變DBA部分工作方式的同時(shí),也會(huì)對(duì)產(chǎn)品功能及生態(tài)構(gòu)建帶來(lái)影響。一方面,將AI能力與數(shù)據(jù)庫(kù)相結(jié)合,提供內(nèi)置的AI支持能力及AI輔助能力,即AI4DB、DB4AI兩個(gè)方向;另一方面,針對(duì)國(guó)產(chǎn)數(shù)據(jù)庫(kù)生態(tài)構(gòu)建較晚的現(xiàn)狀,也可以充分利用AI能力實(shí)現(xiàn)“彎道超車”,通過(guò)AI的方式降低數(shù)據(jù)庫(kù)使用門檻,擴(kuò)大生態(tài)效應(yīng)。
3).對(duì)企業(yè)的影響
對(duì)于數(shù)據(jù)庫(kù)最終用戶的企業(yè)來(lái)說(shuō),可充分評(píng)估AI帶來(lái)的能力,調(diào)整IT資源布局。充分利用AI、云等技術(shù)重塑底層技術(shù)棧。針對(duì)人員方面,也可有意識(shí)地引導(dǎo)更多向業(yè)務(wù)方向、數(shù)據(jù)方向傾斜,更多挖掘出數(shù)據(jù)的業(yè)務(wù)價(jià)值。