通過(guò)SQL Server數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn)對(duì)上傳文件的全文檢索
此文主要向大家描述的是正確通過(guò)SQL Server數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn)對(duì)上傳文件的全文檢索的實(shí)際操作方案,以及對(duì)其實(shí)際操作過(guò)程中值得我們大家注意的相關(guān)事項(xiàng)的具體描述,望你在瀏覽之后會(huì)有收獲。
由于工作需要,需要對(duì)上傳的文件內(nèi)容進(jìn)行查詢(xún)。通過(guò)MSDN了解到Windows索引服務(wù)可以實(shí)現(xiàn)對(duì)文件的全文檢索,并可以通過(guò)SQL Server數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)。本文將兩者結(jié)合后實(shí)現(xiàn)對(duì)上傳文件的全文檢索。
方案描述:
1.改變文件存儲(chǔ)時(shí)的文件名
2.配置索引服務(wù)器,并將索引服務(wù)器與MS SQL Server數(shù)據(jù)庫(kù)關(guān)聯(lián)。
3.修改SQL語(yǔ)句,將進(jìn)行全文查詢(xún)語(yǔ)句的內(nèi)容加入查詢(xún)條件中
文件的存儲(chǔ)方式:
為了方便存儲(chǔ)以及方便索引,我們將上傳的文件存儲(chǔ)到一個(gè)目錄里面,為了保證上傳的文件名不重復(fù),采用GUID作為文件名,并且通過(guò)這個(gè)GUID于數(shù)據(jù)庫(kù)記錄相關(guān)聯(lián)。同時(shí),文件的后綴還保持原始文件的后綴,讓索引服務(wù)能夠識(shí)別該文檔。
配置索引服務(wù)
進(jìn)入計(jì)算機(jī)管理(Computer Management)程序(右鍵”我的電腦”->”管理”),并找到索引服務(wù)(Index Service)
配置索引服務(wù)的功能
(1)右鍵選擇索引服務(wù)彈出一個(gè)菜單
(2)選擇New->Catalog(新建一個(gè)編錄)
設(shè)置新增加的編錄
(1)輸入編錄的名字(這個(gè)名字需要與數(shù)據(jù)庫(kù)進(jìn)行關(guān)聯(lián),要注意命名,這里假設(shè)DCSII
(2)點(diǎn)Browse進(jìn)入選擇索引服務(wù)運(yùn)行目錄窗體
(3)選擇前面創(chuàng)建的索引運(yùn)行目錄(任意地方)
(4)點(diǎn)確定完成本次操作
在編錄創(chuàng)建號(hào)以后,需要給編錄增加目錄
(1)右鍵選擇剛剛創(chuàng)建的編錄
(2)選擇New->Directory(新建目錄)
新建索引目錄
(1)點(diǎn)擊Browse進(jìn)入目錄選擇頁(yè)面
(2)選擇要進(jìn)行全文檢索文件的目錄
(3)確定完成本次操作
完成創(chuàng)建后啟動(dòng)索引服務(wù)
(1)啟動(dòng)索引服務(wù)
(2)索引服務(wù)啟動(dòng)成功后索引編錄的信息,可以看到編錄信息就表示服務(wù)已經(jīng)啟動(dòng)成功。
將索引服務(wù)和SQL數(shù)據(jù)庫(kù)關(guān)聯(lián):
在SQL 查詢(xún)分析器(SQL Query Analyer)里執(zhí)行下面的存儲(chǔ)過(guò)程
EXEC sp_addlinkedserver Dcs, — 連接服務(wù)器的名字,到后面查詢(xún)的時(shí)候要用到
’Index Server’,
’MSIDXS’,
’DCSII’ — 索引服務(wù)里新建的編錄名字
索引服務(wù)的性能調(diào)整方法1
(1)右鍵選擇索引服務(wù)
(2)選擇 All Tasks-> Tune Perrformance
(3)選擇用戶(hù)自定義
(4)點(diǎn)擊Customize進(jìn)入性能調(diào)整窗體
(5)將Index和Querying的屬性移動(dòng)到最右邊
(6)點(diǎn)確定完成操作
性能調(diào)整方法2
如果服務(wù)器不需要對(duì)整個(gè)系統(tǒng)的文件進(jìn)行索引,可以停止或者刪除System編錄。
MS SQL對(duì)索引服務(wù)器的調(diào)用
1.通過(guò)sql語(yǔ)句查詢(xún)連接服務(wù)器的內(nèi)容
SELECT Q.*
FROM OpenQuery(dcs, –連接服務(wù)器名字
’SELECT FileName, Size, DocAuthor, path –在連接服務(wù)器里的sql語(yǔ)句
FROM SCOPE()
WHERE CONTAINS(”番號(hào) and abc”) ‘
) AS Q
2.因?yàn)镾QL語(yǔ)句不支持動(dòng)態(tài)輸入的字符串,因此查詢(xún)字符串只好在C#代碼里來(lái)進(jìn)行拼接
其它解決方法:
在SQL Server 2000數(shù)據(jù)庫(kù)里按全文搜索功能,用image字段存儲(chǔ)文件內(nèi)容,并新增一個(gè)字段存放文件類(lèi)型,然后在通過(guò)企業(yè)管理器新建全文索引項(xiàng)的時(shí)候?qū)⑦@兩個(gè)字段匹配就可以。不過(guò)從數(shù)據(jù)庫(kù)的/率以及今后數(shù)據(jù)庫(kù)備份和恢復(fù)的效率上來(lái)看,將文件放在數(shù)據(jù)庫(kù)的設(shè)計(jì)略顯不足。
上述的相關(guān)內(nèi)容就是對(duì)通過(guò)SQL Server數(shù)據(jù)庫(kù)實(shí)現(xiàn)對(duì)上傳文件的全文檢索的描述,希望會(huì)給你帶來(lái)一些幫助在此方面。
【編輯推薦】