成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

使用CloudSearch 五步搞定云中文檔搜索

云計算
在本文中, Judith Myerson介紹了使用亞馬遜CloudSearch來創(chuàng)建搜索索引的五個必須步驟,而CloudSearch正是這樣一個為云計算中文檔創(chuàng)建搜索索引的有用工具。

亞馬遜CloudSearch是一個為云計算中文檔創(chuàng)建搜索索引的有用工具。這項服務是基于使用文檔現(xiàn)有屬性項的,它可允許開發(fā)人員新增新的屬性項以便于對搜索索引進行微調。

這里,我選擇了一個LibreOffice Writer文檔以用于說明如何使用CloudSearch來創(chuàng)建搜索索引和修復問題。出于演示的目的,我所選的文檔較小,這樣就可確保創(chuàng)建索引成本更低。

創(chuàng)建搜索索引共需五個步驟:準備文檔、啟動亞馬遜CloudSearch、定位索引字段源、增加索引字段以及運行測試搜索。如果測試結果是成功的,那么你就可以使用相同的索引來搜索其他的LibreOffice文檔。

步驟1:準備一個樣本文檔

  • 選中File標簽,選擇Properties。
  •  在General Properties標簽中,確保選中Apply the user data多選框。
  • 在Tools標簽下的Options,在LibreOffice User Data文本框中輸入你的名字。
  • 選中Use Data for document properties多選框。
  • 點擊OK。
  • 在Edit標簽下,打開Record Changes。
  • 進行必要的編輯。
  •  以LibreOffice Writer的格式(.odt)保存文檔文件,然后以微軟的Word格式(.doc 或 .docx)保存。因為CloudSearch并不會接受LibreOffice Writer (.odt)格式的文檔文件。

步驟2:啟動CloudSearch

  • 登錄到AWS的管理控制臺。
  • 選擇CloudSearch。 在相關區(qū)域選擇激活域。
  • 點擊Upload Documents。
  • 選擇 File(s) on my local disk并點擊 Browse 選中你需要上傳的樣本文件。
  • 點擊Continue。

在CloudSearch分析樣本文檔之后,相關界面會顯示索引字段的一個列表:

  • application_name
  • author
  • content
  • content_type
  • creation_date
  • creator
  • date
  • language
  • last_author
  • last_modified
  • last_printed
  • resourcename
  • revision_number
  • total_time

上述列表中的斜體標記表示并沒有針對域進行配置。只有解決了這一問題,你才能繼續(xù)下一步。

點擊Cancel。

步驟3:定位正確配置的索引字段源

  • 在Help標簽下選擇About LibreOffice以獲得application_name 字段的源。
  • 在Tools標簽的Options中選擇Language Settings以獲得Language字段的源。英語(美國)是默認選項。
  • 在File標簽的Properties中選擇General Properties以獲得以下表格中字段的源。

在向域配置新增索引字段之前,你可以確定是刪除還是保留這些字段。

步驟4:新增索引字段

  • 登錄CloudSearch,打開相關界面。
  • 選擇一個激活域名。
  • 選擇Indexing Options。
  • 每次對下述每一個字段點擊Add Index Field。

注:在默認情況下,CloudSearch將把每個字段自動設置為可搜索。

  • 點擊Submit。
  • 點擊Run indexing,重新編制索引。
  • 點擊OK開始編制索引。一般來說,編制和部署小型索引文件只需花費數(shù)分鐘時間,而編制和部署大型索引文件則可能需要花費數(shù)個小時之久。索引文件越小,重建搜索索引文件的成本就越低。

步驟5:提交搜索請求

  • 選擇Dashboard。
  • 從S3 buckets或你的本地文件系統(tǒng)中選擇待上傳文件,并點擊Upload Documents。
  • 點擊Run a Test Search。
  • 在Search框內輸入一個單詞。例如,“vulnerability”。
  • 點擊Go,CloudSearch就會以文檔相關度分數(shù)降序的次序列出索引字段。

注:文檔相關度得分是根據(jù)文檔中搜索詞出現(xiàn)次數(shù)與整個域中所有文檔中搜索詞出現(xiàn)次數(shù)的比值而得到的。在本文的示例中,我們使用了一個文檔。

以下是一個文檔的結果:

該文檔相關度得分為0.5532488。搜索詞被發(fā)現(xiàn)一次。

創(chuàng)建者和作者是Judith。

***的作者是Judith。

該文檔被修改過六次。

語言默認為美國英語(en-US)。

創(chuàng)建者和作者是Judith。

創(chuàng)建時間為2014年6月20日10:08:15。

內容是:生物漏洞評估變更。

修改日期為12:57:38。

內容類型為application/vnd.openxmlformats(Word docx)。

資源名稱Biometric vulnerability assessment.docx。

總之,對一個小文件運行測試搜索可確保處理成本較低。如果測試結果是成功的,那么你就可以使用相同的索引來對大量的文檔進行搜索。

原文鏈接:http://www.searchcloudcomputing.com.cn/showcontent_88060.htm

責任編輯:Ophira 來源: TechTarget中國
相關推薦

2009-08-11 09:47:01

Spring整合Str

2017-08-22 18:34:24

WinLicense軟件授權

2012-04-13 16:21:47

亞馬遜云計算CloudSerach

2025-05-14 07:06:36

2025-01-07 08:55:54

2009-08-18 14:15:12

2016-09-09 01:07:06

數(shù)據(jù)中心容量規(guī)劃數(shù)據(jù)中心

2014-08-11 10:10:39

linux

2021-07-26 09:35:26

SQL數(shù)據(jù)庫優(yōu)化

2023-09-18 14:39:02

2017-06-01 12:30:59

SQL云計算云端

2011-07-26 10:18:53

2022-02-12 11:00:33

FTP網絡協(xié)議文件傳輸

2017-01-06 08:47:53

2017-09-27 11:00:50

LinuxBash使用技巧

2009-12-11 13:31:31

策略路由配置

2021-09-14 10:25:12

云計算云計算環(huán)境云安全

2009-11-05 10:01:26

Visual Stud

2024-08-19 14:04:00

2016-08-10 09:29:11

云計算
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品亚洲国产成av人片传媒 | 国产在线对白 | 久久久久久久久久久成人 | 伦理午夜电影免费观看 | 欧洲国产精品视频 | 一区二区在线观看免费视频 | 丝袜天堂 | 中文字幕亚洲一区 | 免费观看黄 | 日韩手机在线视频 | 99精品一区 | 性色的免费视频 | 国产精品久久在线 | 欧美在线视频观看 | 91精品国产欧美一区二区成人 | 欧美在线视频一区二区 | 最新国产视频 | 激情毛片 | 亚洲电影专区 | 亚洲色图婷婷 | 国产一卡二卡三卡 | 国产精品不卡一区 | 另类a v| 国产9999精品 | h在线免费观看 | 亚洲在线免费观看 | 一级黄色片网站 | 天堂精品 | 久久r精品 | 久久r精品 | 99久久亚洲 | 欧美一区视频 | 日日骚网 | 四虎永久免费在线 | 91在线视频精品 | 久久最新 | 九九热精品视频在线观看 | 国产欧美在线 | 国产欧美精品一区二区色综合 | 中文字幕av亚洲精品一部二部 | 亚洲人成一区二区三区性色 |