搜索引擎+GraphRAG+智能體,打造AI智能搜索
最近,人工智能領域涌現的新搜索引擎MindSearch正成為行業的新寵。這款開源的搜索引擎具備卓越的信息處理能力,能夠在幾分鐘內完成人類需要數小時才能做到的工作,充分展現出AI在信息檢索和整合方面的驚人潛力。
本文帶讀者了解MindSearch的核心特性,看其如何領先于競爭對手;同時,文章中還會提供指南,指導如何在本地搭建這款AI搜索引擎。
1 MindSearch簡介
MindSearch是由上海人工智能實驗室聯合研發團隊推出的開源AI搜索框架,擅長大規模信息的收集與整理。
借助InternLM2.5 7B對話模型,MindSearch能夠在短時間內從300多個網頁中提取關鍵信息,完成這項通常人類需要3小時的任務。
MindSearch采用多代理框架模擬人類思考過程,先規劃然后執行搜索,從而確保信息的精確度和全面性。
該項目完全開源,用戶可以免費體驗并進行本地部署。
2 MindSearch優勢
MindSearch由兩大核心組件構成:WebPlanner和WebSearcher。
WebPlanner將用戶問題細化為搜索任務,并智能規劃搜索路徑,整個過程通過圖結構呈現。WebSearcher則負責執行分層搜索,精準地收集所需信息。
MindSearch的獨到之處在于其高效的復雜問題處理和信息提取能力。借助多代理架構,它能在幾分鐘內完成人類三小時的工作量,確立了其在AI搜索領域的領先地位。
3 MindSearch更勝一籌
MindSearch之所以能超越ChatGPT和Perplexity.ai,關鍵在其模仿人類思維的多代理框架。
在實際應用中,MindSearch的性能表現十分出色。它能夠迅速從眾多網頁中搜集并整合信息,面對復雜的查詢任務,如“本季《王者榮耀》哪位射手表現最佳?”,它不僅分析賽季特點和射手性能指標,還能綜合多方數據,提供全面而精確的答案,效率遠超人類專家。在與ChatGPT-web和Perplexity的對比測試中,MindSearch的表現尤為突出。
4 本地部署MindSearch
步驟1:安裝依賴
- 打開終端或命令提示符,準備輸入安裝命令。
- 從GitHub克隆MindSearch倉庫,將所需文件下載到本地:
git clone https://github.com/InternLM/MindSearch
- 進入克隆后的MindSearch目錄:
cd MindSearch
- 安裝項目所需的Python包,倉庫中包含requirements.txt文件,列出了所有必需的包。運行以下命令進行安裝:
pip install -r requirements.txt
步驟2:設置MindSearch API
要啟動MindSearch API,需要運行一個Python模塊。命令有幾個選項:
- 使用--lang en參數設置模型語言為英語,若需使用中文,可將en改為cn。
- 通過--model_format參數指定模型格式,例如使用internlm_server來優化中文的InternLM2.5-7b-chat模型,或選擇gpt4來使用GPT-4模型。
接下來,啟動FastAPI服務器,根據配置調整命令參數:
- 對于開源模型,使用命令:
python -m mindsearch.app --lang en --model_format internlm_server
- 若要使用GPT-4模型,首先需要在項目文件中修改API模型配置,將'YOUR OPENAI API KEY'替換為你的OpenAI實際API密鑰:
gpt4 = dict(type=GPTAPI,
model_type='gpt-4-turbo',
key=os.environ.get('OPENAI_API_KEY', 'YOUR OPENAI API KEY'))
然后,確保啟動服務器的命令正確指向GPT-4模型格式:
python -m mindsearch.app --lang en --model_format gpt4
步驟3:搭建MindSearch前端界面
- 啟動Gradio界面
確保進入 Gradio 腳本所在的 MindSearch 項目根目錄,并在終端中使用以下命令啟動 Gradio 界面:
python frontend/mindsearch_gradio.py
- 運行Streamlit應用
使用以下命令運行 Streamlit 應用程序。 Streamlit 會自動在默認網絡瀏覽器中打開網絡應用程序.方便你進行操作和使用。
streamlit run frontend/mindsearch_streamlit.py
5 總結
MindSearch以其簡潔而強大的功能,為信息檢索和整合領域帶來了突破性的解決方案。它獨有的多代理框架,融合了大型語言模型的認知優勢和搜索引擎的數據廣度,使其在眾多現有工具中脫穎而出。
通過細化查詢、有效管理上下文信息以及實施分層檢索策略,MindSearch大幅提升了網絡信息檢索的精確性和全面性。它能夠迅速處理大量網頁數據,為用戶提供了快速而準確的信息獲取渠道,從而支持用戶做出更加明智的決策。
本文轉載自?? AI科技論談??,作者: AI科技論談
