今天瀏覽Dify的GitHub倉庫時,發現版本已經更新到1.5.1了,這個版本最令人驚喜的升級就是大幅增強了工作流調試功能。過去調試工作流時,只能在"預覽"模式下查看執行結果。一旦刷新頁面或回退操作,就只能看到最終輸出,完全看不到中間的執行過程。這意味著稍有不慎就要重復運行整個流程,往往需要調試好幾遍才能定位問題。更麻煩的是,每次調試特定節點時,還需要手動準備各種變量數據。特別是遇到復雜的嵌套結構變量時,稍不注...
在目前AI市場上,RAG技術已經成為大語言模型應用的重要組成部分,而GraphRAG作為RAG的進化版本,通過引入圖結構來處理復雜的知識關系,正在受到越來越多的關注。但面對市面上眾多的GraphRAG變種,我們該如何選擇最適合自己應用場景的方案呢?最近,一項名為GraphRAGBench的評估研究為我們提供了答案。它系統性地評估了總共九種主流GraphRAG方法,包括RAPTOR、LightRAG、GraphRAG、GRetriever、HippoRAG、GFMRAG、DALK、KGP和ToG...
現在各種工作流框架太多了,看不過來,也沒有什么精力去學習。最近無意中刷到一個微型框架:PocketFlow,這個框架非常小巧,看了下只有100行左右的代碼,很容易看懂。我非常喜歡,寫個教程介紹一下。對比其他框架抽象應用特定包裝器供應商特定包裝器代碼行數大小LangChainAgent,Chain很多(例如,QA,摘要)很多(例如,OpenAI,Pinecone等)405K+166MBCrewAIAgent,Chain很多(例如,FileReadTool,SerperDevTool)很多(例如,OpenAI,Ant...
目前團隊研發已全面采用Cursor作為主力工具。雖然ClaudeCode和ArgumentCode在功能上更勝一籌,但考慮到成本因素和網絡問題,Cursor仍是我們的首選。然而我們發現,盡管使用相同的工具,團隊成員的工作效率和體驗卻存在顯著差異——關鍵在于對Cursor的掌握程度。本文將分享日常工作中的最佳實踐,幫助大家充分發揮Cursor的潛力。cursor開發全流程要讓Cursor充分發揮其潛力,達到我們的預期效果,需要系統性地結合以下四個關鍵要...
特定領域的QA系統不僅需要生成流暢的回答,還需確保基于專業知識的高事實準確性。盡管檢索增強生成(RAG)框架改進了上下文調用能力,但在異構數據整合與推理一致性方面仍存在不足。為此,清華大學提出DORAG,一種可擴展、可定制的混合QA框架,融合多級知識圖譜構建與語義向量檢索技術。DORAG采用創新的AgenticCoT架構,從多模態文檔中提取結構化關系,構建動態知識圖譜以提升檢索精度。在查詢階段,它結合圖譜與向量檢索結果生...
在早年閱讀網上的技術博客時,我習慣一邊看文章一邊在語雀筆記中畫思維導圖。然而,回過頭來看,這種方式其實效率不高。有了AI后,我們可以先讓AI為我們生成相應的思維導圖,以便我們對知識有個初步認識,再去深入閱讀文章,這樣會更有效。在這篇文章中,我將分享如何使用dify自動生成文章的思維導圖,以提高我們吸收知識的速度。安裝插件先在dify的插件市場安裝如下兩個插件:Markdown轉換器:用于生成html文件Agent策略插件:...
2025-06-23 06:43:10 1049瀏覽 0點贊 0回復 0收藏
在基于大模型的Agent中,長期記憶的狀態維護至關重要,在OpenAIAI應用研究主管LilianWeng的博客《基于大模型的Agent構成》中,將記憶視為關鍵的組件之一,下面我將結合LangChain中的代碼,分享7種不同的Agent記憶維護方式在不同場景中的應用。獲取全量歷史對話在電信公司的客服聊天機器人場景中,如果用戶在對話中先是詢問了賬單問題,接著又談到了網絡連接問題,ConversationBufferMemory可以用來記住整個與用戶的對話歷史,可...
2025-06-20 06:40:03 829瀏覽 0點贊 0回復 0收藏
2025年6月17日,谷歌正式宣布其Gemini2.5混合推理模型家族迎來重大更新,包括Gemini2.5Pro、Gemini2.5Flash以及全新輕量級模型Gemini2.5FlashLite。這一系列升級不僅強化了AI的推理能力,還在性能、成本與適用場景上進行了深度優化,標志著谷歌在多模態AI領域的進一步突破。Gemini2.5FlashLite基準測試表Gemini2.5Pro:復雜推理任務的終極選擇作為谷歌AI技術的旗艦產品,Gemini2.5Pro在多項基準測試中表現卓越,甚至超越OpenAI...
2025-06-19 08:20:03 2277瀏覽 0點贊 0回復 0收藏
Claude現在擁有研究功能[1],可以在網絡、GoogleWorkspace和任何集成中進行搜索,以完成復雜的任務。這個多智能體系統從原型到生產的旅程教會了我們關于系統架構,工具設計和prompt工程的關鍵教訓。多代理系統由多個代理(LLMs在循環中自主使用工具)組成。我們的研究功能涉及一個代理,它根據用戶查詢計劃研究過程,然后使用工具創建同時搜索信息的并行代理。具有多個代理的系統在代理協調、評估和可靠性方面引入了新的挑戰。...
2025-06-19 08:19:46 1006瀏覽 0點贊 0回復 0收藏
背景在我們之前的文章中,我們對比了dify,ragflow和n8n這三個工具的使用場景及其差異。實際上,在企業中,這些工具通常會被結合起來使用,以便充分發揮各自的優勢。例如,盡管ragflow也具備一些智能功能,但是與dify相比,它在這方面的表現力還有待提高。然而,當談到解析和檢索的能力時,ragflow卻顯著超過了dify。在今天的文章中,我們將探討如何有效地將這兩個工具結合使用。RAGFlow核心功能我覺得RAGflow最大的一個亮點就...
2025-06-18 06:37:25 1722瀏覽 0點贊 0回復 0收藏
背景在當今AI應用蓬勃發展的時代,內容安全與合規性已成為開發者不可忽視的重要環節。比如用戶在客服場景中,可以通過敏感詞審查過濾用戶的辱罵性語言,并返回預設的禮貌回復。Dify作為一款開源的大語言模型應用開發平臺,其內置的敏感詞審查機制為開發者提供了強大的內容安全保障。本文將深入解析Dify的敏感詞審查模塊(moderation)的工作原理,并通過源碼分析揭示其實現細節,幫助開發者更好地理解和應用這一功能。dify如何開...
2025-06-13 09:36:45 1117瀏覽 0點贊 0回復 0收藏
在AI技術高速發展的當下,企業想要高效、安全且低成本地落地AI應用,開源工具成為了重要選擇。以下為你詳細介紹Dify、RAGFlow、n8n這三款開源工具的核心能力、應用場景及優勢,助你理清企業AI落地的實踐路徑。dify作為"AI應用操作系統",Dify旨在為企業提供從開發到運營的一站式生成式AI解決方案。其名稱融合了"Define"和"Modify"的含義,體現了持續優化AI應用的核心理念。coverv5optimized工具鏈:Dify平臺包含生產級AI應用構建...
2025-06-12 06:46:44 2670瀏覽 0點贊 0回復 0收藏
身為一名AI工程師,我過去的工作主要集中在應用層開發,對算法的理解并不深入。然而,近期我開始對算法產生了濃厚的興趣,并轉向研究模型微調。在眾多微調算法中,Lora以其普遍應用引起了我的關注,我計劃在本文中對它進行詳細介紹。將Lora僅僅視為一種算法可能并不準確,它更像是一種精妙的技巧或策略。下文將圍繞幾個核心問題,全面探討和解析Lora技術,希望這些內容能為對模型微調感興趣的你提供有用的參考和幫助。Lora是什...
2025-06-11 09:41:53 5845瀏覽 1點贊 0回復 0收藏
2024年,Anthropic[1]發布Claude3[2]系列的同時推出了MCP[3](ModelContextProtocol),定位更底層:不是“調函數”,而是“定義模型理解系統的結構協議”。在企業級應用場景下,對于一些私有環境,MCP服務器可能不需要嚴格的身份認證。但如果在企業級別進行部署,對這些接口的安全性和權限管理就顯得至關重要。MCP服務器可以通過兩種方式運行:stdiohttp+sse這兩種運行方式的權限控制策略各不相同。在深入討論MCP服務器的權限...
2025-06-05 06:15:34 2976瀏覽 0點贊 0回復 0收藏
?上一篇文章我分享了AutoGen的基礎使用??AutoGen從入門到高階系列一:如何從零開始構建你的第一個智能體???,這一篇文章來分享一下AutoGen里面的智能體。內置了哪些智能體??UserProxyAgent??:一個智能體,接收用戶輸入并將其作為響應返回AssistantAgent:這是一個通用的智能體,它利用大型語言模型(LLM)進行文本生成與推理,還可通過工具(tools)擴展其能力。??CodeExecutorAgent??:一個可以執行代碼的智能體...
2025-05-21 06:37:07 1773瀏覽 0點贊 0回復 0收藏
最近團隊里的小伙伴都在討論AutoGen,作為一個去年還在手搓智能體的"老派"開發者,我也決定跟上技術潮流。經過一段時間的實踐,我發現這個框架確實能極大提升開發效率。今天開始,我將通過一系列文章,帶大家從零開始掌握AutoGen。文章大致目錄是這么安排的:基礎入門內置智能體自定義智能體及高級技巧智能體到底是如何進行團隊協作的狀態管理swarm模式分布式智能體作為開篇,我們先來認識這個強大的工具。初識AutoGen想象一下...
2025-05-20 06:31:22 2112瀏覽 0點贊 0回復 0收藏
MCP能解決什么問題我們之前開發LLM應用的時候,這個應用不僅基于已有的知識庫對話,還和外部連接訪問數據和使用工具:訪問google進行內容檢索訪問youtube進行視頻檢索調用公司內部的CRM接口我們在LLM應用內部做了很多的粘合工作,在之后如果我們要新開一個LLM應用,如果還需要使用這些工具怎么辦呢?我們可以引入一個中間層,把這些能力放在中間層中,LLM應用只負責和中間層打交道。這其實就是MCP做的事,MCP可以用來簡化LLM應...
2025-05-06 06:45:14 2466瀏覽 0點贊 0回復 0收藏
AI領域迎來了一則重磅消息——DeepSeek正式開源了其最新數學推理大模型DeepSeekProverV2671B!這款擁有6710億參數的“數學大腦”究竟有多強?它又將如何改變數學研究、教育甚至整個AI行業?讓我們一探究竟!一、數學推理領域的“AlphaGo時刻”DeepSeekProverV2671B是DeepSeek團隊專為數學定理證明和復雜推理任務打造的“專業選手”。從命名中的“Prover”(證明者)就能看出,這不是一個普通的通用大模型,而是專為解決數學難題...
2025-05-06 06:41:40 1452瀏覽 0點贊 0回復 0收藏
2025年4月29日凌晨,阿里巴巴正式開源了其新一代通義千問大模型Qwen3系列,這一發布不僅登頂全球開源模型性能榜首,更以創新的"混合推理"架構重新定義了大型語言模型的效率邊界。作為國內首個集成"快思考"與"慢思考"能力的開源模型,Qwen3在性能全面超越DeepSeekR1、OpenAIo1等頂尖模型的同時,將部署成本降低至競品的13。阿里巴巴還公開了兩個MoE模型的權重:Qwen3235BA22B和Qwen330BA3B。前者是一個具有2350億總參數和2200億...
2025-04-29 11:25:27 3029瀏覽 0點贊 0回復 0收藏
背景信息近期前線人員反饋,在使用問答系統處理PPT文件時回答效果不佳。經查發現,用戶上傳的PPT內容多為圖文混排形式,包含大量圖像和統計圖表。用戶提問主要聚焦于圖表數據及其相互關系。我這里隨意在網上找了一個PPT做嘗試,這個PPT有一張圖如下所示:提問:"2017年大數據開發人數比2016年增加了還是減少了,具體增加或減少了多少人?"系統返回:根據提供的資源數據,2017年大數據開發職位的招聘人數大幅增加。具體來說,201...
2025-04-28 09:30:15 1996瀏覽 0點贊 0回復 0收藏