IBM 開源 CodeFlare 框架,用于在多云平臺上運行的 AI 模型
IBM 推出了一個名為 CodeFlare 的開源框架,旨在用于簡化大數據和人工智能工作流程在混合云上的整合和有效擴展。根據介紹,CodeFlare 建立在 Ray 之上,Ray 是一個新興的用于機器學習應用的開源分布式計算框架。CodeFlare 通過增加特定的元素來擴展 Ray 的能力,使工作流程的擴展更加容易。
IBM 方面指出,隨著數據和機器學習分析幾乎滲透到每個行業,任務變得越來越復雜。雖然為 AI 研究設計更大的數據集和更多系統很重要,但隨著這些工作流程變得越來越多,研究人員也正在花費越來越多的時間來配置他們的設置,而不是完成數據科學。
如今創建機器學習模型是一項密集的手動任務;研究人員必須訓練和優化模型,這涉及到了數據清洗、特征提取和模型優化等任務。而 CodeFlare 則有助于簡化這一過程。它使用基于 Python 編程語言的接口來創建管道,通過它可以更輕松地集成、并行化和共享數據。CodeFlare 框架的目的是統一跨多個平臺的管道工作流,而無需數據科學家學習新的工作流語言。
CodeFlare 管道可以部署在任何云基礎架構上,包括新的 IBM Cloud Code Engine(一個無服務器平臺)和 Red Hat OpenShift。同時,CodeFlare 還為事件觸發器提供適配器,這意味著管道可以與其他云原生生態系統集成和橋接。此外,它還支持從眾多來源(如云對象存儲、數據湖和分布式文件系統)加載和分區數據。
CodeFlare 還應該意味著開發人員不必重復他們的工作或努力弄清楚過去同事做了什么來運行某個管道。“借助 CodeFlare,我們的目標是為數據科學家提供更豐富的工具和 API,讓他們可以更加一致地使用,使他們能夠將更多精力放在實際研究上,而不是配置和部署的復雜性上。”
IBM 稱,他們希望這一框架能夠為開發人員節省大量時間和精力來創建部署到混合云的管道。并舉例表明,該公司的一個用戶應用 CodeFlare 框架分析和優化 100,000 條管道來訓練機器學習模型時,成功地將執行每個管道的時間從 4 小時縮短到 15 分鐘。
更多詳情可查看官方博客。
本文轉自OSCHINA
本文標題:IBM 開源 CodeFlare 框架,用于在多云平臺上運行的 AI 模型
本文地址:https://www.oschina.net/news/149690/ibm-open-sources-codeflare