90后技術宅與他的非主流另類搜索引擎Magi
最近,一個名叫 Magi 的搜索引擎成了重點關注對象,據稱這個搜索引擎和我們常見的搜索引擎很不一樣,有一種程序員們鐘愛的 X 冷淡風格。于是我們打開 Magi 看了看。確實,這個頁面看著就很讓人舒爽。
重要的是搜索結果也很不一般,屬性中的每一個結果有對應的鏈接,并帶有標簽和主要學習來源部分,搜索結果以結構化知識的形式呈現。這種模式和國內外主流的搜索引擎完全不一樣,讓人感覺新鮮。
當然,也讓人由此發出疑問:Magi 到底是什么,是誰開發的,好不好用?
按照開發者 PeakJi 季逸超的講述和 Magi 網站上的說明,Magi 其實并不是單純的網頁搜索引擎,而是自主閱讀文本并持續糾錯的 AI。
Magi 是由 Peak Labs 從無到有自研的基于機器學習的信息抽取和檢索系統,它能將任何領域的自然語言文本中的知識提取成結構化的數據,通過終身學習持續聚合和糾錯,進而為人類用戶和其他人工智能提供可解析、可檢索、可溯源的知識體系。11 月,Peak Labs 發布了公眾版 Magi.com。
與搜索引擎不同,Magi 不僅收錄互聯網上的海量文本,還會去嘗試理解并學習這些文本中蘊含的知識和數據。此外,Magi 從零研發了一套互聯網搜索引擎,所以 Magi.com 同時提供全網規模的普通搜索結果,學習過程是在無人干預的情況下 7 x 24 小時不間斷運行。
互聯網數據浩如煙海,質量參差不齊,如何將這些數據處理成機器能夠理解的數據結構時隔巨大的挑戰。在“Magi 的使命”一項中,Peak Labs這樣寫道:作為公眾版本的 magi.com 為人類用戶提供了與互聯網數據交互的新方式,而 Magi 系統背后的技術平臺則承載著另一半重要的意義:讓機器像人一樣能理解并充分利用互聯網中無窮無盡的知識。
對 Magi 的技術感興趣的同學,可以訪問 www.peak-labs.com 官網和季逸超的知乎,我們在這里就不多說了。
下面來關注一下 Magi 背后的團隊——Peak Labs,以及創始人 PeakJi 。
創始人 PeakJi 真名季逸超,90 后男生,在北大附中讀高中期間接觸 iOS 并加入威鋒網 WEIP 技術組,先后參與了 wefit 輸入法的完善和各種越獄研究,高三設計并開發猛犸 1 網頁瀏覽器,大一推出猛犸 4。據說,PeakJi 所有的產品都是由他獨自完成設計、美工、算法、編碼、測試和推廣,可見啊這是一個非常有想法,動手能力也很強的“技術宅”了。
2012 年,在北大念書的季逸超創建 Peak Labs,并發明了 Rasgueado 輸入法。據說 Peak Labs 的產品和技術還有很多,什么神經信息提取系統 Ireul,網頁大規模搜索引擎 Ramiel,多語言分析 pipeline Arael 和分布式檢索系統 Matarael 等等,利用這些技術構架,他們搭建了 Magi 服務,包括普惠版和企業版兩種。
如果你要問 Magi 好不好用,我們暫時也無法給出明確回答,因為 Magi 目前完成度還有待提高。但是,比起當做搜索引擎來用,Magi 應該更適合做知識學習鏈庫。
在使用的過程,我們會發現 Magi 也有很多不足之處,尤其是在搜索規模和答案準確度上。面對一些簡單搜索,Magi 往往給不出讓人滿意的答案,而且速度也不夠快。另外,它不是一款搜索引擎,像搜索網址這類任務也達不到很好的效果,也無法進行圖片搜索。
對于 Magi 的缺點,團隊和 PeakJi 都大方坦誠。
Peak Labs 指出,Magi 已經展示出的開放領域信息提取能力,可以應用到企業客戶所在的細分領域內,變成一個更加強大的信息抽取系統,讓每一個領域、每一家企業都可以輕松地打造屬于自己的知識圖譜,他們希望未來的 Magi 系統能夠成為“知識領域的 ImageNet”。
Magi 現在還遠算不上成熟,但其特性決定了它無窮的可能性和成長空間。未來,也許 Magi 會成為打破現有搜索引擎原理的新范式,開啟全新的結構化知識搜索引擎時代,改變我們對信息檢索和知識獲取方式的刻板印象,畢竟在信息大革命和人工智能大發展的時代,千帆競速,百舸爭流,誰都有機會。