工業大數據的未來發展方向(從阿里和航天說起)
2016年12月5日,清華大數據技術·前沿系列講座——“工業大數據的技術趨勢與應用場景”在清華大學FIT樓多功能廳成功舉辦,本期講座邀請到了阿里巴巴集團副總裁、阿里云業務總經理劉松、航天科工集團航天云網科技發展有限公司副總經理祝守宇和阿里云事業群數據業務總架構師周衛天來為大家介紹工業大數據的建設背景、發展現狀、國家戰略、發展趨勢、競爭對手、發展啟示及建設意義。
劉松,現任阿里巴巴集團副總裁,兼阿里云業務總經理,負責阿里巴巴云計算生態構建工作,包括:大中型合作伙伴的戰略合作,云市場與ISV的發展,大學合作與開發者計劃,阿里巴巴雙創示范基地,阿里云創客+,云棲100合作計劃,阿里云研究中心等方面,并擔任云生態戰略與技術發展趨勢的主要發言人。
劉總主要從三個層面的角度分享了他的想法。
一、數據技術(Data Technology)的發展趨勢作。目前數據成為互聯網平臺企業的關鍵技術,包括蘋果、谷歌、亞馬遜等全球十大科技公司都逐漸演變成數據化、智能化的平臺公司。數據技術的(DT)發展將對各行各業產生影響,新一代信息技術的優化使得全球的軟件定義、數據驅動的商業模式逐步明顯,數據智能也會在各個傳統行業得以應用。
二、中國工業互聯網的路徑選擇。德國公司發展工業4.0的原因是害怕谷歌、facebook等互聯網平臺公司對消費互聯網數據的控制,提出工業4.0與其抗衡;而美國以GE為代表推出了predix平臺,但仍然采用著將軟件工程作為工業附屬的操作模式,這種模式目前看來可行,但是橫向擴展有限,而美國東西海岸的科技界對此仍處于不合作狀態。目前在中國,基于良好的移動互聯網經濟,如果將互聯網的平臺模式和傳統工業(包括汽車、飛機、機床、能源互聯網)等產業結合起來,探索出新的跨界重混模式,會因為巨大互補效應而產生化學反應,中國制造業可能會走上一條換道升級的路徑。
三、中國工業大數據的挑戰與機遇。目前中國的工業生產模式很重,通過數據智能改進的產業機會非常大。除了技術和產品層,中國工業大數據要解決的非技術挑戰主要有兩點:一是文化的問題。工業企業文化和互聯網企業文化差異很大,要解決work together的問題;二是人才的問題。這個領域需要的人才非常廣泛,要有對工業本身理解的人才,需要了解具體的生產工藝,要有工業軟件人才、要有數據處理的人才,這個領域是一個絕對跨界融合的產業,難點在于跨界合作的人才集成。工業大數據的推進問題,我們首先考慮的是能不能把人才高效地積聚起來。人的要素、文化的要素是推進工業大數據兩個最重要的因素。
航天科工集團航天云網副總經理的祝守宇為大家分享工業互聯網和工業大數據的應用
祝守宇,國家千人計劃專家,教授級高級工程師,清華大學自動化專業學士、碩士。祝守宇先生的主要研究領域包括移動互聯網大數據分析、工業互聯網數據分析等,擁有國內外發明專利數十項,省部級科技獎勵多次。
航天科工集團的前身是國防部第五研究院,由著名導彈學家、火箭專家錢學森組建。目前其主要以一主兩翼三創新為整體發展目標,包括一主:航天防務、兩翼:信息技術和裝備制造、三創新:技術創新、商業模式創新、管理創新。在產業政策層面,工信部力推“制造強國+網絡強國”的行動計劃,將“中國制造2025”和“互聯網+”行動計劃列為未來產業發展的主攻方向。
航天科工集團航天云網公司的發展愿景是建設國家級工業互聯網平臺。航天企業采取互聯網思維,將航天云網打造成為全國第一批、國內第一個工業互聯網平臺,實現“人人皆可制造”的目標。航天云網的主要業務方向為:一、工業4.0,涉及互聯網+智能制造,重點在于企業智能化改造無人工廠、黑燈工廠。二、工業互聯網,突出的是設備資產的管理。三、中國特色的互聯網+制造資源共享,暨產業互聯網。相比于移動互聯網,工業互聯網是“硬科技”,伸手要數據進行分析的模式是低端模式,而真正有效的模式是從最基礎的工業解決方案開始,幫你產生數據,進而再去分析處理數據。航天科工集團不僅是國內智能裝備領域的領航者,還是同時涵蓋“高端裝備制造”和“信息技術”的為主營業務的集團。這也反映了中國工業互聯網發展上,企業對基礎技術上的積累和能力的重視。
那么如何看待工業互聯網產業呢?通過與消費互聯網對比,我們可以得到更好的理解。消費互聯網時代是以人的連接為主,主要形式實際上是手機和PC,手機數據量又遠遠超過PC。它的數據產生于三個方面,PC、手機、消費型智能硬件(手環、手表)。工業互聯網以機器生產系統為主,數據來源主要有三項。第一個是復雜裝備,第二是生產體系,第三個是工業級的智能硬件,比如說空調、充電裝置、路燈等等小型的裝備,大的復雜裝備包括航空發動機等等。全球的物聯網,連接進網的設備,預計到2019年大概是250億個,PC和手機大概八九十億。從設備鏈接的數量來看,工業設備的聯網要遠超消費聯網。
我們來分析一下消費互聯網的產業鏈條。消費互聯網的產業鏈條是通過手機和PC產生數據,通過基礎平臺運營商為鏈接(移動、聯通等),在運營商之上產生BAT類似的應用,這一類應用從運營商的角度來講叫OTT。整個產業的推動實際上是通過運營商來完成的,向下來推動手機和智能硬件的發展,向上推動應用的發展,當然最有價值的就是這個行業的推動者。
同樣的,工業互聯網中采用的數據不一樣但數據設備仍然是最頂層的基礎,往上一層是現代的云計算大數據平臺,是像航天云網和阿里這樣的企業等等,再上面的是一些工業級的應用,所以從產業推動來講,跟消費互聯網很類似。最終價值和重要性,需要靠中間的平臺層去推動整個產業的發展。借助業界的大拿講的話,“遠景清晰可見,工業互聯網”是變革的真正機遇,這將遠遠超越“消費互聯網”。
相比于大數據技術在消費級互聯網中的應用,我們的工業大數據是大家更應該投入的產業,這是一件舉足輕重的大事,我們也能夠在更大的舞臺上,做出更多對人類發展有巨大貢獻的事。“資源共享、能力協同、開放合作、互利共贏”是航天云網人的企業內涵和精神理念,作為國家的戰略性平臺,歡迎大家加入我們的隊伍,也歡迎大家跟我們合作。
周衛天老師通過融合一些案例對整個大數據領域的技術發展趨勢與工業大數據的技術驅使向在場的觀眾進行分享。
信息革命2.0:DT時代正式開啟
DT時代已經來臨。數據取代石油,成為全球經濟基礎要素。IT技術成為重要生產力,云計算成為基礎設施,互聯網+物聯網構成萬物互聯的信息交互渠道,全球市值TOP5第一次全部都是科技公司:Apple,Google,微軟,Amazon,Facebook全部是云化、數據化、智能化的公司。
2009年,馬云先生講了阿里巴巴是一家數據公司,在2010年的時候,馬云先生反復強調要做云計算,堅持發展云計算。數據平臺的核心是軟件能力,未來五年,大數據的發展趨勢就包括延伸軟件平臺,把傳感的技術、芯片的技術集成起來。
阿里在實戰中的阿里大數據是怎么來的?首先體現在支付能力上。剛剛過去的“雙十一”,阿里有兩個驚人的數據,12萬筆/秒支付的頂峰;峰值支持能力10分鐘,30分鐘壓測能力,10.5億筆總支付的記錄,電商平臺、螞蟻支付拉高了整個阿里體系的技術能力。這類金融系統每秒十幾萬筆是非常了不起的數據。
阿里在數據處理上的經驗總結為兩點。第一,是數據處理,第二,是人工智能。阿里有一個天池平臺,由于支持大量多業務,今天阿里已經有了幾百萬張表。在我們國家,比如一些大的部委,十幾萬張或者是幾十萬張表已經很大了,當我們處理百萬張表的時候,建模就不能用傳統的方式來做。按照我的主要業務營銷、財務、實踐模塊,把表與表之間的關系,設計地非常圓滿,然后基于這個之上再來開發應用。在阿里,因為互聯網的快速增長、野蠻增長,來一個業務就建一個表,一個表拉幾個字段,每晚會對增量數據進行對比,這是阿里本身的一套技術體系。所有元數據表,每一個字段都有一個開發的同學認領,對主要的所有字段都會按照數據的級別、按照業務的重要程度、調用的頻率排重要度進行排列。數據之后會經平臺的甄別來判定數據的可信程度。確保了數據質量的準確性、唯一性,數據的準確性對數據分析至關重要。
第二,今天,阿里云后面有一支比較大的團隊做視覺智能、語音智能。將數據打通,包括線上線下的數據,網上的虛擬身份的ID,怎么跟電話號碼、身分證號碼怎么打通,把數據進行有效的利用。阿里擁有一個天池眾智平臺,所有涉及到高級算法、智能算法的問題,通過眾智平臺,由阿里自己的科學家把問題的目標、問題進行分解,平臺上五萬名科學家和算法愛好者提供一個最好的方案。正是因為這樣一個大數據智能平臺才支撐了阿里形形色色的業務。
阿里的登月歷程與選擇
阿里在2013年開啟登月工程,把原來很多的業務、支付寶、小貸、集團的B2B,以及后來已經開始有收購的業務,做到統一的平臺上來。
階段一:阿里啟動前約2到3個月進行了全面的工作準備,進行了公共平臺和服務層的建設搭建;數據規范、指標體系、數據安全、質量控制的流程制度及工具的開發;成立了登月數據委員會(全職同學不同時期約七到十人左右;虛擬團隊的同學每個主要業務團隊都規定了對接接口的同學)
階段二:2014年正式啟動從云梯1遷移到云梯2的過程,最終分解為幾十個登月項目。云梯2中開發、調度、質量控制和元數據管理Meta是全新的、不一樣的一套體系。比如:DQC和ODPS底層的大數據統計分析功能、計量功能的演化。光是元數據Meta管理和統計分析的模式和云梯1里面的Oracle庫、GP庫、開源Hadoop庫很不一樣。2015年6月所有老系統全部接管,完成了新舊系統的并除。
對于大數據的技術走向和趨勢,周總提到了三點:
一、智能化
所謂智能化本質上是計算機化,不是固定僵硬的系統,而是能自動執行程序、可編程可演化的系統,更高的要求是具有自學習和自適應功能。無人自動駕駛汽車是智能化的標志性產品,它融合實時感知、導航、自動駕駛、聯網通信等技術,比有人駕駛更安全、更節能。
二、個性化
個性化的背后是大數據和視覺識別技術的發展。人臉識別、語音智能、OCR證件的認證,這是個性化很早的一面。最新的語音識別的數據是利用深層的神經網絡,正是由于現在數據的爆發,以及計算處理能力的提升,也就是GPU很多的能力,今天生成的神經網絡已經能夠計算到12層、13層了。
個性化的數據庫。以某衣服制造廠商的數據庫為例,其版型數據庫能做到3000+版型/天,而如果使用手工打版,每天生產1200多套西服的紅領,至少需要500多個打版師傅。款式數據庫,這是實現客戶訂單提交、產品設計、生產制造、采購營銷、物流配送、售后服務一體化的開放性互聯網平臺,做到了個性化和融合化的完美契合。
個性化的搜索引擎-千人千面。實時預測用戶對物品偏好,個性化推薦,千人千面,支持定制推薦算法。
三、融合化
大數據跟工業制造當中的特征工程是可以結合的,讓大數據去完善、加強原來特征工程中對于工業制造的質量控制、質量改善、良品率的提升,同時大數據的分析能做傳統特征工程不能做的事情。
智能工廠、貨運列車故障檢測需求分析、重型的設備公司等等,這些重型機械企業都在轉型,通過大數據可以預測出最有價值的客戶,甚至在融資、將來設備的租賃方面等都有貢獻。
我們的大數據跟工業的特征工程、傳統經驗融合起來,產生更多的智能,從而讓大數據能夠真正地為智能制造、互聯網+的華麗轉身做一點貢獻、做一點力量。
整場活動干貨滿滿,嘉賓精彩的分享使參與活動的學生和業界人士反響很熱烈。本次活動由清華大學數據科學院主辦,清華大數據產業聯合會協辦。