成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

【WOTD】網易傳媒VP劉彥東:當AI遇見信息流: 新時代的信息分發

原創
新聞
12月01日上午WOTD2017主會場,網易傳媒技術VP劉彥東進行了主題為《當AI遇見信息流: 新時代的信息分發》的精彩演講。以下是演講實錄,讓我們先睹為快!

【51CTO.com原創稿件】2017年12月01-02日,由51CTO主辦的WOTD 2017全球軟件開發技術峰會在深圳中洲萬豪酒店召開。秉承專注技術、服務技術人員的理念,自2012年以來,WOT品牌大會成功舉辦了十四屆,積累了大量的技術專家資源,獲得了廣大IT從業者和技術愛好者的一致認可,成為了業界重要的技術分享交流平臺以及人脈拓展平臺。

本次會議分為10個技術主題,分別是:編程語言與框架,大數據系統架構設計、微服務與容器技術、前端開發實戰、物聯網(IOT)技術、軟件性能優化、深度學習與智能應用開發、創新運維探索、技術架構遇到業務架構、CTO訓練營。51CTO作為本次大會的主辦方,將全程圖文直播報道與后期視頻展示這場盛宴。

12月01日上午WOTD2017主會場,網易傳媒技術VP劉彥東進行了主題為《當AI遇見信息流: 新時代的信息分發》的精彩演講。以下是演講實錄,讓我們先睹為快!

劉顏東

我7月份回來,加入網易,之前在美國待了十年,后來去了雅虎研究院,很長時間都是做技術方面或者基于學習方面,很偏學術性研究。早在十年前我感覺機器學習不錯,很有意思,現在我突然發現,全世界都在討論AI。后來在大公司待了很多年,去了Uber。技術沒有最好的,只有最適合的,這句話我非常認同。產品設計追求簡單、追求便捷,在過能的場景很豐富,追求各種場景、各種很有意思的玩法,這可能和兩邊的技術的場景也很不一樣。這是我回國以后最大的感觸。

我們都知道現在是AI的時代,AI技術其實已經幾十年了,大家都說的神經網絡幾十年前也就有。之前我們做研究都是談論基于統計做機器學習的東西,雖然機器學習理論或者統計的東西都還在,但是今天大家討論的都是深度學習。有幾個原因,一是數據非常多,尤其是國內。我覺得在中國,國人對于手機或者移動互聯網接受程度非常快,甚至大家跨過桌面互聯網的時代。國內很長時間沒有電腦,突然手機普及了,每個手機都可以上網,而且中國人非常擅于把生活場景搬到移動互聯網。機器學習技術成熟很多年,深度學習方興未艾。當然計算能力必不可少,同時還有場景,技術說了很多,還要落地,給用戶服務,還要變現。

信息流,在座的來自各行各業或者來自不同的技術領域,對信息流不一定了解。信息流是否有明確定義呢?我不知道,這是我個人的體會。它以推薦為基礎,將信息呈現在用戶面前。過去大家找信息是被動的,我知道要什么。但是有信息流產品,你不知道你要什么,或者我們都不知道要什么,我們推薦一些東西給你,希望在你不斷的反饋和用戶的行為中探索你真正想要的,也許你不清楚,但是機器比你更清楚。內容豐富多彩,我們知道今天的信息流,廣義上已經遠超過新聞或者資訊的新聞,過去是要聞、新聞、大事件,今天泛娛樂和內容形式,你要看圖片、新聞、音頻、視頻、笑話,什么都有,付費內容、知識問答。場景也是很豐富的,早上起來要看重要新聞,很自然的,甚至不需要打開手機都可以,緊急大事件我第一時間告訴你,最新的常委亮相告訴你,路況告訴你,天氣告訴你,等車打開信息流,我告訴你,追星、追劇都是一站式服務。還有信息選取是被動的,你不告訴我要什么,我主動猜。本身定義人與信息的連接和關系。

信息流為何崛起?

為什么信息流會崛起?大數據+算法+計算力,但是要有場景,非常豐富和適合的場景,這個要以信息為AI驅動,好像我們說AI,AI可能沾邊,貢獻10%、20%,但是信息流產品是100%信息流定義,每個環節都是由AI驅動的,不光是你看到,最終你用的產品。包括內容生產、內容理解還有用戶反饋,其實完全由AI決定。還有很多產品,它也許是機器學習或者深度學習驅動,比如無人車,它有硬件制造、路況和當地政府合作,其實很麻煩,門檻很高,但是信息流產品,它純技術人員就可以完成。

信息流是這幾年比較火,信息流之前我們怎么獲取信息?我們再回顧一下,我們要看東西去搜索引擎搜,你明確知道要什么。比如美國總統是誰,我想知道去搜。要么是門戶網站,編輯已經編輯好的頁面,今天的要聞十條,我訪問或者你訪問。要么我知道這個網站,我很清楚,我去買東西去什么網站、看新聞去什么網站。它更多是主動的、直接的信息獲取手段,而且效率很低。比如用搜索引擎,我們覺得搜索引擎很高,但是你發現要單點,你去一個地方要去一個網站,然后搜索。信息單一、效率低、千人一面。信息流的優勢是理想化的AI場景應用,是+AI,不是AI+。因為有少部分人生產少量內容,到大部分人生產大量內容,實際上需要AI技術。算法永遠可以復制,大家都會發Paper,甚至買云服務,但是數據是不合作的。很多公司是做云服務,賣給你技術,永遠不賣給你數據。如果今天一款產品可以得到很多數據,這是最珍貴的地方,其他的東西都可以想辦法解決。體量很大,一般都是幾千萬。同時商業變現,我覺得這也是很重要的一環,你的產品不能只叫好不叫做,很多用戶在燒錢,沒有意義。因為信息流對用戶行為的豐富采集和對用戶的深刻理解,可以做定向廣告,讓變現很容易,而且可以想像產品形式很容易插入最傳統的展示廣告。

信息流的截圖,以網易新聞為例,你會看到信息流本身有這種頻道,我們叫頭條,其實是綜合體,把各種信息的形式插入里面,我們有置頂新聞,還有很重要的新聞。還有一些熱點新聞,全世界的熱點新聞。然后下面還有我關心的內容,恰好是有我的,不一定是我的,也許是很多人都喜歡的,也許是我的,就會推出來。下面是廣告。這個頁面幾乎覆蓋了各個場景,它有熱點,也有個性化,還有變現的方式,有圖片和文字,因為受限,你往下拉還有視頻。上面有分類,通過個性化,視頻關心,把食品放在第二個,還有垂直頻道,你是體育迷,就給你推體育。

信息流本身的體量是非常大的,也看到很多家大公司入場,但是每個產品幾乎都有幾千萬的,排名頭部的有數千萬的用戶。數千萬的用戶,如果每個用戶的經營時長是幾十分鐘,這樣就會產生大量的行為數據。生產端每天也有幾十萬的內容,這是各種各樣的形式,首先有少量的原創,這是最獨特的地方,很多地方沒有原創的能力,只能去外面爬和收集信息,質量往往不能保證,同時還有海量的自媒體內容,你會發現智慧在民間,比如快手,幾乎完全是民間創造,網易也是自媒體平臺,大家會上傳大量原創內容。還有很多其他形式,我們有社區,這是網易的特色,包括評論,還是很有意思的,里面本身有很多具體內容。還有直播和線下活動,以客戶端為載體,把所有的信息、表現形式穿在一起。海量用戶加海量時長就創造海量數據。

信息流產品本質

信息流的本質是什么?重新定義人和信息的關系,解決信息過載,今天信息太多,信息很多,搜索引擎太慢,其他的方式,如果自己找,也很累,就是信息流把海量的數據庫把你最想要的東西展示到你面前。信息獲取更加便捷,還有很多泛娛樂,幫你填補碎片時間。我們談了信息流產品的本質,一個信息流產品怎么才是成功的呢?還是那句話,用算法以AI為驅動來預測你的需求,無非是何時何地,這里面有三個要素,你的人,就是你的用戶加上你的地點和你的場景,我覺得場景包括時間和地點,來預測你的需求,過去是人找信息,過去是單點的需求,現在是全面個性化的需求,每個人的信息需求,每個人肯定不一樣,每個人在不同的時間點、不同的地點也是不一樣的。

信息流產品的關鍵步驟

信息流產品有這么幾個步驟:

一是內容的生產、加工和過濾,你內容拿過來,不管是圖文還是其他,要理解這個內容講什么,質量的好壞,甚至說低俗程度怎么樣,我才能更好的做推薦。你理解用戶,并且把最想要、最合適的內容,在合適的時間推給你,即便你想要,時間不合適也不行。比如白天工作很忙,我給你推一個八卦信息,你也不會看。晚上我推給你,你可能覺得會看一看,這就是很典型的場景化的應用。收集用戶反饋,改進模型,精準定向廣告。我想強調的是,這個事情是非常綜合、非常復雜的,很多人覺得信息流,它涉及內容的生產、消費,然后這種閉環,生態的建設,本身是很不容易的事情。這些環節,比如技術很好,你沒有內容,這也不行,內容本身就是生態,是很長的過程,是難度很大的事情。

二是內容形式,我再具體的闡述一下,里面我個人是這么分類的,比如有文本、圖片、音頻,還有其他的拓展,就是知識圖譜,這是內容本身。文本,有人物、標簽、信息點,文章質量、文章熱度。還有圖片、視頻,有清晰度,很多東西技術難點沒有那么簡單,清晰度,視頻的比特率就可以,碼率就可以,視頻本身很不清晰,只是把不清晰用高清晰的形式表現出來,還是不清晰,這是算法的技巧。包括類別和語義,我們希望可以做到,但是不能完全做到,這個視頻有誰,到底講什么事情,有誰,這是很復雜的。否則我推就根據視頻的標題,這可能不是很準確。包括用戶體驗,是不是有廣告,是不是插入二維碼。還有我們不知道的問題,轉化為已知的問題解決。

三是內容處理,這個層面會提到一些,分析、處理、挖掘,這里面技術主要是用NLP、Computer Vision、知識圖譜、Data Ming。用戶本身我們需要了解他的用戶需求和興趣點,比如說這幾個維度,有人習慣看圖文、有人喜歡看視頻、有人喜歡看短內容、有人喜歡看長內容,每個人的需求不一樣,屬性也不一樣,有人喜歡看要聞、有人喜歡看娛樂、有人喜歡看八卦,其他的場景需求也是,我剛才強調了有天氣、路況,如果你可以預測出,他這時候要出門,想看一下路況,或者給他發一條天氣信息,他的關注度肯定很高。

四是用戶畫像,有這種行為畫像、上下文畫像、人口屬性畫像,有些我們可以采集到,有些要推測出來,用戶行為,本身可以采集到,上下文有些自己的行為數據的積累,人口屬性,也許你自己推測,也許通過第三方合作,畢竟今天的數據交換、數據共享的服務也有,你可能推算出來大體是30歲女性,城市白領,也可能不一定準確,可能別的公司也有這種很精準的服務。他們可能要求注冊者必須提供這些,更精準的數據可以幫助你更好做推薦。

談完內容、談完用戶,本質還是算法,算法是基于用戶興趣的推薦引擎。算法需要用戶建模,我什么樣的性別、什么樣的年齡、什么樣的收入,推什么內容,這是用戶屬性。其他的用戶行為,通過閱讀歷史、興趣點和時間推一些東西,還有上下文,甚至網絡條件也很重要,4G和wifi和3G條件下,時好時壞推什么內容。這個時間他對高清視頻推很大的,他不點,因為網絡不支持,不是沒有興趣。

推薦系統架構,用戶畫像、檢索、數據流、實驗系統都要,你需要實時數據流,用戶點擊馬上就應該更新你的模型,我這秒點這個新聞,你下一秒就應該給我反饋。我點體育賽事,你明天推,可能已經晚了,因為比賽已經結束。最后還有效果評估。

信息流生態培養

重點談一下生態的培養,信息流不是純信息流,需要生態的培養,來組織好用戶和組織好內容,用戶一方面是客戶端用戶,另一方面是自媒體號用戶,就是網易號用戶,現在都很重視生態的培養。內容是起點,用戶是終點,形成閉環,互相促進。比如某個影視劇在某個時間段很火,鼓勵生產者都做生成。這個是動態的,包括一些興趣點可能是臨時的,也有一些長期的,比如NBA之類的,可以放在池子里反復推薦,鼓勵大家更好做這些事情。大量內容來自PGC/UGC,UGC是用戶生產,看起來質量不那么高,但是有些個人觀點很好,有很多量,能達到個性化、千人千面的效果。包括內容創作要審核、過濾,畢竟接口開放給大家會有各種各樣的內容涌進來,泥沙俱下,要把這些好的內容挑出來,把糟粕過濾出去。希望完全機器做,如果風險很大,還需要加一道人工。最終用戶看到的用戶體驗一定是最好的內容。人工標注來促進人工智能的發展,這個我們很熟悉,一開始數據不夠,人工標,標一陣,數據可以了,反過來就不需要人的工作。

信息流未來發展趨勢

再談談我對信息流未來的發展變化趨勢判斷,形式越來越多樣,圖文、視頻、音頻,今天看到音頻不是很多,很多是第三方的,只做音頻內容,信息流這種瀑布流的形式,我覺得內容是不拘一格的,音頻一定會出現,知識問答也會有,知識問答今天很多公司已經在做了。實際上只要有用戶、有流量、有興趣點、有熱點,為什么不做問答?一個是把內容形式變得更多樣,另一方面社交屬性,一旦做問答,可能就把用戶的互動性建立起來,其實就是往社交方向引導,很多人想能不能做社交,黏性越來越強。當把所有生活場景覆蓋掉以后,你發現離不開這個產品,這個產品也許變成你一站式的服務,也許將來不需要搜索引擎和第三方,通過這個就可以獲得你想要的所有信息。

場景更加細分,剛才提到一些,要做個性化、做推薦,為達到更好的效果,肯定要把這些列出來。有些東西機器可以分別出來,有些需要在產品思考,要真正思考一下用戶是怎么用這個產品。我大體羅列了一下,早上起來,我給你發一些東西和晚上起來發一些東西,東西不一樣。晚上是一些沉淀的東西,可能是一些精讀,體育賽事,如果有體育賽事,關心體育賽事,一定是第一時間push,明天看可能沒有意義。有時候抱怨手機收到信息太多,但是你關心的體育比賽,推給你,你一定是放在重大新聞。還有追劇,電視上熱播的劇,我們推給你,甚至精彩片斷,相信你會點。打發時間,等車的時候拿出來,我們判斷出你在車站,拿出來就是打發時間,我可能推一些泛讀的東西給你,還有路況信息。

AI本身的角色會發揮更大的價值,這無需多說,我很看好AI在信息流的應用。隨著內容形式復雜,必須通過AI。

AI的應用價值

剛才說AI很泛泛,機器學習和深度學習具體能干什么?我們知道視頻、圖像的分類,這個不多說。深度學習CNN、RNN、ETC很多,這方面進展很熱,我自己也看。明星臉識別,看視頻,如果視頻關于明星,識別出來推薦給合適的人還是可以做到的。語音識別,音頻拿過來轉化為語音,這包括不同地區的語音。三俗、不適內容,這個很關鍵,其實很多內容,我覺得并不適合推給大家,或者不適合在很多場景下推給大家。很多很低俗的內容,今天看來,這個生態是其中一部分,今天很多人為了拿到流量,故意生產一些不太好的內容,或者比較低俗的內容,也許一部分人推給他不介意,但是很多人介意。如何挑這些內容出來,是很困難的。這種不適內容和低俗內容如何定義,還沒有很好的定義。

還有比較傳統的理論,遷移學習,今天你點很多圖文,明天我突然上馬視頻項目或者音頻項目,沒有用戶數據,如何快速的把你在其他領域的積累,馬上被模型遷移到另外的領域,很關鍵,因為短視頻很火爆,如果今天說推短視頻場景,我花一年時間積累五百萬用戶數據做好的模型,已經來不及,必須把現有的信息擴展到新的。

智能寫稿我覺得也是很好的方向,今天很多場景下,寫稿需求很緊迫,比如體育賽事和重大新聞和重大自然災害,大家比的是誰快、誰準確,如何能在已知的現有條件下,讓機器人把稿件準確寫出來,并且傳播,這是我們的核心競爭力之一。有時候人可以盯著,但是人總有失誤的時候,可能會慢一點,人寫又很慢,如何用機器更精準的把信息真實表達出來,并且傳播,我覺得是未來的方向之一。

以上就是我演講的全部內容。謝謝大家!

————————

以上是51CTO.com記者從一線為您帶來的精彩報道。后續我們還有更加精彩的獨家報道,敬請關注。

【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】

責任編輯:張昂 來源: 51CTO
相關推薦

2017-11-30 09:59:14

2022-08-23 14:00:48

數據管治

2018-06-13 19:36:58

IBM、AI、人工智能

2022-11-10 08:48:20

開源數據湖Arctic

2023-10-18 07:09:31

AIGC瀏覽器

2014-08-18 13:44:22

易傳媒

2017-12-01 12:35:57

信息無障礙

2017-04-13 12:01:54

數據監測信息流

2017-07-26 18:49:00

京東機器學習人工智能

2010-11-18 12:36:13

距離矢量協議路由交換

2010-07-07 12:14:01

路由選擇協議

2017-07-07 16:11:40

2011-11-07 09:50:30

2017-08-06 19:43:31

2025-03-07 08:31:34

2024-03-08 08:50:01

信息流系統緩存

2023-05-11 07:42:04

doop漏洞

2024-07-03 16:44:49

2012-03-13 13:45:32

元年軟件

2014-11-27 11:17:39

神州信息昆山智慧教育
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线看一区二区 | 成人在线观看网站 | 人成在线| 日本天天操 | 色视频一区二区 | 中文字幕一区二区三区四区五区 | 免费黄色大片 | 精品一区二区三区在线视频 | 国产精品免费视频一区 | 日韩爱爱网 | 一区二区三区在线免费观看 | 中文字幕日本一区二区 | 日本午夜视频 | 凹凸日日摸日日碰夜夜 | 亚洲一区二区av在线 | 国产精品亚洲精品 | 国产精品爱久久久久久久 | 精品免费看 | 97精品超碰一区二区三区 | 国产目拍亚洲精品99久久精品 | 国产欧美在线观看 | 国产视频一区二区 | 伊人网站在线观看 | 成人欧美一区二区三区黑人孕妇 | 男女网站视频 | 亚洲视频中文字幕 | 二区在线观看 | 在线视频国产一区 | 亚洲人成在线观看 | xx视频在线| 天天躁日日躁狠狠的躁天龙影院 | av看片网站 | 99热首页 | 日本一道本 | 亚洲免费精品 | 精品国产伦一区二区三区观看说明 | 色久在线 | 国产激情免费视频 | 久久中文字幕电影 | 成人不卡| 国产视频黄色 |