成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

“猜畫小歌”的一些細節和思考

移動開發
"猜畫小歌"用到的quickdraw模型本質上是一個分類模型,輸入是筆畫的點的坐標信息和每筆起始的標識信息,應用幾個級聯的一維卷積,再使用 BiLSTM 層并對結果進行求和,最后使用Softmax層進行分類。

Quickdraw的CNN-RNN模型

"猜畫小歌"用到的quickdraw模型本質上是一個分類模型,輸入是筆畫的點的坐標信息和每筆起始的標識信息,應用幾個級聯的一維卷積,再使用 BiLSTM 層并對結果進行求和,***使用Softmax層進行分類。

整個網絡結構如圖:

“猜畫小歌”的一些細節和思考
模型結構

開源數據和代碼詳見后面參考文檔。整個網絡比較簡單,而且用其默認的參數最終的模型準確率在75%,如下圖,不算是一個要求較高的場景,效果已經足夠好。

這里分享筆者注意到的有幾個有意思的小細節(高手輕拍)。

小細節

數據預處理

對于stroke-3(x,y,n),Google默認使用的TFRecord數據對坐標做了歸一化與差值處理。

 

  1.  # 1. Size normalization.  
  2. lower = np.min(np_ink[:, 0:2], axis=0)  
  3. upper = np.max(np_ink[:, 0:2], axis=0)  
  4. scale = upper - lower scale[scale == 0] = 1  
  5. np_ink[:, 0:2] = (np_ink[:, 0:2] - lower) / scale  
  6. # 2. Compute deltas. np_ink[1:, 0:2] -=  
  7. np_ink[0:-1, 0:2]  
  8. np_ink = np_ink[1:, :] 

 

為什么歸一化?

類似于輸入層BN的作用,將數據的分布由原來激活函數的收斂區調整到梯度較大的區域

只關心畫的筆畫走勢,而不關心畫的大小,也就是說畫一個大圓和畫一個小圓在輸入數據層面沒有太大區別

為什么差值處理?

忽略起始坐標位置的影響,也就是說在畫布的中間和四個角落開始作畫同一個形狀,在輸入數據層面沒有太大區別

卷積層

使用多個一維卷積(conv1d)級聯,并使用線性激活函數,沒有使用pooling層。

  • 線性激活改為relu,準確率降了點,為73%
  • 線性激活改為relu+加上pooling層(size=4,strides=4),準確率又降了點,為70%

為什么線性激活和去掉pooling層效果提升2-3個點?

pooling層有哪些作用:

  1. 降低參數量,事實上增加了pooling層使得訓練時間縮短了一大半;
  2. 保持特征局部不變性,貌似我們的輸入不是復雜的圖片像素信息,而是筆畫信息,而且做了差值處理,也不太需要局部不變性;
  3. 減少冗余,去除噪聲,對于簡筆畫來說,可能作用也不是特別明顯。

筆者(單純的)理解簡筆畫已經是人類對于物體的高度抽象了,因此沒有必要在用復雜的CNN網絡去抽象特征,并且全局的特征有后面的RNN層獲取。

小思考

Google 16年11月就推出了QuickDraw網頁版,最近只是借助小程序又火了一把,之前已經獲取過大量真實的用戶數據,并用于這次小程序效果的優化。

模型還能用來做啥?

最近看到了一片研究這份簡筆畫數據中不同國家的人的繪畫順序與其國家文字的關系的文章,而且時序分類模型在異常分析、手寫體識別、語音識別、文本分類等領域有大量的研究和進展。

“猜畫小歌”的一些細節和思考
畫圓的不同

筆者研究生階段曾經研究過電腦使用者的異常分析,根據用戶的鼠標軌跡和鍵盤操作等特征建立分類模型識別是不是本人在操作。現在想來,直接拿這個模型來跑之前的任務,應該還不錯。

產品層面,我們還能有些什么創新?

  • AutoDraw:能將你的涂鴉自動升華為美麗的藝術圖像(Google已推出)
  • 繪畫故事:畫4格漫畫,系統自動生成一個故事(這個配合上層的NLG技術應該問題不大)
  • 繪畫打分:為你的繪畫的創新性、技術性、完整性等自動評分

這些繪畫數據還有什么可以挖掘的價值?

繪畫是人在用自己的方式描述自己理解的世界,如果從這些簡單的簡筆畫入手,能夠從中學習出人理解物體和世界的方法,簡單來說可以遷移到目前圖像識別算法的高層抽象階段,提升某些任務的效果;復雜一點甚至可以用作提升機器的推理能力,學習人類對物體和世界抽象建模的能力(腦洞)。

責任編輯:未麗燕 來源: 云加社區
相關推薦

2009-06-25 09:50:32

JSF

2020-02-03 16:03:36

疫情思考

2011-11-30 15:57:18

2012-04-19 10:06:55

微軟Windows 8 E

2020-07-14 09:23:49

安全運營甲方乙方

2018-07-11 14:06:04

數據質量數據治理數據清洗

2017-09-01 12:48:34

DevSecOps安全運維

2017-12-21 07:54:07

2019-09-17 09:21:01

2018-06-14 09:35:35

2011-08-01 10:37:29

軟件項目管理

2021-06-10 10:02:19

優化緩存性能

2017-11-03 09:40:27

數據庫MySQLMHA

2022-02-27 10:13:42

分包Uiniapp項目

2021-01-14 23:24:38

incaseforma蠕蟲病毒

2013-04-19 10:01:19

jQueryJS

2018-07-24 15:46:05

Google反編譯程序

2011-10-26 20:55:43

ssh 安全

2024-10-28 09:02:12

2018-07-23 12:03:01

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日本一区二区三区视频在线 | 中文字幕久久精品 | 在线观看黄色大片 | av中文在线| 欧美一区久久 | 色综合久久伊人 | av手机免费在线观看 | 午夜久草 | 国产精品久久9 | 日日噜噜夜夜爽爽狠狠 | www.亚洲区 | 欧美一区二区免费在线 | 国产精品99久久久久久久久久久久 | 国产成人精品高清久久 | 欧美中文在线 | 亚洲aⅴ| 1级毛片| 91亚洲国产成人久久精品网站 | 国产精品国产三级国产aⅴ浪潮 | 国产日屁 | 久久在线 | 一区二区三区在线 | 欧洲精品码一区二区三区免费看 | 中文字幕乱码一区二区三区 | 国产视频久久久 | 丁香五月网久久综合 | 视频精品一区二区三区 | 精品国产区 | www.久久精品视频 | 国产你懂的在线观看 | 一区在线观看 | 中文视频在线 | 日韩欧美精品一区 | 99视频在线 | 国产精品久久久久一区二区三区 | 一级看片免费视频 | 在线观看日韩 | 亚洲人在线 | 国产精品18hdxxxⅹ在线 | 欧美一级欧美三级在线观看 | 欧美精品一区二区三区在线播放 |