AI朋克致敬MNIST:只用Python和開發(fā)板,制作永不重樣的時(shí)鐘
是的,有了這面鐘,這輩子都離不開 MNIST 手寫數(shù)據(jù)集了。
我們見慣了上古時(shí)代,由電子管組成的時(shí)鐘。在 AI 時(shí)代,有沒有更加新潮的時(shí)間顯示方式?是的,數(shù)據(jù)集也能做成時(shí)鐘,每天早上,讓 MNIST 手寫數(shù)字喚醒你一天的記憶。
MNIST 是計(jì)算機(jī)視覺中不老的經(jīng)典,當(dāng)?shù)谝淮矸e神經(jīng)網(wǎng)絡(luò)在這個(gè)手寫數(shù)字?jǐn)?shù)據(jù)集上綻放出耀眼的光芒,它注定會(huì)載入「史冊(cè)」。
盡管目前計(jì)算機(jī)視覺已經(jīng)早就走出了 MNIST 數(shù)據(jù)集的時(shí)代,甚至連一千多萬(wàn)圖像的 ImageNet 也不再是非常大的一個(gè)圖像數(shù)據(jù)集。然而,MNIST 仍然不可忽視,深度學(xué)習(xí)入門的第一個(gè)數(shù)據(jù)集、驗(yàn)證算法的第一個(gè)實(shí)驗(yàn)都是它。甚至連 Hinton 驗(yàn)證 Capsule 這個(gè)想法的數(shù)據(jù)集都用的它。
如果說想要致敬這樣的數(shù)據(jù)集「先驅(qū)」,你會(huì)采用什么樣的方式?在 GitHub 中,機(jī)器之心發(fā)現(xiàn)一個(gè)有意思的小項(xiàng)目,作者 Dheera Venkatraman 做了一面鐘,里面的數(shù)字都是從 MNIST 數(shù)據(jù)集中采樣的。
項(xiàng)目地址:https://github.com/dheera/mnist-clock
也就是說,24 小時(shí)隨機(jī)抽萬(wàn)張不同的手寫數(shù)字,每天都不帶重樣。做出來的效果是這樣的:
這樣的電子鐘只需要簡(jiǎn)單的電路板再加上 4 塊電子墨水屏就行了,它背后的樣子是這樣的:
硬件
項(xiàng)目使用了 TinyPICO 開發(fā)板;緊湊的 ESP32 板以及大量的 GPIO 插腳、4MB 閃存、Wi-Fi,以及其他很多功能。TinyPICO 可以說是目前世界上基于 ESP32-PICO-D4 體積最小的開發(fā)板,240 MHz 的 32 位雙核處理器足夠我們完成計(jì)算。
4 塊 e-link 數(shù)字顯示器,之所以選擇 e-link,是因?yàn)樗鲜謱憯?shù)字的概念,在任何光線條件下都能正常運(yùn)行,而且也不至于打擾到任何人。Waveshare 的 e-link 顯示屏大部分是 SPI,雖然也有些額外的引腳。大部分人會(huì)希望一塊只包含 SPI 以及一塊 CS 插腳,但多一些的鏈接器是有必要的。下面是 ESP32 的連接圖,根據(jù)這個(gè)把電線卷起來。
作者在 TinyPICO 上使用的是兩個(gè) 10-引腳的 JST-EH 的連接器,JST-EH 比 JST-XH 使用更低的配置,更適合插入,以及比標(biāo)準(zhǔn)引腳更短更安全。
JST-EH 連接器所連接的 TinyPICO
下面,再見硬件固定在 3D 打印的外殼上,就大功告成了:
如果讀者們對(duì)硬件不熟悉,那也不要急,我們只要按照項(xiàng)目作者給出的硬件,并裝配好就行了。后面我們會(huì)介紹所有「裝備」的價(jià)格以及作者提供了設(shè)計(jì)圖。
軟件
項(xiàng)目作者 Dheera Venkatraman 表示,他經(jīng)常寫 C++或者 C,但他對(duì) MicroPython 非常有興趣,因此在這個(gè)項(xiàng)目中采用的就是它。
項(xiàng)目作者使用每像素 2 比特的灰度深度來表示 MNIST 手寫數(shù)字。在這種比特深度下一張 28*28 像素的圖像只需要 196 字節(jié),因此一個(gè) 4MB 的閃存就能滿足整個(gè) MNIST 驗(yàn)證集。如果你想把整個(gè)數(shù)據(jù)集都裝進(jìn)去,那么也只需要換閃存更大的微控制器、或者使用 1 比特深度的圖像、或者使用壓縮方法等。
將所有文件放在 TinyPICO 根目錄中的/ code 中,正確的文件大概如下圖所示。
另外,我們還需要為 Wi-Fi 創(chuàng)建一個(gè)名為.wifi 的文件,中間寫上 yourssid 與 yourpassword,具體的讀取 WIFI 設(shè)置的代碼就如下所示。
項(xiàng)目作者 Dheera Venkatraman 在 GitHub 中提供了所有代碼文件,打印鐘表數(shù)字的代碼也非常易讀。更友善的的是,作者的代碼提供了非常完善的注釋,基本重要的語(yǔ)句都有解讀。
現(xiàn)實(shí)一點(diǎn),做一塊多少錢?
如果從硬件來看,似乎主要成本就是 TinyPICO 開發(fā)板以及四塊 e-ink 屏。首先 TinyPICO 在淘寶或者國(guó)外網(wǎng)站都能買到,國(guó)外賣 20 美元,而淘寶上標(biāo)價(jià) 235 元,加上運(yùn)費(fèi)其實(shí)也差不多。此外,讀者也可以選擇專門的元器件商城,其價(jià)格也在 200 塊左右。
其次,一塊 e-ink 屏大概 24 美元,雖然淘寶找不到,但是國(guó)內(nèi)的元器件商城要便宜得多,一塊只需要 92 元左右,可能樹莓派對(duì)它的需求比較大吧。
其它的成本就比較少了,線材、連接器裝時(shí)鐘的外包裝都比較容易獲得,在國(guó)內(nèi)的元器件商城也可以一次性買到。如果讀者想 3D 打印外包裝,作者也提供了具體的打印參數(shù)。所以,總的來說,制作成本應(yīng)該是低于 650 元的,其中開發(fā)板和電子屏都可以在其它項(xiàng)目中再利用。
也許我們還能改進(jìn)該項(xiàng)目作者的實(shí)現(xiàn),在一塊大的墨水屏上實(shí)現(xiàn)數(shù)字時(shí)鐘,直接使用更常用的樹莓派作為主板(功耗遠(yuǎn)高于 TinyPICO),并實(shí)現(xiàn)更多的能力,例如實(shí)時(shí)采樣個(gè) CIFAR-10 作為背景??傊?,MNIST 數(shù)字時(shí)鐘還有很多可以玩的地方。
最后,所有硬件與軟件的詳細(xì)信息都可查閱原項(xiàng)目。此外,值得一提的是,Dheera Venkatraman 還是非常有意思的一位小哥哥,他從杭州到北京沿著人類歷史上最長(zhǎng)的人工河靠自行車騎了 1600 公里。
Last But Not Least
確實(shí) MNIST 站在舞臺(tái)中央的時(shí)代已經(jīng)過去了,但它的作用仍然不可忽視,仍然有很多研究者致力于改進(jìn)并修復(fù)它,做出獨(dú)特的貢獻(xiàn)。
2017 年,德國(guó)時(shí)尚科技公司 Zalando 提供了 Fashion MNIST 數(shù)據(jù)集,它的大小、格式和訓(xùn)練集 / 測(cè)試集劃分與原始的 MNIST 完全一致,從 MNIST 遷移到它,我們不需要修改任何代碼。
去年 6 月份,NYU 和 Facebook 的研究者重建并擴(kuò)展了 MNIST 數(shù)據(jù)集,在測(cè)試集中新增了 50000 個(gè)樣本,將測(cè)試集增加到 6 萬(wàn)樣本。MNIST 作者之一的 Yann LeCun 表示,「如果多次使用原版的 MNIST 測(cè)試集,你的模型可能在測(cè)試集上已經(jīng)過擬合了,是時(shí)候在新增的樣本上試一下了。」
不論是將 MNIST 做成日常生活中好看又好玩的項(xiàng)目,還是提升數(shù)據(jù)集本身的能力,MNIST 一直都會(huì)是活著的歷史~