GitHub中文趨勢(shì)榜第一!「2020新冠肺炎記憶」項(xiàng)目已獲4.9K星標(biāo)
這兩天,又一個(gè)關(guān)于新冠肺炎的 GitHub 登上了中文趨勢(shì)榜的首位,截至目前,已經(jīng)收獲近 5K Star,600+ Fork。
項(xiàng)目介紹
nCovMemory 項(xiàng)目的中文名稱是「2020新冠肺炎記憶:報(bào)道、非虛構(gòu)與個(gè)人敘述」,創(chuàng)立該項(xiàng)目的目的是為研究人士提供方便自然語(yǔ)言處理、疫情防治取用相關(guān)資料的資料庫(kù)。
資料庫(kù)中收錄了 2020 年新型冠狀病毒感染的肺炎相關(guān)媒體報(bào)道、非虛構(gòu)作品和親歷者個(gè)人敘述。所有的內(nèi)容均來(lái)源于網(wǎng)絡(luò),一個(gè)完整的條目從可信的信源收錄內(nèi)容,包括日期、標(biāo)題、原始 URL、截圖、archive 等要素,并且暫時(shí)不收錄評(píng)論、分析、科普等類別的作品。
項(xiàng)目的具體結(jié)構(gòu)如下:
- ├─archive 文章的存檔,目前提供jpg格式│
- └─jpg│ ├─1.jpg│ └─...├─data
- csv格式的文章數(shù)據(jù)│ └─data.csv├─docs
- 一個(gè)用于展示README的github page├─gh-
- page├─template README模板│
- └─README.handlebars├─utils 構(gòu)建README
- 的工具│ ├─generateReadmeFromCsv.js│ └─...└─README.md
- 主文檔
項(xiàng)目意義何在?
毫無(wú)疑問(wèn),這次的疫情已經(jīng)成為了一場(chǎng)全民戰(zhàn)爭(zhēng)。從最開(kāi)始的武漢加油到現(xiàn)在的中國(guó)加油,我們不停的討論著疫情的發(fā)展。
我們會(huì)為在疫情中失去生命的人員痛惜,為醫(yī)護(hù)人員、抗疫一線人員的奉獻(xiàn)精神所感動(dòng);我們會(huì)自我隔離、隨時(shí)佩戴戴口罩,這些都是我們力所能及的小事兒,但我們每一個(gè)人都在為抗疫勝利而努力。
但不管最終結(jié)果如何、疫情何時(shí)結(jié)束,這都是一段在我們心中無(wú)法忘卻的歷史,而我們能做的,就是通過(guò)記錄完整的事件歷程,通過(guò)大數(shù)據(jù)分析來(lái)得出一些相關(guān)結(jié)論,避免悲劇的再次發(fā)生。這也是大數(shù)據(jù)給我們帶來(lái)的價(jià)值之一。
我們前幾日推送的文章《數(shù)據(jù)模型分析告訴你,現(xiàn)在還不是出門的時(shí)候》中,作者用數(shù)據(jù)分析告訴來(lái)我們,控制人口流動(dòng)對(duì)疫情防治的重要性。
而 GitHub 上的這個(gè)項(xiàng)目,憑我個(gè)人的理解,可以利用 AI 來(lái)分析網(wǎng)站、新聞報(bào)道和社交媒體中關(guān)于新型冠狀肺炎的報(bào)道,通過(guò)自然語(yǔ)言處理來(lái)解析社交媒體上發(fā)布的文本,根據(jù)新聞發(fā)生的先后順序,來(lái)分析真新聞、假新聞,分析事件之間直接或間接的聯(lián)系,從而得出一些結(jié)論和歸因。
我相信這些信息對(duì)于專業(yè)的認(rèn)識(shí)和團(tuán)隊(duì)一定有更多、更大的用途。
對(duì)于這次疫情控制工作,相關(guān)的信息已經(jīng)變得越來(lái)越透明,我們期待看到更多的好消息和正面消息,但對(duì)于事件中那些可能做的不好的地方,我們記錄下來(lái)的初心也是為了讓這個(gè)國(guó)家更好、讓人民更幸福。
「2020新冠肺炎記憶:報(bào)道、非虛構(gòu)與個(gè)人敘述」GitHub 項(xiàng)目地址: https://github.com/2019ncovmemory/nCovMemory
更多人在行動(dòng)
除了「nCovMemory」之外,其實(shí)還有很多項(xiàng)目值得我們關(guān)注和 Star。我司技術(shù)大大 @joyqi 就用公開(kāi)數(shù)據(jù)記錄了疫情的發(fā)展趨勢(shì),來(lái)便于自己和大家從中分析更多有價(jià)值的信息:
項(xiàng)目地址:https://github.com/joyqi/ncov2019
許多網(wǎng)友也在做報(bào)道、個(gè)體敘述、網(wǎng)上輿論的整理和記錄,如:
1.2020 Wuhan Individual Stories
- https://github.com/jiayiliujiayi/2020nCov_individual_archives
備份普通人在疫情期間的記錄,主要來(lái)自豆瓣,未來(lái)可能有所擴(kuò)增。
2.疫情之下的勞動(dòng)者——中文媒體報(bào)道收集(持續(xù)更新)
- https://note.youdao.com/ynoteshare1/index.html?id=eee7c8c3d7b8b054dc94d8abd1a211d8&type=note
整理了勞動(dòng)者們?cè)谝咔橹械乃魉鶠椤0葱袠I(yè)編排。
3.疫情與輿情:武漢新冠肺炎時(shí)間線TIMELINE
- https://github.com/Pratitya/wuhan2020-timeline
記錄自2019年12月起武漢新冠肺炎疫情進(jìn)展的時(shí)間線。以社會(huì)學(xué)年鑒模式編撰。
4.Academic2019-nCoV
- https://github.com/Academic-nCoV/2019-nCoV
每日發(fā)布疫情相關(guān)的海外學(xué)術(shù)、非學(xué)術(shù)信息。
此次武漢疫情通報(bào)所帶來(lái)的恐懼,遠(yuǎn)比通報(bào)本身的內(nèi)容蔓延得更快。多個(gè)城市陸續(xù)通報(bào)新型冠狀病毒的病例數(shù)據(jù),使大家對(duì)各種預(yù)防方法越來(lái)越關(guān)注。
但是,很多不正確的預(yù)防方法,也在這種時(shí)候混淆視聽(tīng),甚至使人忽視了正確的應(yīng)對(duì)方法。