撰稿丨千山
最近,有位同事給我推薦了一款叫做“原神玩家指示器”的拓展腳本。傳說中,只要裝上這個腳本,打開任意一個B站視頻,就可以識別出在評論區發言的網友是否為原神玩家。出于好奇,我試驗了一下,發現的確有點意思。
“原神玩家指示器”腳本信息截圖@Greasy Fork
初衷只是“做著玩”
這款“原神玩家指示器”發布在一個專為用戶提供拓展腳本的論壇Greasy Fork上。作者laupuz xu在公開留言中表示,此拓展腳本主要應用于B站視頻的評論區,安裝了該工具的用戶可以識別出發言的網友是否為原神玩家。
被標注為“原神玩家”的示意截圖@B站
依據動態里是否有原神相關內容,通過腳本篩選、符合條件的網友就會在其昵稱后被標注上“原神玩家”這幾個字。由于作者本人提到自己就是做著玩的、不太會更新迭代,而不足總是存在的,在后續發展中,一眾開發者就在此基礎上,將這個“指示器”玩出了花。
有的開發了能覆蓋B站、微博、知乎在內的多平臺升級版本,更多人跳出了游戲圈,制作了能識別Vtuber的V圈指示器、能識別追星一族的飯圈指示器,甚至還有用戶可以自定義關鍵詞的指示器……..
以其中一款“新·三相之力指示器”為例,這個指示器主要作用在bilibili網頁版中,運作原理也是相似的:通過爬取用戶動態,在視頻評論區的用戶ID后標注出他們的“成分”。所謂“三相”指的是原神、明日方舟和王者榮耀這三款大熱游戲。作者對這段腳本的說明是“B站評論區自動標注三相玩家,依據是動態里是否有三相相關內容”。
我試著操作了一下,就收獲了一堆花花綠綠的“成分”后綴。比如,如果你在動態中沒有提到過這三項游戲,腳本就會在你的用戶名后標注“普通丨純良”;提到過“王者榮耀”,你就會被標注為紫色的“稀有 | 農批”。
被標注的用戶示意截圖@B站
如果既有“明日方舟”又有“原神”,那就成了紅色的“史詩 | 二次元雙象限”;假如三項都提過,那就會被標注為金色的“傳奇 | 三相之力”了。
被標注的用戶示意截圖@B站
不過,無論呈現效果有多么花里胡哨,這類腳本的邏輯都比較簡單粗糙,依然有不少bug尚待消除。比如不少用戶都對【隱藏丨動態抽獎】的篩選機制表示迷惑,此外,還有很多人反饋了一些令人哭笑不得的烏龍現象——某些在動態中留下“還原神奇寶貝”等無關“原神”話題評論的人也會被標記為“原神玩家”。
可以說,這類指示器的娛樂性遠大于其功能性,但初衷只是“做著玩”的腳本工具在一些后續發展中卻漸漸變了味。
灰色的“爬蟲”
在Greasy Fork上,隨手一搜就可以發現各種五花八門的指示器、“成分”檢測器。僅從技術實現來看,這類腳本的開發并不復雜。它的核心奧義就是“爬蟲”技術。
常見的搜索引擎大量使用的就是這種自動抓取網絡數據的程序。曾幾何時,在大數據行業,爬蟲技術更是到了被濫用的地步,甚至有不少大數據公司利用爬蟲技術過度收集、非法竊取和販賣個人數據信息。直到政策收緊和監管加強,這一亂象才被遏制。
爬蟲技術難度不高,技術本身也沒有善惡之分,關鍵還是在于使用者如何去用。什么數據能“爬”,什么數據能“爬”但不該“爬”,用戶知不知情,同不同意,爬到的數據如何做到防竊取,這些問題都需要使用者的謹慎審視和判斷。但也正因為這些問題的答案很多時候都模棱兩可,所以“爬蟲”還是經常游走于灰色地帶。
雖然隨著技術的進步,很多公司都開啟了反爬蟲功能來保護數據安全,但就某些社交娛樂平臺來說,用戶的轉評贊內容、頭像、昵稱、空間動態通常都屬于公開信息,依然可以被爬蟲獲取。“原神玩家指示器”就是利用這一點,通過讀取社交平臺的API數據,抓取用戶在動態和評論中公開發布的信息,再依照設定的匹配規則進行篩選。
用戶有時會主動分享自己的數據,獲得更優質的服務,達成更便捷的交互。但是,這個“度”如何界定?紅線要劃在哪兒?風險如何掌控?太多的疑問有待解決。
目前常用的應對策略是在網站根目錄下放置Robots協議。這一協議旨在建立爬取方和被爬取方之間關于爬取意愿的通用且被遵守的技術規范。Robots協議通常會告訴網絡搜索引擎的漫游器,哪些內容是不應被獲取的,哪些是可以被獲取的。嚴格按照Robots協議爬取網站相關信息一般不會出現太大問題。
如果說Robots更像某種“君子協定”,那么使用爬蟲技術的法律邊界又在哪里呢?上海市檢察院第二分院第三檢察部副主任吳菊萍在公開發文中提到,網絡爬蟲要體現并保持技術的中立性,可以從以下三個方面進行合法性限定:
其一,就爬取對象來說,應當限定為公開數據。
其二,就技術手段來說,網絡爬蟲不應具有侵入性。是否具有侵入性應當從技術本身是否具有侵入性和數據爬取行為是否遵守爬蟲協議與合同約定兩個方面來判定。
其三,從爬取的目的來說,要具有正當性、合理性、公平性。
當然,大部分用戶認為指示器這類工具只是“圖個樂呵”,爬取的數據皆是公開信息,并不牽涉利益目的,而且安裝腳本的用戶規模也不大。如果安裝腳本用戶量激增,對網站的正常運作產生了很大干擾,引起了平臺方的注意,那么開發者和使用者才可能面臨實質性的風險。
當我們被粗暴地“標簽”化
由“原神玩家指示器”的誕生引發的系列連鎖反應中,給陌生網友打標簽的動因頗為值得深究。形形色色的指示器通過自定義的關鍵詞來識別不同的群體,將互聯網陌生人進行群像化分類,對用戶而言,這種“成分”檢測簡單、粗暴,但又在一定程度上完成了某種社交“過濾”。
一方面,通過給他人打“標簽”屏蔽不想看的標簽內容和社交賬戶,就像如今各類社交平臺上常見的屏蔽和拉黑功能,只是這類指示器的篩選更為粗放;另一方面,對在社交媒體上與自己意見相左、好惡不一的陌生人給予一種標簽化的解釋,進而發出“原來他是XX人,怪不得......”之類的感嘆。
但深究一下,這種識別的手段何嘗不是另一種“傲慢”?分辨“道不同不相為謀”的對象,防止陷入無意義之爭的初衷沒問題,但通過給他人打標簽、戴帽子的手段進行鑒別,不過又是一種二極管思維的強化。此外,將看不慣的個人歸入某個群體,也會加深人們對某個標簽化群體的厭惡情緒。
當下的互聯網環境中,在對某件事發表觀點、展開討論的時候,首先關心的不是事件真相,而是先查詢對方的“成分”成了某種趨向,將對方納入某個標簽,似乎更有利于己方站在道德的高地。在試驗指示器腳本的過程中,我發現已經有不少人指出了這種危險。
某個指示器的開發者如是說:
截圖@Greasy Fork
某腳本討論區的用戶更是直言不諱:
截圖@Greasy Fork
紀錄片The Social Dilemma 中提到:“我們用互聯網技術創造了全球一整代人,他們成長的背景中,彼此之間的交流,文化中都滲透著操縱的鬼影。”標簽化可能就是互聯網思維對于人的一種異化。只要有賬號存在的地方,我們所見、所聞、所行、所買,凡是留下的痕跡都被視作數據,“喂”給算法,機器通過tag分門別類,再進一步“投其所好”。如何避免習慣于這種馴化或許才是我們每個具體的人應該思考的問題。
參考鏈接:
??https://www.pingwest.com/a/270659??
??https://baijiahao.baidu.com/s?id=1744114153150546502??