再談JavaScript的數(shù)據(jù)類型問題
提及這個(gè)討論的原因在于argb同學(xué)在我的MSN博客(現(xiàn)在變成了wordproess,在這里)上的一段回復(fù),又更早的起源則是兩年前關(guān)于《JavaScript征途》一書的大討論:
從“裝B被雷劈講起
——這個(gè)事就讓它過去了過去了吧。在討論中我提及到該書對JavaScript類型系統(tǒng)介紹的混亂,而argb翻出了這篇?dú)v史文章,指我的混亂更混亂。于是我列了以下幾個(gè)問題給他:
我想很難很快速地解釋你的問題。那么,接著你的思路,我就問幾個(gè)問題好了:
1、函數(shù)是不是類型?是什么類型?
2、為什么說JavaScript中的函數(shù)是“第一型”的?
3、undefined如何“包裝成object”?即使你所說的是筆誤,那么對于“一切都是對象”的JavaScript,undefined是什么?
4、true與Boolean(true)在類型上有什么不同?
最后強(qiáng)調(diào)一下你的用詞問題:Undefined是類型,undefined是值,’undefined’是類型的名稱。此外,應(yīng)留意JavaScript中存在著值類型與引用類型。
隨后argb的回復(fù)讓我覺得一切已經(jīng)混亂到不得不講的地步。因?yàn)榇饲耙矝]有討論過《JavaScript征途》中的類型系統(tǒng)問題,于是這干脆就補(bǔ)個(gè)功課。下面認(rèn)認(rèn)真真地談?wù)劊岔槺慊貜?fù)了argb同學(xué)。
再次感謝argb。若非如此,我這篇功課還要欠很久。有讀者與朋友們的關(guān)心,總是好的。答疑釋解,于人于已,皆成美事。
再談JavaScript的數(shù)據(jù)類型問題
首先我們談兩點(diǎn)體會(huì)。其一,JavaScript不是純粹的面向?qū)ο笳Z言,它是混合語言,所以所謂“一切面向?qū)ο蟆奔仁切麄饔谜Z,也是一種語言處理技巧。僅從“面向?qū)ο蟆眮砝斫膺@個(gè)語言的類型,會(huì)犯很多錯(cuò)誤。其二,ECMAScript的描述總是很準(zhǔn)確而又遲滯于這門語言的發(fā)展。所以要理解一些現(xiàn)象,既要從JavaScript的歷史中去找,也要考慮到JavaScript現(xiàn)在的發(fā)展。ECMAScirpt是一個(gè)標(biāo)準(zhǔn)的、規(guī)范化的參考,但不是全部。
接下來說說類型。JavaScript既是過程式語言,也是面向?qū)ο蟮恼Z言。這一定程度上,也表現(xiàn)為:它事實(shí)上有兩套類型系統(tǒng)。第一套類型系統(tǒng)是用typeof來識別,這是這個(gè)語言的基本類型系統(tǒng),只有六種類型,即undefined、number、boolean、string、object與function。我一般也稱之為基礎(chǔ)類型系統(tǒng)。之所以稱為“基礎(chǔ)”,是因?yàn)榈诙最愋拖到y(tǒng)是以它為基礎(chǔ),從object這一種類型中發(fā)展起來的,即對象類型系統(tǒng)。
對象類型系統(tǒng)用instanceof來識別,它相當(dāng)于其它高級語言中的is操作/運(yùn)算。面向?qū)ο蟮亩鄳B(tài)主要通過as和is來表達(dá),對于JavaScript來說,由于是弱類型的(沒有強(qiáng)制類型檢查),所以不需要as。
對象類型系統(tǒng)與基礎(chǔ)類型系統(tǒng)存在映射關(guān)系,例如基礎(chǔ)類型的string影射到對象系統(tǒng)中的String。但這只是影射,所以本質(zhì)上來說string類型不是String類型。兩者本質(zhì)上不同。具體來說,undefined,string、number和boolean是“值類型”;object與function是“引用類型”。由于String、Number與Boolean在基礎(chǔ)類型中都屬于object類型,是Object()的子類,因此是引用類型。Function()也是引用類型。所有引用類型都可以看著Object()的子類,所以任意函數(shù)也是Object()的子類。例如"<匿名函數(shù)> instanceof Object"返回true。
undefined是值類型,它沒有對應(yīng)的對象類型——我們通常可以稱之為Undefined類型,但它沒有對應(yīng)的構(gòu)造器。undefined只有一個(gè)值,即undefined。準(zhǔn)確地說,undefined表明聲明(或產(chǎn)生)了但沒有值的變量。而Null也是一個(gè)類型,null是它的惟一值(按照語言規(guī)則,null也是一個(gè)關(guān)鍵字)。Null類型是對象類型,亦即是引用類型。所以Null與Undefined本質(zhì)的不同,是它們分屬在不同的類型系統(tǒng)中,解釋著不同類型系統(tǒng)中的“無”的概念。一般來說,DOM中的某個(gè)屬性或成員如果無值,應(yīng)該使用null;而JavaScript運(yùn)算過程中如果出現(xiàn)無值,應(yīng)該使用undefined。
上面強(qiáng)調(diào)要從“兩套類型系統(tǒng)”的角度來理解上述類型。而這兩個(gè)類型系統(tǒng)在JavaScript中是可以混用的,實(shí)現(xiàn)這一特性的技術(shù)被稱為“類包裝”。這是JavaScript對Java的主要借鑒,也是后來的.NET對Java的主要借鑒之一——類包裝也被稱為“裝箱”(以及“拆箱”)。JavaScript中的類包裝過程出現(xiàn)然屬性存取中,即“.運(yùn)算符”或“[]運(yùn)算符”。當(dāng)這兩個(gè)運(yùn)算符發(fā)現(xiàn)左操作數(shù)x是一個(gè)“值類型”數(shù)據(jù)時(shí),將隱式地調(diào)用Object(x)過程將它轉(zhuǎn)為對象,因此
'abc'.length
這個(gè)運(yùn)算實(shí)際上就等效于
Object('abc').length
最后,我們回到原始的問題上來。所以我說:
JavaScript 里面有6種基本類型,對象是其中一種,各種對象是“對象(object)”這一種類型中的子類(類型)。
是沒有什么錯(cuò)誤的。而朱先生在他的書中說:
- JavaScript 語言只有 3 種最原始的數(shù)據(jù)類型:數(shù)值型、字符串型和布爾型
- JavaScript 還定義了幾個(gè)特殊的數(shù)據(jù)類型,如空類型(null)和未定義類型(undefined)。
- 基本數(shù)據(jù)類型按值傳送,而復(fù)雜數(shù)據(jù)類型按引用傳送。
這幾個(gè)觀點(diǎn)都不太靠譜。其一,這三種是原始的數(shù)據(jù)類型沒錯(cuò),但并不是“只有3種”,這個(gè)稍后一點(diǎn)我再說。其二,空類型與未定義類型這兩種說法都是錯(cuò)的,應(yīng)該是Null類型和Undefined類型——小寫的,是它們的值;首字母大寫才是它們的類型。其三,undefined也是按值傳遞的,然而在朱先生的分類里頭,就不知道如何歸屬。他起碼提到了:原始數(shù)據(jù)類型,特殊數(shù)據(jù)類型,值(傳遞的)類型,引用(傳遞的)類型。這樣復(fù)雜的分類,會(huì)更容易讓讀者混淆。
最后說一下“原始的數(shù)據(jù)類型”。這個(gè)用詞在ECMAScript里面有,稱為"primitive types",但這個(gè)概念主要是從“primitive values"里面引申出來的,而非單獨(dú)作為一個(gè)類型分類的依據(jù)——ECMAScript中只提到過一次primitive type,并且也沒有稱之為“types”。ECMAScript用“primitive values"來說明一些類型的原始值,例如Boolean Types具有原始值true/false。但這并沒有說明Boolean對象類型與值類型之間的差異或關(guān)系,例如不能表明true與Boolean(true)之間有什么不同。
ECMAScript中使用“primitive values",并陳述了這些原始值的定義,主要是ECMAScript要兼顧JavaScript語言的實(shí)現(xiàn)方案。在ECMAScript中相當(dāng)大的一部分是在描述一個(gè)語言的實(shí)現(xiàn),許多地方需要將一個(gè)對象轉(zhuǎn)換成“primitive values",或使用“primitive values"這樣的名詞來講述它的實(shí)際實(shí)現(xiàn)——但我必須強(qiáng)調(diào),這與類型系統(tǒng)的定義與規(guī)劃沒什么關(guān)系。例如ECMA講述“屬性(property)”這一概念時(shí),原文是:
“Properties are containers that hold other objects, primitive values, or functions. A primitive value is a member of one of the following built-in types: Undefined, Null, Boolean, Number, and String; an object is a member of the remaining built-in type Object; and a function is a callable object. A function that is associated with an object via a property is a method.”
翻譯過來就是:
屬性可以包括其它對象、原始值或函數(shù)。一個(gè)原始值(primitive value)是以下內(nèi)建類型的一個(gè)成員(即一個(gè)值,value):Undefined, Null, Boolean, Number, 以及String;一個(gè)對象(object)是其它內(nèi)建對象類型的一個(gè)成員(實(shí)例,instance),函數(shù)(function)是一個(gè)可調(diào)用的對象。如果一個(gè)函數(shù)作為一個(gè)對象的屬性,則我們稱為方法(method)。
上面的描述與“類型系統(tǒng)如何劃分”有什么關(guān)系嗎?沒有。關(guān)鍵在于上列5種原始值,都是可以跨語言來聲明或使用的。然而,要更細(xì)節(jié)地?cái)⑹鲞@一點(diǎn),需要完整地討論ECMAScript如何聲明與實(shí)現(xiàn)語言的全過程。
所以如果將“primitive value"作為類型系統(tǒng)來討論,就會(huì)相當(dāng)?shù)亓钊嘶靵y了。這也是我一開始提出那幾個(gè)問題的原因。
最后,強(qiáng)調(diào)一點(diǎn)。function是類型。所以你提到:
函數(shù)不是類型,函數(shù)是函數(shù),是類型(type)為object的一個(gè)分類(class)
大概是所有混亂的總和了。關(guān)于第一型(first-class data types)的問題就不再講了,以前已講得太多。大家自己翻吧。
原文:http://blog.csdn.net/aimingoo/article/details/6634977
【編輯推薦】