詳解如何在Lua腳本中使用Unicode
如何在lua腳本中使用Unicode是本文要介紹的內容,主要是來學習Unicode在lua腳本中如何使用,具體內容來看本文詳細內容講解。說說最近的幾個事情:
1、project采用lua,ui模塊肯定是要徹底使用utf-16的,可是lua不支持,怎么辦?***好像是寫了userdata,可以將multibytes轉成utf-16保存在這個userdata中;接著為了保證字符串相同的userdata做key時是相同的,于是又添加了相應的避免重復功能;***還為這個userdata在gc方面作了保證。
2、google:lua unicode,會發現一份通過table使用unicode的文章傳得很廣,實際上很不實用——需要工具,字符串不可讀。
3、魔獸世界的lua腳本保存格式為utf-8,他的腳本中有一段是直接寫文字信息的,所以這種保存格式比較有利。
4、看過戰錘OL的插件,無意中看到類似 s = L"戰錘OL" 的代碼,心想難道lua支持unicode了?試了一下發現沒有,于是覺得是不是他們的程序修改了lua的parser了。不久后的現在,腦袋終于開竅了。
其實不少實力派的前人早就強調過lua在unicode方面的解決方案了:lua string是一個raw buffer,可以存放任意數據。這個說法雖然正確卻太抽象,因為他們都沒有交代過具體的實現手法。
我們想要的所謂支持unicode的lua,到底是什么意思呢,最基礎的大概就是能像c那樣,用L作為字符串的前綴,并能將字符串賦值到變量上,就像上面的
- s = L"戰錘OL"
注意這句代碼,你看出什么了嗎?再明確一些
- s = L("戰錘OL")
感謝lua這種可忽略的寫法,可以讓lua寫一些很漂亮的內容,除了string,還有table。
只要L是一個函數,接受multibytes字符串作為參數,轉化為utf-16,然后將utf-16的字符串交給lua string,壓棧。
這里要回頭說說最上面所說的project,我不需要userdata了,因為他可以是一個lua string,相同的字符串做key的同質性?gc?通通都交給lua string吧,這里沒你的事了。
***,貼一下代碼,收功
- int utf8_to_utf16(lua_State* L)
- {
- size_t n = 0;
- char* str = (char*)luaL_checklstring(L, -1, &n);
- if(!str)
- return 0;
- iconv_t h = iconv_open("utf-16", "utf-8");
- if(0==h)
- return 0;
- char wstr[4096];
- size_t wn = 4096;
- char** ppsrc = &str;
- char* dst = wstr;
- char** ppdst = &dst;
- int ret = iconv(h, ppsrc, &n, ppdst, &wn);
- if(ret==-1 || wn<0 || n>0)
- {
- iconv_close(h);
- return 0;
- }
- iconv_close(h);
- lua_pushlstring(L, (char*)wstr, (4096-wn));
- return 1;
- }
- //here here
- lua_register(L, "L", utf8_to_utf16);
小結:詳解如何在lua腳本中使用Unicode的內容介紹完了,希望通過本文的學習能對你有所幫助!