繁體中文與世界語

我想很多想從事網頁開發的人,用到繁體中文(big5編碼)中的「生『銹』、草木和『稭』、一『刹』那」等字,因不能正確展示在瀏覽器(在Win XP即為IE)上,而放棄跨進網頁的的工作。因為我差一點就也是如此,但我想天大困難也許就是天大進步的開始,於是上網找答案,得到許多無從下手的「指示」或是「明示」後仍然不能解決問題,我繼續纏鬥了近二個月,沒吃一粒蠶豆(纏鬥),終於懂了個大概。解決之道就是放棄繁體中文big5編碼設計而改用utf-8編碼(是統一編碼unicode的一種)。

現在這一問題對會家子而言是小事一件了,但使我對「合一」的觀念產生了莫大的崇敬。你知道為何Word工具可以支援big5編碼?因為它採用了「統一編碼unicode」,把big5編碼所不能產生的怪字「銹、稭、刹」等也都包括進去,所以你可以在Word工具上看見「銹、稭、刹」等字。

我想到翻譯人員是促進合一的好工作,但也只能會幾種語言,統一編碼之偉大是何?它企圖把世界各語言都包括進來,文字翻譯、言語翻譯則可由電腦擔任。或有人以為現在的電腦翻譯的真差勁,請包含一下,若大家天天不要抱怨、吵架,有人讓你滿意的這一天會提早來到。國家的人力、物力資源都耗到那去了?是人的自私阻礙了進步!

繁體中文big5編碼容量為216,即2的16次方,可編65,536個字,容不下世界各語系,而統一編碼unicode容量為232,即可容下2的32次方的字,可編429,4967,296個字,就是一解決問題的科學方法,技術上是使用1~4bytes編碼,1byte表示有28獨立編碼能力,將有「撞碼」的世界語言文字分開,英語字母仍保留在1byte以內,輸入沒有換碼的困擾,但在設計網頁時,對檔名及路徑都不要以中文取名,以免文件中存取處也要轉碼。

有些人對「統一」很感冒,換個「合一」名詞如何?為何我們不敢合中國人的一?我們還應該要合各國人的一,對立總是不能解決問題!我一向是「神愛世人」的,或許我潛意識是喜歡金髪的美(國)人?

現在大家都已叫它為統一碼unicode,若我們不堅持使用big5碼,可消除轉碼的困擾、節省時間,又可培養許多網頁設計高手。

2006.05.05