Re: [心得] 時の淚:Unicode補完計畫
看板NIHONGO (日語板)作者but (←殺千刀的UAO始作俑者)時間14年前 (2011/12/05 23:09)推噓38(38推 0噓 39→)留言77則, 42人參與討論串2/2 (看更多)
: 雖然這個跟日文版沒有什麼關聯
: 不過在使用日文字普遍的這個版上
: 還是希望寫一篇來警惕一些剛想學日文的人
: 可能會遇到打日文字的問題
雖然跟日文版沒有關連
但是身為作者 實在無法接受作品被反覆的造謠
所以該澄清的還是要澄清
先說清楚 我是Unicode補完計畫第一版作者
自己現在用Win7 沒有裝Unicode補完計畫
但無論是PCMAN、Pietty、Firefox
或多或少都「內建」了Unicode補完計劃的字碼表
無論你有沒有用Unicode補完計畫
能夠使用PCMAN在BBS上看到日文漢字
這字碼表 確實是我們Unicode補完計畫小組一個字一個字定出來的
(Unicode補完計畫的範圍不只是假名而已
他在BIG5中定義了SJIS跟GB2312的所有漢字)
: 直到Windows98時代前期
: 台灣人開始希望能寫日本字
事實上 台灣一直有處理日文的需求
從DOS時代開始 倚天中文系統就內建了假名
市面上暢銷的中國海字集收錄了大量日文漢字
很可惜的微軟放棄了假名部分 才造成之後問題連連
: 這時候就有人想到
: 那麼為什麼不直接在BIG5的字典表中
: 加入那些日本字呢?
: 沒錯
: 這就是Unicode補完計畫的誕生
不 直接在BIG5中加入日文
是傳統的造字檔方法 也就是櫻花輸入法之類的
從 Windows95 時代就有
: 這也是在Windows98下最普遍的日文輸入法
: 因為你的電腦並沒有內建各國輸入法
其實有 Microsoft Global IME(JP) 可以裝.....
不過只能在 IE 裡用就是了
: 一直到WindowsXP時代
事實上 Unicode 補完計畫是在 2001年的時候
針對 Windows XP 開發的
Windows 95/98/ME 是 DOS 架構的 Windows
系統底層是用 ASCII 處理的(1位元字碼)
Windows NT/XP/2003.... 是 NT 架構
系統底層是用 Unicode 運作的 也就是國際碼
雖然底層改成 Unicode
但大多數的軟體、舊文件,都還是 BIG5 的
所以BIG5跟Unicode兩種不同的字碼 不可能說換掉就一口氣換掉
實際上 Windows XP 無時無刻在做這兩種編碼之間的轉換
但是因為微軟放棄了BIG5裡的假名
所以櫻花輸入法的假名會被轉換到Unicode的造字區
Unicode 補完計畫真正做的事情是
換掉系統預設的 Unicode <=> BIG5 互相轉換表
把 BIG5 日文字區的字碼 轉換到正確的 Unicode 日文字區
: 就算是把各國的資訊都安裝進去,基本上也沒有什麼問題
: 所以可以接受跟顯示日文字
網速之類的問題不大 主要是系統底層架構的影響
: 這時候會發生什麼問題
: 你的電腦多出來安裝的東西
: 當初日本人沒有裝
: 就算他看得到繁體中文字的BIG5編碼
: 你在後面加上去的那些字庫他是沒有的
: 所以她看不到
Unicode補完計畫所做的事情是調整轉換表
而不是像櫻花輸入法一樣 在造字區把日文字型塞進去
所以安裝以後 在正確的Unicode環境下
BIG5日文會被正確轉換成Unicode的日文
如果日本人看不到 只有一個原因
就是你傳送了BIG5編碼的文件
: 接著,你電腦中所有的檔案
: 檔名都已經換成BIG5的日文字
不會
Windows XP 的檔案系統 NTFS 是用 Unicode 儲存檔名 不是 BIG5
事實上
Unicode補完計畫所提供的檔名軟換工具
是把檔名裡的假名 從Unicode造字區改成正確的Unicode日文假名
因為當年像Winamp之類的軟體 無法開啟本地編碼缺字的檔名
所以才會寫這個功能
: 最後Unicode補完計畫雖然支援文件的轉換還原
: 一般人找不到方法去還原他
事實上是
我們本來就評估過 時代會漸漸走向軟體支援開啟所有Unicode檔名的檔案
所以把檔名轉換工具設計成不建議轉回來
試問 在這個時代
有什麼時候需要把正確Unicode日文轉回造字區的假日文呢?
: 辛辛苦苦存的Word,歌詞之類的,就是會消失
Word 是用 Unicode 儲存的
會出問題的是櫻花輸入法
使用 Unicode 補完計畫的日文不會有問題
: 到了WindowsXP的時候
: 只要使用AppLocale就可以解決多數問題(除非鎖日Win系統)
AppLocale 的真正用途
是用來解決 在Unicode環境<=>Big5對應下 想要執行SJIS的軟體
也就是平常用的是中文
所以把Windows XP定義成地區編碼預設轉換成BIG5模式
但又想執行SJIS的軟體 想只針對這個軟體 預設Unicode與SJIS互相轉換
但這不能解決BIG5環境的問題
要說還有什麼BIG5環境 主要就是BBS... 就是這個ptt
: 這是Windows就有內建的東西
: 也是日本人打字用的東西
: 也是最正規的東西
所以Unicode補完計畫一向提倡使用MS-IME
而且隨著Unicode補完計畫安裝的Unicode補完計畫版本櫻花輸入法
也是吐出正確的Unicode字碼
: 如果存成Unicode還是UTF-8就沒有這個問題
: 那些存成ANSI的各國種類的文字檔都將不復存在
我同意時代終於走到BIG5越來越少的時候了
但要完全離開BIG5還是有困難的
一來是最難解的BBS (ptt本身就是完全的BIG5環境)
另一來是很多文字編輯器(像記事本) 預設還是存BIG5
: 因此
: Unicode補完計畫雖然稱為Unicode補完計畫
: 但是他補完的對象是Unicode
: 並不是代表他建構在Unicode上
Unicode補完計畫是建構在WindowsNT架構會不停進行Unicode<=>ANSI互換的前提下
調整Unicode<=>BIG5的對應關係
實際上沒有修改到Unicode編碼表
可以說是有大量修改了BIG5的編碼
: 但是自從WindowsXP左右
: 他就是時代的眼淚
他是WindowsXP時代的產品
雖然後來Unicode補完計畫有硬搞出Win98的版本
不過限制非常大
基本上還是比較適合WindowsNT
: 甚至中文字都出來了日文字就是亂碼
: 那麼這個可能就是來自Unicode補完計畫出來的毒
: 不要想了,扔掉吧
不一定
也很有可能是櫻花輸入法或中國海字集之類的BIG5文件
而且 根據現在最新的國家標準(BIG5-2003)
日文假名是BIG5的一部分
反而是微軟版本的BIG5不合標準
再者 BBS上的假名跟日文漢字 到現在還是用BIG5儲存的
無論你是裝Unicode補完計畫 還是用PCMan或Pietty
能看到這些字 都是靠Unicode補完計畫定義的對應關係
: 那麼請直接重灌電腦
: 並且花很長的心力去復原你的文件
: 這是陣痛期,痛過了就沒事了
: 你即將跟世界接軌
事實上 因為微軟拿掉了BIG5裡面的日文假名
才造成後來一堆各式各樣的問題
傳統的解法就是用造字區解決
大家使用一樣的造字表 就都夠看得到一樣的字
但這些字在Unicode裡其實都有
當時代進入Windows XP後
BIG5造字區裡的假名 也被對應到Unicode的造字區
Unicode補完計畫用很特殊的方法嘗試解決這問題
就是把BIG5的造字區 對應到Unicode正確的日文區
這麼一來就能達到我們認為還算理想的結果
1. 在BIG5環境下,跟傳統的造字區解決方案相容
2. 在Unicode環境下,跟正確的日文字區相容
Unicode補完計畫一開始的設計目的
就是為了試著讓BIG5造字區裡的日文 能盡快跟Unicode裡正確的日文字區接軌
要說這是活在象牙塔裡 這是不公平的
如果你使用Unicode補完計畫
後來很小心自己文件都以 Unicode (包括UTF-8) 儲存
那麼Unicode補完計畫剛好是把舊的櫻花輸入法造字資料
協助轉換成Unicode正確日文的幫手
(副作用就是愛存BIG5的話,也會很拿手地將Unicode日文存成BIG5造字日文....)
雖然我不能否認說
一方面這也造成了BIG5日文文件的持續使用
但至少在Unicode補完計畫的協助下
不會讓這些造字日文擴散到Unicode環境裡
如果現在你還在使用櫻花輸入法方案
那你從BBS所複製的日文 存在Word裡 他都仍然是Unicode造字區
是因為Unicode補完計畫/PCMan/Pietty 把它正確對應到Unicode日文區
所以安裝Unicode補完計畫/PCMan/Pietty之後
BBS裡的日文才能跟Unicode正確的日文完全接軌
: Unicode補完計畫
: 之所以後來會被稱為補不完計畫
: 不是沒有原因的
我自己是沒碰到什麼問題啦
確實我自己會很小心盡量存 Unicode 就是了
因為我自己現在會用到BIG5的情況只剩BBS了
所以我選擇沒安裝Unicode補完計畫 只裝個PCMan解決
但這仍然是Unicode補完計畫的延長線
裝PCMan可以看到BBS的日文 不是因為ptt支援Unicode了 或是PCMan支援Unicode了
而是因為PCMan把Unicode補完計畫的那張Unicode<=>BIG5對應表內建進去了
只是根據這份表進行對應的範圍 從整個系統侷限到一個軟體裡了而已
另外可見以前寫的說明
http://blog.chweng.idv.tw/archives/90
我會回這一篇 並不是要勸人裝
我自己現在也沒有需要 就沒裝了
只是不能接受整篇的誤解 該更正的時候還是要更正一下
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.36.151.172
推
12/05 23:10, , 1F
12/05 23:10, 1F
推
12/05 23:15, , 2F
12/05 23:15, 2F
推
12/05 23:24, , 3F
12/05 23:24, 3F
推
12/05 23:25, , 4F
12/05 23:25, 4F
推
12/05 23:33, , 5F
12/05 23:33, 5F
推
12/05 23:50, , 6F
12/05 23:50, 6F
推
12/05 23:54, , 7F
12/05 23:54, 7F
推
12/06 01:23, , 8F
12/06 01:23, 8F
推
12/06 05:43, , 9F
12/06 05:43, 9F
→
12/06 05:43, , 10F
12/06 05:43, 10F
推
12/06 09:06, , 11F
12/06 09:06, 11F
推
12/06 10:04, , 12F
12/06 10:04, 12F
推
12/06 11:38, , 13F
12/06 11:38, 13F
推
12/06 11:42, , 14F
12/06 11:42, 14F
→
12/06 11:42, , 15F
12/06 11:42, 15F
→
12/06 11:43, , 16F
12/06 11:43, 16F
→
12/06 12:18, , 17F
12/06 12:18, 17F
→
12/06 12:18, , 18F
12/06 12:18, 18F
→
12/06 12:20, , 19F
12/06 12:20, 19F
→
12/06 12:20, , 20F
12/06 12:20, 20F
推
12/06 12:41, , 21F
12/06 12:41, 21F
→
12/06 12:53, , 22F
12/06 12:53, 22F
→
12/06 12:53, , 23F
12/06 12:53, 23F
→
12/06 12:53, , 24F
12/06 12:53, 24F
→
12/06 12:53, , 25F
12/06 12:53, 25F
→
12/06 12:54, , 26F
12/06 12:54, 26F
→
12/06 12:54, , 27F
12/06 12:54, 27F
→
12/06 12:54, , 28F
12/06 12:54, 28F
→
12/06 12:55, , 29F
12/06 12:55, 29F
→
12/06 12:55, , 30F
12/06 12:55, 30F
→
12/06 12:55, , 31F
12/06 12:55, 31F
→
12/06 12:55, , 32F
12/06 12:55, 32F
→
12/06 12:55, , 33F
12/06 12:55, 33F
→
12/06 12:55, , 34F
12/06 12:55, 34F
→
12/06 12:56, , 35F
12/06 12:56, 35F
→
12/06 12:56, , 36F
12/06 12:56, 36F
→
12/06 12:57, , 37F
12/06 12:57, 37F
→
12/06 12:57, , 38F
12/06 12:57, 38F
推
12/06 14:56, , 39F
12/06 14:56, 39F
推
12/06 16:40, , 40F
12/06 16:40, 40F
推
12/06 17:10, , 41F
12/06 17:10, 41F
推
12/06 20:06, , 42F
12/06 20:06, 42F
推
12/06 20:43, , 43F
12/06 20:43, 43F
推
12/06 21:33, , 44F
12/06 21:33, 44F
推
12/06 21:54, , 45F
12/06 21:54, 45F
推
12/06 22:09, , 46F
12/06 22:09, 46F
推
12/06 22:24, , 47F
12/06 22:24, 47F
推
12/06 22:31, , 48F
12/06 22:31, 48F
推
12/06 22:43, , 49F
12/06 22:43, 49F
→
12/06 23:29, , 50F
12/06 23:29, 50F
→
12/06 23:29, , 51F
12/06 23:29, 51F
→
12/07 00:16, , 52F
12/07 00:16, 52F
→
12/07 00:16, , 53F
12/07 00:16, 53F
→
12/07 00:17, , 54F
12/07 00:17, 54F
→
12/07 00:19, , 55F
12/07 00:19, 55F
→
12/07 00:22, , 56F
12/07 00:22, 56F
→
12/07 00:38, , 57F
12/07 00:38, 57F
→
12/07 00:39, , 58F
12/07 00:39, 58F
→
12/07 00:39, , 59F
12/07 00:39, 59F
推
12/07 01:06, , 60F
12/07 01:06, 60F
推
12/07 01:30, , 61F
12/07 01:30, 61F
推
12/07 03:13, , 62F
12/07 03:13, 62F
推
12/07 03:23, , 63F
12/07 03:23, 63F
推
12/07 11:58, , 64F
12/07 11:58, 64F
推
12/07 16:53, , 65F
12/07 16:53, 65F
推
12/07 17:25, , 66F
12/07 17:25, 66F
推
12/07 18:35, , 67F
12/07 18:35, 67F
推
12/09 12:32, , 68F
12/09 12:32, 68F
→
12/09 12:33, , 69F
12/09 12:33, 69F
推
12/09 13:50, , 70F
12/09 13:50, 70F
推
12/12 16:07, , 71F
12/12 16:07, 71F
推
12/14 11:51, , 72F
12/14 11:51, 72F
→
12/14 11:54, , 73F
12/14 11:54, 73F
推
04/13 12:35, , 74F
04/13 12:35, 74F
→
08/06 14:12, , 75F
08/06 14:12, 75F
→
09/07 01:18, , 76F
09/07 01:18, 76F
→
12/02 20:11,
7年前
, 77F
12/02 20:11, 77F
討論串 (同標題文章)
NIHONGO 近期熱門文章
PTT職涯區 即時熱門文章
12
17