Unicode9.0字元一覽有感 [論壇 - Ubuntu 哈啦]


正在瀏覽:   1 名遊客


 到底部   前一個主題   下一個主題  [無發表權] 請登錄或者註冊

« 1 ... 3 4 5 (6) 7 8 »


回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 589
MP : 245 / 12373
EXP: 57
離線
發現到一個我個人認為不合理的狀況,
Unicode 9.0版
Bopomofo
http://www.unicode.org/charts/PDF/U3100.pdf
unicode的子分段名稱居然寫 “Based on GB 2312” !?
就算兩邊的碼位都有列入,好歹也該是 based on Big5 吧???
Big5使用Bopomofo/ㄅㄆㄇㄈ是主流啊~~~對岸中共的主流是漢語拼音啊~~~
可憐的中華民國臺灣,被對岸中華人民共和國卡油吃豆腐佔便宜成這樣~~~

3/7 14:54:30
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2012/4/22 10:50
所屬群組:
已註冊使用者
等級: 33
HP : 160 / 804
MP : 505 / 13132
EXP: 18
離線
IanHo 寫到:
發現到一個我個人認為不合理的狀況,
Unicode 9.0版
Bopomofo
http://www.unicode.org/charts/PDF/U3100.pdf
unicode的子分段名稱居然寫 “Based on GB 2312” !?
就算兩邊的碼位都有列入,好歹也該是 based on Big5 吧???
Big5使用Bopomofo/ㄅㄆㄇㄈ是主流啊~~~對岸中共的主流是漢語拼音啊~~~
可憐的中華民國臺灣,被對岸中華人民共和國卡油吃豆腐佔便宜成這樣~~~



我個人覺得有些事情,真的不需要太「泛政治化」,

也許「Unicode」在「Bopomofo」這部份,本來就根據「GB 2312」,<-- 這我沒去考究

而「Unicode」原本根據什麼系統,「Unicode」就只是「如實的紀錄」是根據「什麼系統」如此而已,<-- 這部份請自行考究

這跟「卡油不卡油」沒關係,這跟「政治」也沒關係。

以下我個人警惕我自己


無須讓「意識型態」給「蒙蔽」了,

而「過濾」掉了一些「資訊」,只看到「自己想要看到」的「資訊」,

進而下了「某種結論」,然後「樂此不疲」...

Orz...



================================================================================

以下列一些目前查到的網址,提供參考,


我英文不好,我也還看不懂「Unicode」原本在「Bopomofo」所根據的考量是啥,這部份就由其他有了解的人來說明了。

目前查到的,可以先到下面這個網址

http://www.unicode.org/versions/Unicode9.0.0/

可以找到「18 East Asia」,可以找到下面的

http://www.unicode.org/versions/Unicode9.0.0/ch18.pdf

請參考「18.3 Bopomofo」,在「26 of 45 頁」,本文「693頁」。

或是找到「Full Text pdf for Viewing (13 MB)」可以找到下面網址

http://www.unicode.org/versions/Unicode9.0.0/UnicodeStandard-9.0.pdf

請參考「18.3 Bopomofo」,在「729 of 1036 頁」,本文「693頁」。

裡面有提到「GB 2312 」也有提到「cns11643」相關的字眼,

其他的就請自行閱讀了,我個人英文能力還無法替各位翻譯,

也許有熱心的看倌,可以來翻譯這一段,感恩先



================================================================================


## Wikipedia

* 維基百科 / 注音符號

請找尋「編碼與Unicode」,可以看到下面一段 (雖然看不出base,不過還是可以參考)


臺灣和中國大陸的流行電腦編碼,均有收錄現代標準漢語的37個注音符號。臺灣的 Big5 把注音符號收錄在 A3 區段(注音符號內碼為 A374-A3BA,調號為 A3BB-A3BF),中國大陸的 GB 2312-80 則收錄在 08 區段(EUC-CN內碼為 0xA8C5-0xA8E9,調號另行收錄)。

在 Unicode 方面,自 1.0 版即收錄了 40 個注音符號(包括ㄪ、ㄫ、ㄬ)在 U+3105-U+312C[9]。「ㄭ」(U+312D.svg)在過往各版本的 Unicode 均未收錄。在2008年4月發行的 Unicode 5.1 版,把「ㄭ」放到U+312D[10][9]。



================================================================================

從「注音符號」這個頁面,也可以找到各個符號的連結

例如:「」,

https://zh.wikipedia.org/wiki/%E3%84%85

裡面就會列出「ㄅ」的「Unicode」「Big5」「GB 2312」的編碼

================================================================================

從「注音符號」這個頁面,也可以找到下面這個參考連結


http://chukaml.tripod.com/linguistics/unicode/codeChart/U003100.html


這裡面也稍微有提到「GB 2312」。


================================================================================

* Wikipedia / Bopomofo (Unicode block)

摘錄


Bopomofo is a Unicode block containing phonetic characters for Chinese. It is based on the Chinese standard GB 2312. Additional Bopomofo characters can be found in the Bopomofo Extended block.




================================================================================

## Wikipedia 其他連結

* https://en.wikipedia.org/wiki/Bopomofo
* https://zh.wikipedia.org/zh-tw/%E6%B3%A8%E9%9F%B3%E7%AC%A6%E8%99%9F

* https://en.wikipedia.org/wiki/Bopomofo_(Unicode_block)

* https://en.wikipedia.org/wiki/Big5
* https://zh.wikipedia.org/zh-tw/%E5%A4%A7%E4%BA%94%E7%A2%BC

* https://en.wikipedia.org/wiki/GB_2312
* https://zh.wikipedia.org/zh-tw/GB_2312


================================================================================

## 其他連結


* http://www.cns11643.gov.tw/AIDB/query_general.do?active=8
* http://idv.sinica.edu.tw/bear/charcodes/Section09.htm
* http://shann.idv.tw/Chinese/big5.html
* http://www.herongyang.com/gb2312_gb/GB2312-to-Unicode-Row-08-Pinyin-Zhuyin-Symbols.html


================================================================================

報告完畢


3/7 17:02:25
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 589
MP : 245 / 12373
EXP: 57
離線
samwhelp 寫到:

我個人覺得有些事情,真的不需要太「政治化」,





個人觀點,如果 “真的不需要太「政治化」” 的話,unicode 9.0 也應該要收錄“納粹符號”才是。但是unicode 9.0“沒有收錄”“納粹符號”,所以unicode 9.0也算是有「政治化」的環境。(有收錄“大衛之星”符號,卻“沒有”收錄“納粹符號”,不公平啊~~~)

3/7 17:18:48
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2012/4/22 10:50
所屬群組:
已註冊使用者
等級: 33
HP : 160 / 804
MP : 505 / 13132
EXP: 18
離線
IanHo 寫到:
samwhelp 寫到:

我個人覺得有些事情,真的不需要太「政治化」,





個人觀點,如果 “真的不需要太「政治化」” 的話,unicode 9.0 也應該要收錄“納粹符號”才是。但是unicode 9.0“沒有收錄”“納粹符號”,所以unicode 9.0也算是有「政治化」的環境。(有收錄“大衛之星”符號,卻“沒有”收錄“納粹符號”,不公平啊~~~)



我個人建議,

如果您真的那麼在意的話,

包含您之前的討論串提到的一些「疑惑」,

請洽詢「Unicode該組織」,了解「緣由」拉,

否則一些您在這裡所下的「結論」,對我來說,它只是「您的臆測」,不見得是「原意」。

IanHo 寫到:
發現到一個我個人認為不合理的狀況,
Unicode 9.0版
Bopomofo
http://www.unicode.org/charts/PDF/U3100.pdf
unicode的子分段名稱居然寫 “Based on GB 2312” !?
就算兩邊的碼位都有列入,好歹也該是 based on Big5 吧???
Big5使用Bopomofo/ㄅㄆㄇㄈ是主流啊~~~對岸中共的主流是漢語拼音啊~~~
可憐的中華民國臺灣,被對岸中華人民共和國卡油吃豆腐佔便宜成這樣~~~


這是我上面回覆您,所真正要表達的。

這些跟「公平不公平」沒直接關係,跟「政治」也沒直接關係,

我個人覺得這跟「不求甚解」有關係 <-- 這句也許有些刺耳

您還記得您之前在這「回覆 #261」提到的內容嗎?

相信你也不想把您的「公信力」放在地上睬吧?

還有跟之前討論的議題是同樣的道理,請參考「#20」「#25」。

若有冒犯,我先跟您道歉,還請海涵,我盡力表達我想表達的,無意挑起爭端,盼您能理解

以上釐清


3/7 17:58:14
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 589
MP : 245 / 12373
EXP: 57
離線
samwhelp 寫到:
對我來說,它只是「您的臆測」,不見得是「原意」。



我的發文開頭就寫 個人認為、個人觀點 了,而且這裡是“哈啦區”,不是嗎?

3/7 20:45:32
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 589
MP : 245 / 12373
EXP: 57
離線
目前為止查閱維基百科的論述,Unicode9.0規範已知的“規範錯誤”至少有以下這些:
https://zh.wikipedia.org/zh-tw/蘇州碼子
https://zh.wikipedia.org/zh-tw/太玄
https://zh.wikipedia.org/zh-tw/中日韓統一表意文字
https://zh.wikipedia.org/zh-tw/臺灣方音符號
https://zh.wikipedia.org/zh-tw/Ѡ
哇勒!怎麼大部分錯的都是華人在用的文字與符號!
然後Unicode組織的做法就是“將錯就錯”,頂多再寫一份文件表示規範文件裡頭有有某些錯誤存在。對使用者端來說,選擇就是兩種,“用”或著“不用”,畢竟這了不起僅只是商業規範,對方也沒強迫你用。偏偏又“沒有”同樣等級的第二種選擇。看樣子真的只有華人自己要重造作業系統並且建立另一套規範來搭配,才有機會完全避免這些規範錯誤了。不過以華人的“社會文化”而言,即使軟硬體技術在2017年的今天早就有了,可以研發建立全新的作業系統架構與規範(百分之百符合傳統中文漢字思維的一整套電腦數位化的東西,並且真的要可以運作)。今天起算一百年內應該都還僅停留在“一張嘴”的階段而已吧?
再繼續查閱下去,搞不好還會發現更多的Unicode“規範錯誤”。

3/16 15:56:20
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 589
MP : 245 / 12373
EXP: 57
離線
整理進度雜感:
目前的進度是完成124個blocks的字元名稱正體中文整裡,當然距離總共的273個blocks還很遙遠就是了。而且也只是初稿而已,還“沒有”二校甚至三校的。
然後整理到“臺灣閩南語注音符號”/Bopomofo Extended 這個block,比對之後發現unicode規範PDF真的有與原案的符號筆畫不一致,且收錄了錯誤符號與重複符號的情境!
唉~~~在“現代的電腦文書資訊”這個環節,“臺灣閩南語注音符號”這套符號系統,某種程度也可以說是,被Unicode這套規範給搞死了~~~

3/19 22:27:56
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 589
MP : 245 / 12373
EXP: 57
離線
unicode組織的 CLDR 新推出了 CLDR 3.1版,然後我發現原本的
/CLDR3003/tools/tools/java/org/unicode/cldr/draft/picker/blocks_subblocks.html、subblocks_blocks.html
在CLDR 3.1版居然就“沒有”了。哇勒~~~
之前CLDR3003的blocks_subblocks.html、subblocks_blocks.html裡頭會有個“no block”的分類項目,我以為在CLDR 3.1會把這些“no block”再整理出來分類到各個blocks之下(我以為沒有被分類完的就暫時先被分類到“no block”底下),結果這兩個檔案完全“沒有”出現~~~
囧~~~
不要叫我自己去生成這兩個檔案,我不是程式開發者~~~

3/26 22:16:11
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 589
MP : 245 / 12373
EXP: 57
離線
算是延伸話題:
看網路討論,google+adobe在2017推出了全新的 思源明體
https://www.google.com/get/noto/help/cjk/
這次發行的字形,號稱參考了「教育部國字標準字體」。
於是我下載試用,以NotoSerifCJKtc-Regular.otf為例,
結果“家”這個字的筆畫問題,還是「沒有修正」。
真是遺憾~~~

4/5 17:47:36
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2012/4/22 10:50
所屬群組:
已註冊使用者
等級: 33
HP : 160 / 804
MP : 505 / 13132
EXP: 18
離線
IanHo 寫到:
算是延伸話題:
看網路討論,google+adobe在2017推出了全新的 思源明體
https://www.google.com/get/noto/help/cjk/
這次發行的字形,號稱參考了「教育部國字標準字體」。
於是我下載試用,以NotoSerifCJKtc-Regular.otf為例,
結果“家”這個字的筆畫問題,還是「沒有修正」。
真是遺憾~~~


關於「家」之前的討論回覆「#19 回覆: ezgo 13 LXDE桌面環境 試用小感」。

我昨天是看了這篇「三腳貓誌 Three-leg-cat-blog / 思源宋體推出,三腳貓要退休嗎?」,

才知道「思源宋體」推出的消息

剛又再去看,有新的一篇「三腳貓誌 Three-leg-cat-blog / 短評思源宋體的美感問題」。

另外也可以在「YouTube」上查詢「思源宋體」,
可以找到「TypekitVideos / 思源宋體簡介 — Adobe 的開放原始碼 泛CJK 字體」,


* https://source.typekit.com/source-han-serif/tw/


以上補充連結,提供參考


4/5 20:24:08
應用擴展 工具箱

« 1 ... 3 4 5 (6) 7 8 »

 [無發表權] 請登錄或者註冊


可以查看帖子.
不可發帖.
不可回覆.
不可編輯自己的帖子.
不可刪除自己的帖子.
不可發起投票調查.
不可在投票調查中投票.
不可上傳附件.
不可不經審核直接發帖.