Unicode9.0字元一覽有感 [論壇 - Ubuntu 哈啦]
正在瀏覽:
1 名遊客
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2010/9/16 14:08 所屬群組:
已註冊使用者 等級: 25
HP : 0 / 619
![]() |
急就章的再次嘗試~~~
因為目前為止的 google試算表 無法承載這個檔案的儲存格總數,所以會變成單檔下載模式 UNICODE 9.0 全字元列表(包含正體中文Block Name) UNICODE9.0.ods https://drive.google.com/file/d/0By5TMJzd-tsHdFZEYzlpbWpjNmM/view?usp=sharing --- 還在一點一滴解決許多細節問題中的線上瀏覽版,目前為止成功複製貼上50多個blocks, 有幾個blocks我複製貼上不上去,我不曉得為什麼。 目前為止實際已完成的 Character Name 正體中文 整理,將近六十個blocks。 距離272個blocks還很遙遠~~~ UNICODE 9.0 全字元列表,線上網頁瀏覽版本(包含正體中文的 Block Name、Character Name) UNICODE9.0(WEB ver.)-1 https://drive.google.com/open?id=1YgUzsI8tfU4AyUfRUgu-DkDF0QrMgdOISBYTPwuqP4U UNICODE9.0(WEB ver.)-2 https://drive.google.com/open?id=1ySmr1jVXbj-PijHhGduQ6OHAkrCgykq00GpEnVcAaQc UNICODE9.0(WEB ver.)-3 https://drive.google.com/open?id=13Sg9dm64-szO4UCk0VoyYe0GhwY2B2whJXL8_ufhWok --- 以上內容,務請“優先閱讀”“請先完整讀完我”頁籤。
2016/10/8 19:05
|
||||||||||
----------------
個人網路文字作品集: MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF http://www.scribd.com/ianian1979 全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表) https://sites.google.com/site/ianho7979/InputMethodTables |
|||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2012/4/22 10:50 所屬群組:
已註冊使用者 等級: 37
HP : 0 / 905
![]() |
IanHo 寫到: ## 前提 提一下我個人的想法,雖然根據以往跟您討論的經驗來看, 對您來說,您可能不覺得我提的,適用您的操作模式,不過還是提出來,供您或其他人參考。 ============================================================ ## 個人看法 我個人覺得,不見得一定要使用「Excel」或「LibreOffice Calc」這樣的軟體來達到您的需求。 若沒啥特別的要求,我個人會傾向, 使用的檔案格式,是「純文字編輯器」就可以編輯的格式, 然後使用「純文字編輯器」來編輯該檔。 ### 純文字編輯器: * atom * kate * gedit * sublime text * vim * nano * ...其他... ### 格式 * csv * html * xml * yaml * json * php array * lua table * gettext po file * rfc822 like * ...其他... 「Unicode Character Database (UCD)」提供 「純文字檔」或是「XML」,可以參考「這裡的說明」, 例如: * 「Blocks.txt」,可以找到Block的名稱和範圍。 * 「UnicodeData.txt」,這個檔可以把副檔名改成csv,例如「UnicodeData.txt.csv」,這樣直接點選,就可以使用「LibreOffice Calc」或「Excel」開啟。 * 「NamesList.txt」 ============================================================ ## csv 「csv」這個格式可以使用「Excel」或「LibreOffice Calc」來編輯。 也可以使用「純文字編輯器」來「編輯」。 格式舉例: 用「Tab分隔」
或是用「逗號(,)分隔」
完整範例:「1」 (原始碼」,「2 (原始碼)」 ============================================================ ## html 可以使用「html」的「table」來紀錄和呈現。 格式舉例:
完整範例:「1 (原始碼)」,「2 (原始碼)」 然後您可以學「css」,來設定呈現的外觀。 完整範例:「1 (原始碼)」,「2 (原始碼)」 若是不自己寫「css」,也可以套用現成寫好的,例如「Bootstrap」,其他還有很多,就不列了,請自行找尋。 完整範例:「1 (原始碼)」,「2 (原始碼)」 ============================================================ ## xml 也可以自行設計「xml」的格式來紀錄。 格式舉例
完整範例:「1 (原始碼)」,「2 (原始碼)」 然後也可以搭配「xslt」來呈現外觀,上面的範例用瀏覽器打開,會成樹狀圖。 下面的範例,搭配了「xslt」後,轉成「html」,就呈現了不同的外觀。 完整範例:「1 (原始碼)」,「2 (原始碼)」 ============================================================ ## json 也可以使用「json」這個常見的格式來紀錄。 格式舉例
或是
完整範例:「1 (原始碼)」,「2 (原始碼)」 先舉例紀錄格式,爾後再來說明如何應用。 ============================================================ ## php array 也可以使用「php array」的格式來紀錄。 格式舉例:
或是
完整範例:「1 (原始碼)」,「2 (原始碼)」 先舉例紀錄格式,爾後再來說明如何應用。 ============================================================ ## gettext po file 若是你要翻譯的話,之前有一篇「討論」,有提到「po檔」, 也可以善用這個格式,除了可以使用「純文字編輯器」來編輯,也可以使用「GUI工具」來編輯,例如「poedit」。 上面提到的討論,有紀錄一篇「自由軟體正體中文化 (L10N) - 工作指引」,您可以參考。 格式範例
完整範例:「1 (原始碼)」,「2 (原始碼)」 您可以嘗試下載上面列的「po檔」,然後使用「poedit」來編輯。 ============================================================ ## rfc822 like 參考「/var/lib/dpkg/available」和「/var/lib/dpkg/status」這兩個檔的格式。 可以執行「$ man deb-control」來了解, 更多參考資料,請參考「這篇」。 格式範例
完整範例:「1 (原始碼)」,「2 (原始碼)」 寫了一個簡單的專案「demo-convert-ucd」,是利用類似這樣的格式來當作翻譯原始檔。 ============================================================ ## 資料結構 以下我用我自己的話來講,一些術語,可能不是那麼專業,請海涵。 在使用資料結構的部份, 我個人會簡單的先分為兩個基本的類型,一個是用「數字索引的陣列」,一個是用「字串索引的陣列」, 然後來就是這兩種類型串起來的複合類型。 一般的應用,先理解這幾個類型,大概就能觸類旁通, 以下的範例,可以再去對照上面的一些例子,可以發現概念上是相通的。 ------------------------------------------------------------ ### 數字索引的陣列 #### 以「PHP」來舉例 定義
取值
存值
用「數字當索引」來「存取」個別項目。 完整範例:「1 (原始碼)」 #### 以「Javascript」來舉例 定義
取值
存值
用「數字當索引」來「存取」個別項目。 完整範例:「1」,「2」 #### 以「Lua」來舉例 定義
取值 (注意: lua 是從 1 開始)
存值
用「數字當索引」來「存取」個別項目。 完整範例:「1」 ------------------------------------------------------------ ### 字串索引的陣列 #### 以「PHP」來舉例 定義
取值
存值
用「字串當索引」來「存取」個別項目。 完整範例:「1 (原始碼)」 #### 以「Javascript」來舉例 定義
取值
存值
用「字串當索引」來「存取」個別項目。 完整範例:「1」,「2」 #### 以「Lua」來舉例 定義
或是
取值
存值
用「字串當索引」來「存取」個別項目。 完整範例:「1」 ------------------------------------------------------------ ### 複合類型 以下舉例,第一層是用「數字索引的陣列」,第二層是用「字串索引的陣列」,串起來的複合類型。 #### 以「PHP」來舉例 定義
取值
存值
第一層是用「數字索引」,第二層是用「字串索引」。 完整範例:「1 (原始碼)」 #### 以「Javascript」來舉例 定義
取值
存值
第一層是用「數字索引」,第二層是用「字串索引」。 完整範例:「1」,「2」 #### 以「Lua」來舉例 定義
或是
取值 (注意: lua 是從 1 開始)
存值
第一層是用「數字索引」,第二層是用「字串索引」。 完整範例:「1」 ============================================================ 以上的案例都可以在「demo-convert-data」這個專案找到。 ![]()
2016/10/8 20:13
|
||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2010/9/16 14:08 所屬群組:
已註冊使用者 等級: 25
HP : 0 / 619
![]() |
因為我現階段是 並不屬於 軟體開發者 這個群組的 應用軟體操作者,所以 試算表軟體對我來說是一個相對來說,“馬上可以使用”、“立即呈現效果”且“直觀”的應用程式介面。
在其他論壇那些網路文字“訪客”霸凌者,開口閉口資料庫來資料庫去的,我以前又不是沒用過 MsAccess、openoffice Base 等等,問題是資料庫軟體又不能像試算表軟體那樣,不同的unicode blocks的字元與不同的字形搭配之後,“立即呈現”差異效果且“直觀”。
2016/10/8 20:30
|
||||||||||
----------------
個人網路文字作品集: MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF http://www.scribd.com/ianian1979 全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表) https://sites.google.com/site/ianho7979/InputMethodTables |
|||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2012/4/22 10:50 所屬群組:
已註冊使用者 等級: 37
HP : 0 / 905
![]() |
IanHo 寫到: 我大概能理解您的想法和考量,所以我一開始有提,給您或其他人參考用。 反正資料我貼在上面, 也許您未來想通了,需要這些參考資料,就可以參考。 你自己已經找到適合自己的方式,不需要這些參考資料,那就擱著吧! 就只是單純的討論各種可行性,提供不同的選項可選。 ![]()
2016/10/8 20:38
|
||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2010/9/16 14:08 所屬群組:
已註冊使用者 等級: 25
HP : 0 / 619
![]() |
這個討論串示範了,分享資料檔,還反被“某些訪客”文字霸凌的一種網路討論串典型。
[自製資料檔案分享]Unicode9.0規範字元的大列表 http://hyperrate.com/thread.php?tid=33013
2016/10/12 12:19
|
||||||||||
----------------
個人網路文字作品集: MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF http://www.scribd.com/ianian1979 全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表) https://sites.google.com/site/ianho7979/InputMethodTables |
|||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2010/9/16 14:08 所屬群組:
已註冊使用者 等級: 25
HP : 0 / 619
![]() |
WEB版-1的頁籤增加了,說明頁籤也有增加內容。
2016/10/12 14:35
|
||||||||||
----------------
個人網路文字作品集: MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF http://www.scribd.com/ianian1979 全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表) https://sites.google.com/site/ianho7979/InputMethodTables |
|||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2010/9/16 14:08 所屬群組:
已註冊使用者 等級: 25
HP : 0 / 619
![]() |
原來堂堂unicode規範的"bug""資料錯誤"也真的不少!!!
而且還都是跟東南亞扯上關係的漢字與符號 可以注意其中有關Unicode規範內容瑕疵的敘述: https://zh.wikipedia.org/zh-tw/蘇州碼子 https://zh.wikipedia.org/zh-tw/太玄 https://zh.wikipedia.org/zh-tw/中日韓統一表意文字 https://zh.wikipedia.org/zh-tw/臺灣方音符號
2016/11/5 15:23
|
||||||||||
----------------
個人網路文字作品集: MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF http://www.scribd.com/ianian1979 全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表) https://sites.google.com/site/ianho7979/InputMethodTables |
|||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2010/9/16 14:08 所屬群組:
已註冊使用者 等級: 25
HP : 0 / 619
![]() |
資料查詢筆記:
我找到這個網址 http://unicode.org/Public/cldr/ 然後下載最新版的cldr解壓縮後用純文字編輯器打開來看,發現居然有現成的zh-hant的字串翻譯資料,於是非常的期待,我以為Unicode 9.0 block names 和 character names 的“全部字串”都會有著落了,然而在逐一比對字串之後,發現“不是”那麼一回事,zh-hant的字串翻譯“缺滿多的”,最後還是得乖乖回去“查字典”! 有那麼些的失望~~~ (其實即使是最新版的英漢字典,也不一定會有收錄某些字串) 目前的進度是整理出九十個blocks的正體中文 character name。
2016/12/15 1:24
|
||||||||||
----------------
個人網路文字作品集: MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF http://www.scribd.com/ianian1979 全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表) https://sites.google.com/site/ianho7979/InputMethodTables |
|||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2010/9/16 14:08 所屬群組:
已註冊使用者 等級: 25
HP : 0 / 619
![]() |
資料查詢筆記:
我把 macOS Sierra 10.12 裡頭內建的“字元面板”套件給單獨挖出來, 並從中找出unicode blocks 的繁中翻譯字串檔案。 遺憾的是,2016年九月發行的macOS Sierra 10.12, 還是“沒有”包含到2016年6月發行的unicode9.0規範版本。 而且macOS Sierra 10.12的“字元面板”有些中文字串翻譯,讀起來怪怪的, 實在不像是中華民國臺灣在地文化的用詞習慣。
2016/12/18 23:26
|
||||||||||
----------------
個人網路文字作品集: MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF http://www.scribd.com/ianian1979 全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表) https://sites.google.com/site/ianho7979/InputMethodTables |
|||||||||||
![]() |
回覆: Unicode9.0字元一覽有感 |
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
會員五級
![]() ![]() 註冊日期:
2010/9/16 14:08 所屬群組:
已註冊使用者 等級: 25
HP : 0 / 619
![]() |
資料查詢筆記:
目前的進度是完成了unicode 9.0的272個blocks其中的100個blocks的字元名稱的正體中文整裡。整理過程又發現一個情境,就我的解讀是,unicode 9.0收錄了一拖拉庫有的沒有的“符號”,像是表情符號、交通載具符號、大便、惡魔等等,我會覺得這些符號說實在的“可有可無”。然後我發現unicode 9.0“居然「沒有」”包含"轉四十五度角右旋(類似菱形)"的“納粹”符號(至少我找不到,另外“私人造字區”的不算數,把南亞宗教符號和漢字符號拿來替代的那種也不算)?看來Unicode的立場也不會是多超然?還是會依歐美洋人的政治正確思維,來做出選擇?都已經包含到十二萬八千多個字元與符號了,卻刻意忽視“納粹”符號?
2016/12/30 1:15
|
||||||||||
----------------
個人網路文字作品集: MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF http://www.scribd.com/ianian1979 全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表) https://sites.google.com/site/ianho7979/InputMethodTables |
|||||||||||
![]() |
您可以查看帖子.
您不可發帖.
您不可回覆.
您不可編輯自己的帖子.
您不可刪除自己的帖子.
您不可發起投票調查.
您不可在投票調查中投票.
您不可上傳附件.
您不可不經審核直接發帖.