Unicode9.0字元一覽有感 [論壇 - Ubuntu 哈啦]


正在瀏覽:   1 名遊客


 到底部   前一個主題   下一個主題  [無發表權] 請登錄或者註冊

« 1 ... 5 6 7 (8)


回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2012/4/22 10:50
所屬群組:
已註冊使用者
等級: 32
HP : 156 / 781
MP : 471 / 12395
EXP: 26
離線
使用「cross-mark lepcha」當關鍵字找尋,

可以找到一個PDF檔,如下

http://www.unicode.org/L2/L2005/05158-n2947-lepcha.pdf

然後查詢「CER-WA」和「TSHOOK」,可以找到說明。

* CER-WA : "cross-mark"
* TSHOOK CER-WA : "stop cross-mark"
* TSHOOK : "stop"

至於為什麼使用「cross-mark lepcha」當關鍵字找尋,
請參考下面的探索過程。
原本要補充在剛剛的「回覆#70」,改紀錄在這篇。


=================================================


從「Wikipidia / Lepcha alphabet」看到下面的連結

* http://www.omniglot.com/writing/lepcha.htm

然後找到「Online Lepcha dictionary」,可以找到下面網址

* https://archive.org/details/cu31924023194198

然後找到「FULL TEXT」,可以找到下面網址

* https://archive.org/stream/cu31924023194198/cu31924023194198_djvu.txt

查詢「cer-wa」,可以找到一段說明


*cer-wa, *cer-w(5 T. 'byar-ba ov'byor-baf
s. a cross-mark, a piece of wood given
between two parties with a cut across
as an emblem of agreement having been
made
, sd-dyak a-frdn I6t di-san-sd cer-w6
ndk fo to give a cer-w6 as an agreement
to return within a certain period; md-
mydn-nd sdn-ka cer-wo kut fo or kydp vb.
to make a cross-mark so as not to forget.



對照

* https://unicode-table.com/cn/1C3D/ (Lepcha Punctuation Cer-Wa)


=================================================

6/24 10:45:15
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 588
MP : 245 / 12084
EXP: 54
離線
額外話,在google找中文翻譯的過程,我有找到這樣一個東西
https://github.com/unicode-table/unicode-table-data
裡頭有“部分”unicode字元名稱的“簡體中文”翻譯,我打開來瀏覽,然後發現,很多字元名稱,"有翻譯"跟"沒翻譯"好像都一樣?
因為“重點關鍵字”,都還是維持原文,非重點關鍵字的部分,好像也只是英漢字典直接套下去替換字詞的樣子?
參考了幾串翻譯之後,就“沒有”再繼續參考了~~~

6/24 17:38:48
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2012/4/22 10:50
所屬群組:
已註冊使用者
等級: 32
HP : 156 / 781
MP : 471 / 12395
EXP: 26
離線
IanHo 寫到:
額外話,在google找中文翻譯的過程,我有找到這樣一個東西
https://github.com/unicode-table/unicode-table-data
裡頭有“部分”unicode字元名稱的“簡體中文”翻譯,我打開來瀏覽,然後發現,很多字元名稱,"有翻譯"跟"沒翻譯"好像都一樣?
因為“重點關鍵字”,都還是維持原文,非重點關鍵字的部分,好像也只是英漢字典直接套下去替換字詞的樣子?
參考了幾串翻譯之後,就“沒有”再繼續參考了~~~


收到。

這個我在「回覆 #70」有提到,

關於「GitHub / unicode-table / unicode-table-data」應該是「https://unicode-table.com/」的「原始資料」。




6/24 18:07:51
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 588
MP : 245 / 12084
EXP: 54
離線
一些發現與評論~~~

目前的unicode 9.0進度是還剩下11個block的正體中文字元名稱待整理。
雖然說 unicode 10.0 已經發表一週了~~~
而且好像還新增了八千多個字元與符號的樣子?
果然有一種“永遠跟不上”的fu~~~
unicode 9.0目前整理到
"多種的符號和象形文字"這個分段,乍看之下這根本就是“日本的” EMOJI/繪文字 專屬分段,裡頭有七百多個碼位,一整個消化不完~~~
然後發現,這個分段裡頭的東西,本質上幾乎都是“日本文化”的東西嘛~~~
日本人團隊果然很有一套,用“繪文字”這種“新潮的包裝”,很有毅力的去 遊說、說項 原本以保存所謂的這顆地球上的“歷史”文化為首要目標的洋人unicode組織,然後就把“日本的”“社會文化事物”就這麼夾帶進入unicode規範文件裡頭去了~~~
日本人團隊果然在“某些細節方面”看的夠長遠~~~

我的觀點是,unicode居然塞入“繪文字”,基本上就是“玩過頭了”。
不果我只不過僅是個“資料的使用者”,我也只能叫叫而已~~~
也只能選擇乖乖用而已~~~

6/27 23:53:40
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 588
MP : 245 / 12084
EXP: 54
離線
雞蛋裡挑到了一些骨頭~~~

原來
cldr-common-31.0.1/common/annotations/zh_Hant.xml
cldr-common-31.0.1/common/annotationsDerived/zh_Hant.xml
這裡頭的翻譯資料“不能”百分之百相信並直接複製引用,我真的去查英漢字典比對之後,發現“有部分的”字詞真的是“有問題”的~~~
然後MacOSX內建的字元名稱/字元面板的繁體中文翻譯資料庫也不能盡信。
同樣的網路上找到的第三方熱心電腦玩家所編輯彙整的表格也不能盡信。
(所以我自己彙整出來的unicode字元名稱資料,理所當然的也會附上“免責聲明”)

http://www.unicode.org/charts/PDF/U1F300.pdf 這個檔案裡頭
---
1F3AE
VIDEO GAME
= video game controller
---
預設圖示就我個人的直觀理解,會解讀為 Gamepad/遊戲手把,而「不會」是 VIDEO GAME 。
我個人認知的“VIDEO GAME”圖樣,應該要是一個螢幕並包含有遊戲畫面。或著包含有遊戲畫面的螢幕+遊戲主機+遊戲手把,這樣一整組圖示。
若要維持圖示不變,那字元名稱應該要改成 Gamepad/遊戲手把 才合理~~~

雖然 pdf 文件最後 還有一個 等於 “= video game controller” 當成註解,但是引用這份pdf資料的所有其他第三方資料庫或軟體,一般而言沒什麼機會引用到等於後面的補充說明啊? 通常只會引用字元名稱預設值而已,一般終端使用者看到的還是只有“VIDEO GAME”字樣而已。

或許會有酸民回覆說,那你寫信給unicode組織留言反應啊!
可惜我的英文程度不足以寫一封可以明確表達意見的email。
然後,就算我成功地寫好一封email,unicode組織也收到了,
然而以unicode組織的做法,“絕對不會”依照我的意思再下一個unicode規範發行版,把預設的字元名稱 “VIDEO GAME” 改成 “GAMEPAD”,或者把遊戲手把圖示改成“一整組”電玩設備。而頂多是另外寫一份文件表示某個碼位的字元名稱和圖示“可能有爭議”,就這樣而已。
那我email寫了也會是白寫~~~

6/29 14:57:30
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 588
MP : 245 / 12084
EXP: 54
離線
一個感慨:
範例:
碼位:U+1F5FE
字元名稱:SILHOUETTE OF JAPAN
我查英漢字典以及維基百科,“SILHOUETTE”這個英文單字的的意思分別是“黑色輪廓像”“剪影”。

然後

cldr-common-31.0.1/common/annotations/zh_Hant.xml
的翻譯是“日本列島”。

第三方網站的翻譯是“日本地圖”。

都差太多了吧~~~

我的推論這兩個網址的“不搭嘎翻譯”搞不好分別都有近五十趴???

第三方“個人網站”有近五十趴的內容“不搭嘎翻譯”也就算了。

CLDR是Unicode官網的東西噎~~~
怎麼可以亂翻!!!???
這樣Unicode官網提供的資料不能信任噎!!!???

完全是在欺負英文程度不好的人!?(例如我)

6/30 0:27:47
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 588
MP : 245 / 12084
EXP: 54
離線
遇到一個讓我很疑惑的資料內容~~~
http://unicode.org/charts/PDF/U1F300.pdf
碼位:1F597
字元名稱:WHITE DOWN POINTING LEFT HAND INDEX
可是那個圖示,我怎麼看我都覺得那是“右手”,不像是“LEFT HAND”,到底是我眼花了?還是到底是怎麼回事?
為什麼圖示樣子是“右手/right hand”,但是字元名稱卻是“左手/LEFT HAND”?

7/1 19:40:50
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 588
MP : 245 / 12084
EXP: 54
離線
剩下最後一個分段名稱:“薩頓手語寫作系統” 乍看之下真的像天書~~~

說真的就算有英漢字典可以查,那些英文字元名稱對我來說還是跟天書沒兩樣~~~
看了會頭痛~~~
目前預估就算真的全部整理完一遍且將資料檔上傳,達成率大約是還是了不起95%吧?
我無法百分之百的把所有字元名稱全部整理出正體中文出來~~~
其中有很多英文字元名稱對我來說真的像“天書”~~~
其中有很多英文字元名稱,英漢字典根本也都“查不到”東西。

7/6 21:52:08
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: Unicode9.0字元一覽有感
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 24
HP : 0 / 588
MP : 245 / 12084
EXP: 54
離線
個人自製編輯的資料表格分享:
UNICODE90v2.ods
Unicode 9.0版,十二萬八千多個字元與符號的全列表,包含十二萬八千多個“字元名稱”、和“字元名稱”的“正體中文”對照表總整理。
編輯環境為MacOSX LibreOffice 5.X CALC,ODS格式,一個頁籤為一個block。因為單一檔案包含有十二萬八千多個完全不同的字元和符號,所以檔案大小雖然只有7MB多一些,開啟還是會慢,可能會耗時兩分鐘。筆者的最後編輯輸出硬體環境是MacBook Pro 2010年款Intel c2d 2.4ghz+16GB主記憶體+傳統硬碟。
若您覺得開檔太慢,這裡會建議您把開檔的主機主記憶體增加為8GB或以上容量,檔案儲存媒體換成SSD,以及將系統軟體和LO環境再做最佳化。
檔案開啟後,務請優先閱讀“請先完整讀完我”頁籤。有需要的話或許參考~~~
未來的“奢望”是,有佛心的軟體開發者,以這種類型的正體中文資料檔為基礎,編製一個圖形介面長相類似於 MacOSX內建的字元檢視器/字元面板 的 AOO/LO外掛插件,這個外掛插件僅只採用OO Basic編製而成,不包含Java、python等等任何其他程式語言在內。以做到可以真的”跨平台“。而且圖形介面內的所有”字級“要預設成“相對較大”,能有個20pt或以上是最好,這樣閱讀才會舒適。
補充:若去點選LibreOffice選單列\檔案\屬性,會遇到滑鼠游標轉換成檔案讀取中動作圖示,而且跑一段不算短的時間。

https://sites.google.com/site/ianho7979/UnicodeCharactersList

7/8 5:17:15
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱

« 1 ... 5 6 7 (8)

 [無發表權] 請登錄或者註冊


可以查看帖子.
不可發帖.
不可回覆.
不可編輯自己的帖子.
不可刪除自己的帖子.
不可發起投票調查.
不可在投票調查中投票.
不可上傳附件.
不可不經審核直接發帖.