[自製注音輸入法表格分享]全字庫注音2016年08月份版本 [論壇 - Ubuntu 哈啦]


正在瀏覽:   1 名遊客


 到底部   前一個主題   下一個主題  [無發表權] 請登錄或者註冊

« 1 (2) 3 4 5 »


回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員一級
註冊日期:
2013/12/14 11:40
所屬群組:
已註冊使用者
等級: 2
HP : 0 / 49
MP : 6 / 846
EXP: 97
離線
我覺得不能用現代的標準來評論當時的做法
那是個中文系統還在發展的時期
我們能用中文在網路上溝通
其實要很感恩許多前輩

就像是先有ascii跟Big5
unicode是後來才出來的

網頁的標準也是
早期各家都加入自己的標準
後來才慢慢統一

以資訊的發展來看
很少有一開始就統一的

2016/8/22 13:11
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員二級
註冊日期:
2013/11/7 9:24
所屬群組:
已註冊使用者
等級: 8
HP : 0 / 187
MP : 30 / 3272
EXP: 51
離線
我們享受前輩們的努力成果,當然是要感謝的,呷果子,拜樹頭......

我並不是要抹滅前輩的努力,當然,一開始中文發展的時候,並沒有一定的標準,這過去必需,未來也是一樣,而這是以「中文系統」的發展來看,但是不管官方採用的是ASCII或是BIG5,內部的編碼就該統一,至少在台灣官方內部而言應該要如此,我所提的便宜行事,其實指的是這件事。

把這個情境套到現在,如果又有一個罕見字在目前官方的系統中並不存在,我想,情況會不會比以好一些?可能不會,因為目前官方的各系統仍是各自為政,一樣的情況必然會再次上演,重點仍是在整合,而整合,好像往往是我們最大的痛......。

2016/8/22 15:20
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 616
MP : 271 / 16392
EXP: 65
離線
閒扯屁補充:還是老梗~~~
不管幾十年前台灣環境的中文資訊處理剛起步的時候多辛苦,但那是一回事。
現在好歹也幾十年過去了,現在也西元2016/民國105年了,起碼至少發展將近四十年應該有了?
我認為“現在的”中華民國(臺灣)政府單位的公務員“自發主動”“維護”電腦上的中文漢字資料庫的“資料正確性”要到“100%”,是理所當然應該的,又不是沒有給政府單位時間去發展於維護,都幾十年了。好歹也是納稅人的錢建立出來的東西。
台灣環境在“個人家用電腦”上的中文資訊處理發展史,應該跟我的年齡差不多吧?主要就是1980年開始發展的東西?
在資料維護上,實在不應該出現 五筆資料重複輸入、把注音ㄧ輸入成漢字一 這種鳥事,這應該是要在資料上線之前就應該先要校稿/檢查的才對。中華民國(臺灣)政府單位就讓些資料bug跟著上線了!

2016/8/22 16:55
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員一級
註冊日期:
2013/12/14 11:40
所屬群組:
已註冊使用者
等級: 2
HP : 0 / 49
MP : 6 / 846
EXP: 97
離線
我只是考慮到過去的背景,所以可以理解當時的難處
至於現在既然時代不同,當然還是要用現代的標準來要求

對於注音的「ㄧ」打成國字的「一」的確是要檢討的部分
但對於存在重複「注音-unicode」的狀況,我倒是還不確定是否為錯誤

原始的檔案「CNS-注音」並沒有重複,只是「有相異的CNS碼對應到相同的Unicode」
我想這要先確認「相異CNS碼對應到相同Unicode」的標準流程是什麼?
然後還要考慮全字庫釋出的對應表格,是否有保留這些資料的必要性?

因為我們把這些資料拿來做注音表格,所以會覺得這是錯的
可是如果有某特定單位,他們還在使用那些CNS碼,需要知道對應的注音符號,那麼資料的刪除對他們來說可能會是一種困擾

2016/8/23 13:02
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 616
MP : 271 / 16392
EXP: 65
離線
CHChan 寫到:
我只是考慮到過去的背景,所以可以理解當時的難處
至於現在既然時代不同,當然還是要用現代的標準來要求

對於注音的「ㄧ」打成國字的「一」的確是要檢討的部分
但對於存在重複「注音-unicode」的狀況,我倒是還不確定是否為錯誤

原始的檔案「CNS-注音」並沒有重複,只是「有相異的CNS碼對應到相同的Unicode」
我想這要先確認「相異CNS碼對應到相同Unicode」的標準流程是什麼?
然後還要考慮全字庫釋出的對應表格,是否有保留這些資料的必要性?

因為我們把這些資料拿來做注音表格,所以會覺得這是錯的
可是如果有某特定單位,他們還在使用那些CNS碼,需要知道對應的注音符號,那麼資料的刪除對他們來說可能會是一種困擾


把CHChan抓出來的“重複的碼位”,直接輸入到 CNS11643的“網站”去查詢,就會發現其“重複出現”。所以確實是政府單位的“原始資料”,就“沒有”再好好的“驗證”。

四年前就曾經打電話+email給政府單位表示對方應給要加強驗證其漢字資料庫內容的資料正確性,我的反應事項被當成耳邊風了。

2016/8/23 13:17
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 616
MP : 271 / 16392
EXP: 65
離線
延伸雜記:
檔案編製過程,在操作LO Calc的步驟,我想到一個可能有些籠統、大方向上的問題,就是如果只是透過LO Calc既有的圖形介面來編輯表格內容的話,有沒有什麼樣相對有效率的操作步驟,可以把這個表格檔內約一千五百多組的“注音”(每一組注音包含的字多字少不一定,例如ㄏㄨㄤˊ有一百六十多個字),其中所謂的“常用字”擺在ㄏㄨㄤˊ這一段的開頭段落,罕用字,就擺在ㄏㄨㄤˊ這一段的接續“常用字”之後。
這樣的操作過程或許會非常的土法煉鋼,因為要操作一千五百多次。但是操作一輪之後,每當輸入一組注音,“常用字”就會優先出現在“字元候選視窗”內的優先出現字元。也減少按鍵跳下一頁選字的機率或次數。
當然我下一次再更新這個檔案是什麼時候,我也不知道就是了。

2016/8/23 22:21
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員一級
註冊日期:
2013/12/14 11:40
所屬群組:
已註冊使用者
等級: 2
HP : 0 / 49
MP : 6 / 846
EXP: 97
離線
今天碰巧看到的一篇
也許您也可以研究看看
全字庫屬性資料表格整理方法(三)─改善排序篇

另外也找到
中文字使用頻率統計表(共1萬3千多字)

2016/8/24 0:14
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員二級
註冊日期:
2006/2/6 13:19
所屬群組:
已註冊使用者
等級: 4
HP : 0 / 92
MP : 11 / 3686
EXP: 68
離線
如果大大願意授權的話,小弟願意幫忙推上 github 分享給大家使用。

2016/8/24 10:19
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 616
MP : 271 / 16392
EXP: 65
離線
Alleen Wang 寫到:
如果大大願意授權的話,小弟願意幫忙推上 github 分享給大家使用。



我比較期待有能接續“自由軟體鑄造場”的有“正體中文”介面(要能符合臺灣資訊軟體詞彙用語習慣)的網站的出現~~~

2016/8/24 10:27
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 616
MP : 271 / 16392
EXP: 65
離線
想法補充,我會覺得,我編製了一個以“正體中文”文字資訊處理為主題的檔案,卻放在一個完全相異的文字系統介面的平台上公開發行,以某種角度觀察,其實真的有那麼些的“悲哀”~~~
某個文字系統,卻要依賴另一個文字系統,才能公開發行,而不是在自己本身的文字系統介面上發行。

2016/8/24 10:38
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱

« 1 (2) 3 4 5 »

 [無發表權] 請登錄或者註冊


可以查看帖子.
不可發帖.
不可回覆.
不可編輯自己的帖子.
不可刪除自己的帖子.
不可發起投票調查.
不可在投票調查中投票.
不可上傳附件.
不可不經審核直接發帖.