關於有效率的挑選出中華民國政府標準的常用字的籠統大哉問 [論壇 - Ubuntu 與中文]


正在瀏覽:   1 名遊客


 到底部   前一個主題   下一個主題  [無發表權] 請登錄或者註冊



關於有效率的挑選出中華民國政府標準的常用字的籠統大哉問
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 613
MP : 268 / 16158
EXP: 54
離線
筆者遇到一個情境,一開始就先承認這是一個"籠統大哉問"的類型問題,
講白了筆者是打算直接伸手要速成的一整套答案的,而非光只是個方向,
首先會有一些前提,就是筆者不會寫程式,也不熟悉純文字指令的排列組合,
所以期望解決方案中,不要包含要動用到自行寫一個script,以及在終端機模式下
使用一堆純文字排列組合,來處理解決方案流程這樣.

筆者可以操作處理的就是全圖形介面下的進階純文字編輯器
(例如 mswindows的 madedit, linux的gedit, MacOSX的TextWrangler和Smultron)
和試算表軟體(使用openoffice calc) 希望藉由這兩種圖形介面軟體來達成整個操作處理流程.

接下來是問題描述, 筆者自己已經做好了 CnsPhonetic2012-04.cin 這樣一個包含11萬列的純文字檔案,
( http://www.openfoundry.org/of/projects/1603/download )
擷取其中 %chardef begin %chardef end 之間的內容留下,
接下來,有什麼樣的操作流程, 可以"有效率的" 以1500多組注音為分類的,
將每一組最常用的漢字挑出, 並將最常用字擺排在每一組注音的第一列,
次常用字擺在每一組注音的第二列, 以此類推,
中華民國政府單位, 有沒有一個官方網頁或資料檔案可以,以unicode碼位的形式列出所謂政府規範的
常用漢字並且以注音符號(需要包含聲調符號)為其分類編組, 這份網頁或資料檔案是要可以
匯出成 unicode格式的純文字檔案, 然後要能夠和筆者的 CnsPhonetic2012-04.cin 比對和整合,
以上的構思是因為筆者期望 CnsPhonetic2012-04.cin 的內容能夠呈現以,
把每一組注音列表中,所謂中華民國政府規範的最常用字都全部移動到該組注音的第一列,
次常用字移動到該組注音的第二列,接下來以此類推,
但是以筆者目前的資料處理和匯整能力,做不到這一部分的處理操作流程,
所以想說有問有機會.

2012/5/15 11:03
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: 關於有效率的挑選出中華民國政府標準的常用字的籠統大哉問
會員四級
註冊日期:
2008/11/20 21:32
所屬群組:
已註冊使用者
等級: 20
HP : 0 / 487
MP : 163 / 15419
EXP: 48
離線
政府網站與字型有關的,只有這一個網站

全字庫:
http://www.cns11643.gov.tw/AIDB/welcome.do

有提供各種編碼查詢,但是好像不提供編碼列表檔的下載

不清楚樓主是訴求是什麼
如果是公益型態的,也許可以和該網站的人聯絡看看幫忙提供資料


************************

更正:網址貼錯
http://www.cns11643.gov.tw/AIDB/welcome.do

或者 google 搜尋:全字庫
第一個就是了

2012/5/15 11:14
應用擴展 工具箱
回覆: 關於有效率的挑選出中華民國政府標準的常用字的籠統大哉問

註冊日期:
2009/12/6 10:32
所屬群組:
已註冊使用者
等級: 71
HP : 1404 / 1756
MP : 4456 / 50240
EXP: 24
離線
http://http//gateway.cns11643.gov.tw

Not Found
The requested URL /gateway.cns11643.gov.tw was not found on this server.
Apache/2.2.14 (Ubuntu) Server at http Port 80

2012/5/15 11:16
應用擴展 工具箱
回覆: 關於有效率的挑選出中華民國政府標準的常用字的籠統大哉問
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 613
MP : 268 / 16158
EXP: 54
離線
(◕ ◡◡ ◕) 寫到:
政府網站與字型有關的,只有這一個網站

全字庫:
http://www.cns11643.gov.tw/AIDB/welcome.do

有提供各種編碼查詢,但是好像不提供編碼列表檔的下載

不清楚樓主是訴求是什麼
如果是公益型態的,也許可以和該網站的人聯絡看看幫忙提供資料


************************

更正:網址貼錯
http://www.cns11643.gov.tw/AIDB/welcome.do

或者 google 搜尋:全字庫
第一個就是了



該網站內容~我沒找到有關常用字和次常用字~之分類模式資料~

補充一下 CnsPhonetic2012-04.cin 就已經是參考全字庫的資料做出來的東西了~ 檔案中都有寫明~

2012/5/15 11:20
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱


 [無發表權] 請登錄或者註冊


可以查看帖子.
不可發帖.
不可回覆.
不可編輯自己的帖子.
不可刪除自己的帖子.
不可發起投票調查.
不可在投票調查中投票.
不可上傳附件.
不可不經審核直接發帖.