[自製注音輸入法表格分享]全字庫注音2016年05月份版本 [論壇 - Ubuntu 哈啦]


正在瀏覽:   1 名遊客


 到底部   前一個主題   下一個主題  [無發表權] 請登錄或者註冊

(1) 2 3 4 5 »


[自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 606
MP : 262 / 15399
EXP: 27
離線
採用全字庫的資料來源編製出來的注音輸入法"表格檔"。2016年05月份版本。
有需要的網友或許參考。使用前“務必請先”用進階純文字編輯器打開CIN檔案,“花心思閱讀檔案使用相關說明”。
全字庫注音輸入法表格檔2016 (轉換自CNS11643中文全字庫表格的Unicode格式傳統注音輸入法對照表)
https://www.openfoundry.org/of/projects/1603/download
全字庫注音輸入法表格檔2016-05 { CnsPhonetic2016-05.cin (全都錄版) for MacOSX + OpenVanilla 1.0.11 }
全字庫注音輸入法表格檔2016-05 { CnsPhonetic2016-05_GCIN.cin (全都錄版) for Debian 8 jessie + KDE + gcin 2.8.2 }

2016/5/19 0:24
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 606
MP : 262 / 15399
EXP: 27
離線
出了個包,自我檢查發現CnsPhonetic2016-05_GCIN.cin有缺字。
所以上傳了更新檔 CnsPhonetic2016-05_GCINv2.cin

2016/5/19 13:53
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員三級
註冊日期:
2008/5/28 2:32
所屬群組:
已註冊使用者
等級: 15
HP : 0 / 371
MP : 96 / 11939
EXP: 87
離線
從2015,2016以後版本,用 gcin2tab 編譯都會發生錯誤,不能使用!現今 2014 版本才會編譯正常。作業系統:Ubuntu 16.04 LTS

~$ gcin2tab CnsPhonetic2016-05_GCINv2.cin

(gcin2tab:6948): GLib-GObject-WARNING **: cannot register existing type 'GdkWindow'

(gcin2tab:6948): GLib-GObject-CRITICAL **: g_param_spec_object: assertion 'g_type_is_a (object_type, G_TYPE_OBJECT)' failed

(gcin2tab:6948): GLib-GObject-CRITICAL **: g_object_class_install_property: assertion 'G_IS_PARAM_SPEC (pspec)' failed
-- gcin2tab encoding UTF-8 --
--- please use iconv -f big5 -t utf-8 if your file is in big5 encoding
KeyNum:42 keybits:6
char def

(gcin2tab:6948): Pango-WARNING **: Invalid UTF-8 string passed to pango_layout_set_text()

(gcin2tab:6948): GLib-GObject-WARNING **: cannot register existing type 'GdkScreen'

(gcin2tab:6948): GLib-CRITICAL **: g_once_init_leave: assertion 'result != 0' failed

(gcin2tab:6948): Gdk-CRITICAL **: IA__gdk_screen_get_default_colormap: assertion 'GDK_IS_SCREEN (screen)' failed

(gcin2tab:6948): Gdk-CRITICAL **: IA__gdk_colormap_get_visual: assertion 'GDK_IS_COLORMAP (colormap)' failed

2016/7/31 10:09
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 606
MP : 262 / 15399
EXP: 27
離線
說句老實話,這些編譯過程的字串我都"看不懂"。不曉得yawnp0426在編譯之前,是否有用進階純文字編輯器,把CIN打開,並將文件開頭段落的“說明文字”整個先看過一輪?然後下載頁面我也有標明了我測試成功的環境與gcin版本各為何,其他環境我就沒有測試了。我“推論”可能原因為我在說明文字中有提過的有部分鍵入碼是『包含有音調符號』的拼音符號的關係。因為我遇過這樣的狀況。但我還是把這些『包含有音調符號』的拼音符號擺進去cin,畢竟是原始資料就有的東西。僅供參考。

yawnp0426 寫到:
從2015,2016以後版本,用 gcin2tab 編譯都會發生錯誤,不能使用!現今 2014 版本才會編譯正常。作業系統:Ubuntu 16.04 LTS

~$ gcin2tab CnsPhonetic2016-05_GCINv2.cin

(gcin2tab:6948): GLib-GObject-WARNING **: cannot register existing type 'GdkWindow'

(gcin2tab:6948): GLib-GObject-CRITICAL **: g_param_spec_object: assertion 'g_type_is_a (object_type, G_TYPE_OBJECT)' failed

(gcin2tab:6948): GLib-GObject-CRITICAL **: g_object_class_install_property: assertion 'G_IS_PARAM_SPEC (pspec)' failed
-- gcin2tab encoding UTF-8 --
--- please use iconv -f big5 -t utf-8 if your file is in big5 encoding
KeyNum:42 keybits:6
char def

(gcin2tab:6948): Pango-WARNING **: Invalid UTF-8 string passed to pango_layout_set_text()

(gcin2tab:6948): GLib-GObject-WARNING **: cannot register existing type 'GdkScreen'

(gcin2tab:6948): GLib-CRITICAL **: g_once_init_leave: assertion 'result != 0' failed

(gcin2tab:6948): Gdk-CRITICAL **: IA__gdk_screen_get_default_colormap: assertion 'GDK_IS_SCREEN (screen)' failed

(gcin2tab:6948): Gdk-CRITICAL **: IA__gdk_colormap_get_visual: assertion 'GDK_IS_COLORMAP (colormap)' failed

2016/7/31 11:46
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2008/11/21 9:18
所屬群組:
已註冊使用者
等級: 23
HP : 0 / 571
MP : 229 / 17528
EXP: 84
離線
非常感謝無私奉獻。

我的程式正需用到注音表格檔,之前用的是bopomofo.cin,(趙惟倫先生<bluebat@member.fsf.org>, 2007)收錄字數約8萬5千字。

您的收錄字數逾11萬字,更加完整,可見用力之深。

辛苦了,感謝您!

2016/7/31 15:18
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 606
MP : 262 / 15399
EXP: 27
離線
Marco 寫到:
非常感謝無私奉獻。

我的程式正需用到注音表格檔,之前用的是bopomofo.cin,(趙惟倫先生<bluebat@member.fsf.org>, 2007)收錄字數約8萬5千字。

您的收錄字數逾11萬字,更加完整,可見用力之深。

辛苦了,感謝您!


我發現我在文件中忘了補充,我估算應該是九萬五千多字。畢竟有一字多音或者一音多字。我這裡是以全字庫正宋體或正楷體分別全套各三個字型裡頭的含字量累加出來的。

2016/7/31 15:40
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2008/11/21 9:18
所屬群組:
已註冊使用者
等級: 23
HP : 0 / 571
MP : 229 / 17528
EXP: 84
離線
有件事挺奇怪,但應該與您無關,僅提供參考。

我搜尋【臺】這個字

若用bopomofo.cin,可以搜尋得到,
若用您的CnsPhonetic2016-05_GCINv2.cin,則搜尋不到,
但若把您的序文1—388列刪除掉後再存檔,則搜尋得到。

有可能是我的搜尋程式比對問題吧。

搜尋程式如下:


$cinTable = 'CnsPhonetic2016-05_GCINv2.cin';
$retword = "";
$data = null;
$data = file_get_contents($cinTable);
$word = '臺' ;
$keyMap = null;
$result = array();
$pattern = "/%keyname\s+begin\s+(.+?)\s+%keyname\s+end/uis"; //找出按鍵對應字根的區段
preg_match($pattern, $data, $matches);
$pattern = "/(.)\s+(.)\s+/ui";
preg_match_all($pattern, $matches[1], $matches );
$keyMap = $matches;
$pattern = "/\n(.+)\s+{$word}/ui";
preg_match_all($pattern, $data, $matches );
foreach ($matches[1] as $key => $value) {
$ary = str_split($value);
$result[$key] = '';
foreach ($ary as $value2) {
$idx = array_search($value2, $keyMap[1]);
$result[$key] .= $keyMap[1][$idx];
}
}
$retword = $retword . $result[0][0] ;
echo $retword ;


這段程式是找出【臺】這個字的第一個注音按鍵,正確為『W』,我若不刪掉1—388列,則找不出W,若刪了,就找到啦。

2016/7/31 15:47
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 606
MP : 262 / 15399
EXP: 27
離線
CnsPhonetic2016-05_GCINv2.cin 原始檔狀況下,
請查詢 w96 臺 , 第25432行 試試看。


Marco 寫到:
有件事挺奇怪,但應該與您無關,僅提供參考。

我搜尋【臺】這個字

若用bopomofo.cin,可以搜尋得到,
若用您的CnsPhonetic2016-05_GCINv2.cin,則搜尋不到,
但若把您的序文1—388列刪除掉後再存檔,則搜尋得到。

有可能是我的搜尋程式比對問題吧。

搜尋程式如下:


$cinTable = 'CnsPhonetic2016-05_GCINv2.cin';
$retword = "";
$data = null;
$data = file_get_contents($cinTable);
$word = '臺' ;
$keyMap = null;
$result = array();
$pattern = "/%keyname\s+begin\s+(.+?)\s+%keyname\s+end/uis"; //找出按鍵對應字根的區段
preg_match($pattern, $data, $matches);
$pattern = "/(.)\s+(.)\s+/ui";
preg_match_all($pattern, $matches[1], $matches );
$keyMap = $matches;
$pattern = "/\n(.+)\s+{$word}/ui";
preg_match_all($pattern, $data, $matches );
foreach ($matches[1] as $key => $value) {
$ary = str_split($value);
$result[$key] = '';
foreach ($ary as $value2) {
$idx = array_search($value2, $keyMap[1]);
$result[$key] .= $keyMap[1][$idx];
}
}
$retword = $retword . $result[0][0] ;
echo $retword ;

2016/7/31 15:52
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 606
MP : 262 / 15399
EXP: 27
離線
補充,我是用 純文字編輯器 土法煉鋼的最單純的搜尋“臺”。

2016/7/31 15:54
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2017 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年05月份版本
會員五級
註冊日期:
2008/11/21 9:18
所屬群組:
已註冊使用者
等級: 23
HP : 0 / 571
MP : 229 / 17528
EXP: 84
離線
我是運用在程式碼中,當然不可能用文字編輯器去搜尋,我也知道找得到。
比較奇怪的是,同一段程式,當保留1—388列時,就找不到,若刪掉 1—388列,就找得到。

這才是怪異所在。

2016/7/31 15:58
應用擴展 工具箱

(1) 2 3 4 5 »

 [無發表權] 請登錄或者註冊


可以查看帖子.
不可發帖.
不可回覆.
不可編輯自己的帖子.
不可刪除自己的帖子.
不可發起投票調查.
不可在投票調查中投票.
不可上傳附件.
不可不經審核直接發帖.