[自製注音輸入法表格分享]全字庫注音2016年08月份版本 [論壇 - Ubuntu 哈啦]


正在瀏覽:   1 名遊客


 到底部   前一個主題   下一個主題  [無發表權] 請登錄或者註冊

« 1 2 (3) 4 5 »


回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員一級
註冊日期:
2013/12/14 11:40
所屬群組:
已註冊使用者
等級: 3
HP : 0 / 52
MP : 6 / 1495
EXP: 9
離線
Alleen Wang 寫到:
如果大大願意授權的話,小弟願意幫忙推上 github 分享給大家使用。

關於我轉檔網頁部分,我可以讓大家隨意使用。要放github也可以。只是我能給的只有我寫的網頁,測試資料部分不包含來自全字庫的檔案,畢竟那不是我的東西。關於使用說明及注意事項等部分也交給你幫忙了。

9/2補充:今天自己就先放github了
https://github.com/ren1244/CinConvert

2016/8/24 13:25
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 619
MP : 274 / 23577
EXP: 76
離線
首頁 » 資料集下載 » CNS11643中文標準交換碼全字庫(簡稱全字庫) » 檢視資料資源
http://data.gov.tw/node/gov/resource/27234

題外話:
---
雖然目前當下政府網頁上寫 資料資源最後更新時間 105年06月16日 08:23:48
下載後發現檔案實際上已經更新到八月下旬了。政府公務員的工作效率就是“做半套”。
---

回正題:
我之前土法煉鋼操作圖形介面而生成的檔案更新版本是八月上旬,但也就已經是過時、過氣、進度落後、可以進博物館的版本了。之後各位可以用CHChan編製的script去生成檔案就好了。

從2010~2016,拋磚引玉了七年,這個注音表格檔終於被網路理睬了。
很幸運的,是趕上自由軟體鑄造場即將關門的前一刻,被理睬到。

2016/9/7 23:57
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2012/4/22 10:50
所屬群組:
已註冊使用者
等級: 37
HP : 0 / 905
MP : 679 / 30260
EXP: 23
離線
IanHo 寫到:
從2010~2016,拋磚引玉了七年,這個注音表格檔終於被網路理睬了。
很幸運的,是趕上自由軟體鑄造場即將關門的前一刻,被理睬到。


您辛苦了,感恩!

IanHo 寫到:
回正題:
我之前土法煉鋼操作圖形介面而生成的檔案更新版本是八月上旬,但也就已經是過時、過氣、進度落後、可以進博物館的版本了。之後各位可以用CHChan編製的script去生成檔案就好了。




CHChan 寫到:
Alleen Wang 寫到:
如果大大願意授權的話,小弟願意幫忙推上 github 分享給大家使用。

關於我轉檔網頁部分,我可以讓大家隨意使用。要放github也可以。只是我能給的只有我寫的網頁,測試資料部分不包含來自全字庫的檔案,畢竟那不是我的東西。關於使用說明及注意事項等部分也交給你幫忙了。

9/2補充:今天自己就先放github了
https://github.com/ren1244/CinConvert



我根據「CHChan」放在「GitHub」上的「CinConvert」這個專案,

修改了兩個版本,一個是「nodejs版」,一個是「gjs版」。

然後根據「CHChan」之前的「回覆」提供的「c++版」,
做了簡單的修改,
讓該專案可以在「Linux」的環境下編譯,
修改過後的「c++版」。

另外我之前寫的「php版」,
使用「PHP」若要產生「Excel」格式,建議可以參考使用「phpoffice/phpexcel」這個套件,
只要參考範例「Examples/02types-xls.php」,大概就會使用這個元件了 (範例: [1],[2],[3],[4])。
另外有一篇「回覆」,也跟這議題有相關。

解開zip,若遇到big5檔名,產生亂碼的情形,請參考「這篇」。

安裝全字庫字型的操作步驟,則是可以參考「這篇」和「這篇」。

## 列表

* 「網頁版
* 「nodejs版
* 「gjs版
* 「c++版
* 「php版

暫時整理到這,以上參考。



## 後記 (2016-09-21)

我個人重新撰寫了以下的專案,提供參考。
除了重新寫過之外,產生額外的log檔,並加上額外的資訊,例如檔名和行數,供對照用。

* 「util-cns11643-to-cin-nodejs
* 「util-cns11643-to-cin-gjs
* 「util-cns11643-to-cin-php」 (後記:2016-09-26)


## 後記 (2016-09-14)

我練習使用javascript重新寫一遍,

發現了一個api可以善用,「String.fromCodePoint()」,

然後查詢「php javascript base_convert」,就可以查到「一篇」。

這樣就可以將「16進位」,轉「10進位」,然後在搭配上面的,就可以傳成 unicode的字了。


#!/usr/bin/env node

function CnsUnicodeToString(number)
{
//parseInt(number + '', frombase | 0).toString(tobase | 0)
number = parseInt(number + '', 16 | 0).toString(10 | 0);
return String.fromCodePoint(number);
}


console.log(CnsUnicodeToString('4E00')); //http://www.cns11643.gov.tw/AIDB/query_general.do?active=6

// 會顯示「一」。

//https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/parseInt
//https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/String/fromCodePoint



或是不需要轉,只要將「'4E00'」前面加上「'0x'」;



console.log(String.fromCodePoint('0x4E00'));

// 會顯示「一」。



另外也可以使用「javascript String.fromCodePoint」來查詢,可以找到一些「polyfill」,例如「這個」和「這個」實做。

先紀錄以上發現,供參考。


2016/9/10 23:32
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員三級
註冊日期:
2008/5/28 2:32
所屬群組:
已註冊使用者
等級: 16
HP : 0 / 375
MP : 98 / 16846
EXP: 3
離線
自製的大易輸入法:
Dropbox:龍飛輸入法
MEGA:龍飛輸入法
Google:龍飛輸入法

2016/9/14 2:50
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 619
MP : 274 / 23577
EXP: 76
離線
雖然我不知道 大易的表格 跑到 注音表格 的討論串 來的原因是什麼?
然而我突發奇想,把 引言內容的所謂的日文漢字任選一個例如“団”,拿去搜尋我編製的內含九萬五千多字的注音表格檔,居然是包含的噎,鍵入碼就是“wj06”(ㄊㄨㄢˊ)。

yawnp0426 寫到:
新增日語常用漢字表1945個。

'sum 炭
'sum 炭(すみ)
'tan 短
'tan 短(たん)
'has 端
'has 端(はし)
'kim 胆
'kim 胆(きも)
'tan 诞
'tan 诞(たん)
'kit 锻
'kit 锻(きたえ)
'dan 団
'dan 団(だん)
'dan 坛
'dan 坛(だん)
'tam 弾
'tam 弾(たま)

自製的大易輸入法:
Dropbox:龍飛輸入法
百度云:龍飛輸入法

2016/9/14 19:31
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員三級
註冊日期:
2008/5/28 2:32
所屬群組:
已註冊使用者
等級: 16
HP : 0 / 375
MP : 98 / 16846
EXP: 3
離線
有時候這些漢字「注音」是自創的!像【匁】就是日本獨有的重量單位漢字,可能近似中國重量單位「兩」的功能,所以某機構就把注音稱呼為ㄌㄧㄤˇ。不過實際換算並不相同;1匁=3.75克;1斤=160匁=600克;由於臺灣過去被日本殖民統治,所以菜市場秤重單位一直沿用至今【1斤=600克】!我附圖有顯示日式秤桿刻痕為一百匁,若稱呼「一百匁=一百兩」實際上重量數值會引起很大的誤會,中國人常說半斤八兩也就是一斤十六兩,這一換算一百兩可是六斤多,但是一百匁卻不到一斤。所以「匁=ㄌㄧㄤˇ」的稱呼這時候會鬧很大的笑話!

「匁」日語唸怯〔もんめ〕但是此字被日本當代社會廢除,所以發音現今可以自創,只是應該還是要考慮數值換算實用的層次。我覺得它的中文發音唸ㄉㄠ或ㄖㄣˋ或許會比較好,因為戰國時期有所謂的刀幣而被秦始皇廢除,過去的刀幣歷史廢除情境可對照此字的光景餘暉,金錢單位和重量單位數值用法立場雖有不同,但兩者廢除後就視同毫無意義,只好以象形圖案比對,「刀」「刃」和「匁」筆劃差別只有㇒和㇏而已,所以覺得「匁」中文發音唸ㄉㄠ或ㄖㄣˋ或許會比較好。

附註:
匁字秤桿圖Ⅰ:https://www.dropbox.com/s/0m34bfcfdn5hpi9/匁字日式秤桿Ⅰ.JPG?dl=0
匁字秤桿圖Ⅱ:https://www.dropbox.com/s/z17uhwje3y4k58c/匁字日式秤桿Ⅱ.JPG?dl=0
匁字秤桿圖Ⅲ:https://www.dropbox.com/s/oe1zjpk9x8qsxxf/匁字日式秤桿Ⅲ.JPG?dl=0
匁字秤桿圖Ⅳ:https://www.dropbox.com/s/68nc0f7hmty9dy1/匁字日式秤桿Ⅳ.JPG?dl=0
匁字秤桿圖Ⅴ:https://www.dropbox.com/s/89jw5e1tk3v22en/匁字日式秤桿Ⅴ.JPG?dl=0
匁字秤桿圖Ⅵ:https://www.dropbox.com/s/3rpweclhwqqb9qr/匁字日式秤桿Ⅵ.JPG?dl=0
匁字秤桿全覽:https://www.dropbox.com/sh/b5k6f5duvowhgkv/AAA_mBLjZBeRnJqkXutYL7TRa?dl=0

附件:



png  匁字日式秤桿.png (687.85 KB)
11219_57d9aebe9fdda.png 814X680 px

2016/9/15 4:10
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 619
MP : 274 / 23577
EXP: 76
離線
延伸想法,台灣網路環境“有沒有”現成已經存在的像yawnp0426這樣論述的專門討論台灣政府機關“有問題的”漢字注音符號定義討論串???
因為我也不知道從何google起???如果能夠早個一年發現這樣的
“有問題的”漢字注音符號定義的議題,我應該可能會整理進入注音表格檔案內的論述中,當然我現在寫這些有點馬後砲的意味了(都有人做出script了,那我做新版本注音表格檔的機率就不大了)。這種“有問題的”注音符號定義,有一就有二,有二就有三,應該不只我曾經發現的一個,以及yawnp0426提到的這個,但是真的太散了,東一塊西一塊的討論,不知從何找起,我想找現成已有的集中討論串的。
新版本的超大字級注音表格檔,建議最好是附加上有問題與討論空間的注音定義論述的註解。早前我只有發現一個,原來還不只一個,可能有N個。

yawnp0426 寫到:
有時候這些漢字「注音」是自創的!像【匁】就是日本獨有的重量單位漢字,可能近似中國重量單位「兩」的功能,所以某機構就把注音稱呼為ㄌㄧㄤˇ。不過實際換算並不相同;1匁=3.75克;1斤=160匁=600克;由於臺灣過去被日本殖民統治,所以菜市場秤重單位一直沿用至今【1斤=600克】!我附圖有顯示日式秤桿刻痕為一百匁,若稱呼「一百匁=一百兩」實際上重量數值會引起很大的誤會,中國人常說半斤八兩也就是一斤十六兩,這一換算一百兩可是六斤多,但是一百匁卻不到一斤。所以「匁=ㄌㄧㄤˇ」的稱呼這時候會鬧很大的笑話!

附註:
匁字秤桿圖Ⅰ:https://www.dropbox.com/s/0m34bfcfdn5hpi9/匁字日式秤桿Ⅰ.JPG?dl=0
匁字秤桿圖Ⅱ:https://www.dropbox.com/s/z17uhwje3y4k58c/匁字日式秤桿Ⅱ.JPG?dl=0
匁字秤桿圖Ⅲ:https://www.dropbox.com/s/oe1zjpk9x8qsxxf/匁字日式秤桿Ⅲ.JPG?dl=0
匁字秤桿圖Ⅳ:https://www.dropbox.com/s/68nc0f7hmty9dy1/匁字日式秤桿Ⅳ.JPG?dl=0
匁字秤桿圖Ⅴ:https://www.dropbox.com/s/89jw5e1tk3v22en/匁字日式秤桿Ⅴ.JPG?dl=0
匁字秤桿圖Ⅵ:https://www.dropbox.com/s/3rpweclhwqqb9qr/匁字日式秤桿Ⅵ.JPG?dl=0
匁字秤桿全覽:https://www.dropbox.com/sh/b5k6f5duvowhgkv/AAA_mBLjZBeRnJqkXutYL7TRa?dl=0

2016/9/15 10:23
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 619
MP : 274 / 23577
EXP: 76
離線
額外,我會“奢望”像是前面討論串的那個協助製作注音表格檔的script,將來能有“純”openoffice basic的版本,做成可以完全獨立跨平台的openoffice.org的圖形介面插件檔案。相容LO and AOO。

2016/9/15 10:38
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 619
MP : 274 / 23577
EXP: 76
離線
雜記:
自由軟體鑄造場的網站功能採用漸進式的移除,之前移除累積下載計數功能已經好一段時間了,現在已經到了把每日下載計數功能移除的階段了~~~

2016/9/17 20:32
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: [自製注音輸入法表格分享]全字庫注音2016年08月份版本
會員一級
註冊日期:
2013/12/14 11:40
所屬群組:
已註冊使用者
等級: 3
HP : 0 / 52
MP : 6 / 1495
EXP: 9
離線
IanHo 寫到: 額外,我會“奢望”像是前面討論串的那個協助製作注音表格檔的script,將來能有“純”openoffice basic的版本,做成可以完全獨立跨平台的openoffice.org的圖形介面插件檔案。相容LO and AOO。

有稍微嘗試用巨集寫,但光讀檔速度就讓我放棄了。

這幾天我有再更新網頁版的內容,速度比之前快一些。介面也稍微做了整理。

(附件與github新的檔案相同,只是方便下載)

附件:


zip CinConvert.zip 大小: 5.05 KB; 下載次數: 359

2016/9/22 1:11
應用擴展 工具箱

« 1 2 (3) 4 5 »

 [無發表權] 請登錄或者註冊


可以查看帖子.
不可發帖.
不可回覆.
不可編輯自己的帖子.
不可刪除自己的帖子.
不可發起投票調查.
不可在投票調查中投票.
不可上傳附件.
不可不經審核直接發帖.