漢字構形資料庫光碟免費下載!2012版… [論壇 - Ubuntu 與中文]


正在瀏覽:   1 名遊客


 到底部   前一個主題   下一個主題  [無發表權] 請登錄或者註冊

(1) 2 »


漢字構形資料庫光碟免費下載!2012版…
會員三級
註冊日期:
2008/5/28 2:32
所屬群組:
已註冊使用者
等級: 15
HP : 0 / 371
MP : 96 / 12287
EXP: 87
離線
雖然宣告公開程式原始碼,不過看到政府教育單位使用微軟系統,對 Linux 初級使用者而言,轉換電腦程式語言系統操作就一個頭兩個大,Microsoft Visual Basic 語言要怎麼轉 Linux C++ 語言呢?傷腦筋!
這個問題就交給 Linux 程式高手去解決吧!有興趣的人看看能不能製作 rpm 或 deb 封包。

【首頁】http://cdp.sinica.edu.tw/download/dcatalog.htm

【漢字古今音資料庫】http://xiaoxue.iis.sinica.edu.tw/ccr/

[漢字構形資料庫光碟]http://proj1.sinica.edu.tw/~cdp/cdphanzi/

下載漢字構形資料庫2.7版光碟 ,120M,收錄古今漢字165,653個;其中楷書字形91,510個,小篆及重文11,100個,金文及重文22,729個,楚系簡帛文字及重文37,614個,甲骨文及重文2,700個。另收《漢語大字典》異體字表12,208組。

【程式原始碼】http://proj1.sinica.edu.tw/~cdp/cdphanzi/documents/hanziprg.zip

下載程式原始碼須知:

1.本系統的所有程式是利用Microsoft Visual Basic 6.0繁體中文版撰寫。

2.本系統另外使用Bennet-Tec Information Systems, Inc.開發的Tlist物件,Tlist在本系統用作樹狀結構。

3.本系統的部件資料分別存在cdphanzi.mdb(楷書)、cdpseal.mdb(小篆)、cdpbronz.mdb(金文)、cdpjiagu.mdb(甲骨文)、cdpchubs.mdb(楚系簡帛文字),請先安裝漢字構形資料庫,再將這些檔案複製到程式所在的目錄。

4.關於構字式的相關技術,請參考<構字式的處理技巧>一文。

2012/7/13 2:44
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員三級
註冊日期:
2007/7/3 16:11
所屬群組:
已註冊使用者
等級: 12
HP : 0 / 293
MP : 62 / 10456
EXP: 72
離線
可否反映一下,用QT寫,才能跨平台

2012/7/13 14:48
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 613
MP : 268 / 16134
EXP: 53
離線
我個人之前曾經嘗試使用過漢字構形資料庫光碟v2.6.X版本~
在MsWindows平台下~個人整體感覺~其圖形界面"穩定度"還是滿差的~
但是當時並沒有詳細記下每一次操作時~漢字構形資料庫軟體當掉的狀況情境~
所以我這種描述被當嘴砲的話我也認了~ 總之就是對其圖形操作界面很沒信心~就不想用了~
最主要當時發現其界面所繪出給文書排版軟體用的居然會被轉換成"圖案"模式~
而不是筆者所期待的TTF向量圖模式~這樣筆者就無法以一般編輯文字的模式去編輯這些
漢字構形資料庫裡頭的漢字~而變成在編輯圖片~這樣的話~對筆者來說~實用性就沒有了~
然而當時我有一個發現~就是安裝包所解壓出來的數個TTF字型檔案~
查詢其檔頭和相關資訊後~發現是大量採用在big5私人造字區碼位~擺放文字向量圖~
我嘗試描述看看~就是在每一個TTF檔案都擺放數千個向量字圖~這些向量字圖對應的碼位~
同樣都是big5私人造字區碼位大約相同的區塊範圍~然後我又嘗試打開安裝包裡頭的
MsAccess MDB格式檔案~我發現似乎是某種排序規格~然後我嘗試把這些MDB裡頭的
表格復制或匯出或轉換多管齊下到試算表軟體中~當然有經過一些我個人所理解的剪剪貼貼和排列組合~
因為另外有把漢字構形資料庫的字型安裝於系統內~於是在試算表中~
可以呈現出我所排序的每一個現代漢字對應到古代漢字~各是什麼呈現~
這樣可以採用傳統的查表法~例如我找出古代漢字的金木水火土~各是怎麼寫~
然後就可以再復制到一般的文書排版軟體中~當成一個TTF"文字"~來做編輯~
當下就覺得這樣"實用"很多~當然~這是一個小聰明的拐彎抹角做法~還是會有一些麻煩的狀況~
例如~如果漢字構形資料庫改版了(TTF和MDB有所增減)~那我就得全部重做一次~
很耗時間~ 其TTF內都是big5私人造字區碼位~對應上一定要仔細比對~不然製表就錯亂了~
筆者嘗試在MsWindows平台先將MDB的資料拼裝剪貼繪出轉移到 openoffice calc~
接下來將TTF和 openoffice calc 檔案 復制到 MacOSX環境~ 將TTF匯入系統~
當然 MacOSX環境會回應字型有問題~不管它~點選強制通過~
在MacOSX環境開啓 openoffice calc 檔案 然後就可以使用查表法 找出需要用到的古漢字~
就可以復制到 openoffice Writer來使用了~
必須要注意的是~使用了 漢字構形資料庫TTF的文件檔案並不適合交換與流傳~
因為別人的電腦並不一定會有 漢字構形資料庫那些位於big5私人造字區碼位的TTF檔案~
除非麻煩一點~匯出成唯讀的PDF並且要在檔案中包含字型(讓字型跟著文件)~
現在的v2.7版是否還是舊款的規格~我不知道~也還沒嘗試~
如果還是舊款的規格~只是增加減少所包含的漢字的話~
那就這樣了~在此提供一個急就章的個人經驗~

2012/7/13 18:05
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員三級
註冊日期:
2008/5/28 2:32
所屬群組:
已註冊使用者
等級: 15
HP : 0 / 371
MP : 96 / 12287
EXP: 87
離線
啐!國立台灣大學研究出來的文化作品豈不是成為一堆垃圾?浪費國家財政養一些馬謖之才!

2012/7/13 18:22
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 613
MP : 268 / 16134
EXP: 53
離線
我個人會覺得 漢字構形資料庫 整個套件裡頭最重要也是最怕被盜用和抄襲的無形財產~
就是那數萬個古代漢字的TTF向量圖~然後~如何呈現這數萬個TTF向量圖~
整合于現代的中文電腦系統規範~這就是一個值得去討論課題~
big5終究是一個不合於現代大字集中文資訊處理電腦環境的舊世代規範~
早就該被淘汰~
這個世代不得不採用洋人所具有最終決定權並主導的unicode規範~
所以需要嘗試將這數萬個古漢字的TTF向量圖跟unicode作一個整合搭配~
我個人認為寧可採用unicode私人造字區碼位~也會比big5私人造字區碼位好一些~
當然~要將數萬個古漢字換換規劃到unicode模式這個過程~就不是我的個人能力所可以嘴砲的了~
再來是存放的資料庫的部分~我所想到的既可以跨平台~原則上又不需太多授權費的格式~
大概就是MySQL~
原本採用的MDB格式~就會有跨平台的局限性~好處就是在MsWindows平台圖形界面的資料庫設計相對方便很多~
我個人推論是~只要後端的資料庫格式和TTF的編碼格式搞定了~
前端存取資料的使用者端圖形界面~對於有一定程度經驗的軟體開發者來說~應該不會是大問題才對~

2012/7/13 18:45
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 613
MP : 268 / 16134
EXP: 53
離線
yawnp0426 寫到:
啐!國立台灣大學研究出來的文化作品豈不是成為一堆垃圾?浪費國家財政養一些馬謖之才!


實在看不懂這句話是要回覆和表達什麼!?

2012/7/13 22:06
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員三級
註冊日期:
2008/5/28 2:32
所屬群組:
已註冊使用者
等級: 15
HP : 0 / 371
MP : 96 / 12287
EXP: 87
離線
理論和實務應該要相契合,用不著搞一些天馬行空之事,還是回想真正的中國文化是什麼吧!
電腦發明憑什麼要廢除國小珠算呢?這不是國立台灣大學校友們在教育部搞得嗎?
另外這幾年這些台大校友庸儒們不是在搞臺灣版的王莽新政嗎?熟讀中國歷史卻當屁話,有何意義呢?
這麼多人碰電腦成為專家但一問算盤是什麼人發明的,沒有一個人敢吭聲?全部只想搞台灣獨立!
答:算盤是中國人發明的!

2012/7/13 23:10
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員三級
註冊日期:
2010/3/19 23:44
所屬群組:
已註冊使用者
等級: 10
HP : 0 / 243
MP : 45 / 6768
EXP: 75
離線
yawnp0426 寫到:
......這不是國立台灣大學校友們在教育部搞得嗎?......

這位大哥,我也是國立台灣大學的校友,不過可惜我沒機會在教育部搞。

我不會這樣搞啦,我向您道歉。

2012/7/14 2:31
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員一級
註冊日期:
2012/7/14 12:23
所屬群組:
已註冊使用者
等級: 1
HP : 0 / 2
MP : 1 / 56
EXP: 10
離線
搞個漢字構形也可以扯這些政治議題,yawnp0426先生的水準還真是高啊。Ubuntu正體中文論壇可能不適合你這種水準的人士,請儘速離開吧。

2012/7/14 12:27
應用擴展 工具箱
回覆: 漢字構形資料庫光碟免費下載!2012版…
會員五級
註冊日期:
2010/9/16 14:08
所屬群組:
已註冊使用者
等級: 25
HP : 0 / 613
MP : 268 / 16134
EXP: 53
離線
手邊目前的電腦系統組合暫時沒有MsWindows ~
用的是MacOSX & linux+gnome ~
然後發現一個情境~就是~
可以嘗試看看在套件來源庫能否找到兩款套件來安裝~
mdbtools
mdbtools-gmdb
這樣就可以在linux圖形桌面新增一個 mdb reader(viewer)軟體了~
而 mdbtools 目前筆者安裝的版本最高可支援到讀取 MS Access 97/2000/XP/2003 ~
漢字構形資料庫光碟v2.7 的MDB似乎還維持在 MS Access 2000/XP 的規格架構~
真是太幸運了~ 這樣就有可以直接在linux圖形桌面環境下直接把檔案內容讀取出來的機會~
不用透過MsWindows平台轉換匯出了~筆者尚未深入測試~
不曉得是否真的每一筆資料都可以輕鬆方便的匯出並排序彙整~
畢竟 mdbtools-gmdb 看起來好陽春啊~
但總是個開始~
反正~漢字構形資料庫光碟v2.7 在其官網是填註冊資料後免費下載的~
有需要可以自行玩玩看~
(debian6.0.5 amd64)

2012/7/14 13:55
----------------
個人網路文字作品集:
MacOSX10.5.8 安裝、設定、使用,個人經驗分享,正體中文版;以Windows思維用Linux,GNOME桌面篇;PDF
http://www.scribd.com/ianian1979
全字庫注音輸入法表格檔2019 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
https://sites.google.com/site/ianho7979/InputMethodTables
應用擴展 工具箱

(1) 2 »

 [無發表權] 請登錄或者註冊


可以查看帖子.
不可發帖.
不可回覆.
不可編輯自己的帖子.
不可刪除自己的帖子.
不可發起投票調查.
不可在投票調查中投票.
不可上傳附件.
不可不經審核直接發帖.