找回密码
 加入我们

QQ登录

只需一步,快速开始

搜索
楼主: osfans

字体/掌易码表/ZDic词典/SuperMemo/SugarMemo等制作工具pdbEditor09.01.11

[复制链接]
发表于 2008-9-6 19:30 | 显示全部楼层
来支持一下楼主
回复 支持 反对

使用道具 举报

发表于 2008-9-14 22:26 | 显示全部楼层
谢谢了。这个对我很有用~辛苦了各位
回复 支持 反对

使用道具 举报

发表于 2008-9-17 22:11 | 显示全部楼层
支持。呵呵。现在zdic越来越好了。呵呵
回复 支持 反对

使用道具 举报

发表于 2008-9-18 09:40 | 显示全部楼层
原帖由 osfans 于 2008-8-17 01:20 发表
" U. ]3 L; h, B, _, Y: ]) r0 T
+ J' h2 ]! s+ y今天更新了一下掌易1.06版码表转换的功能,也在第一个功能里,选择老版本的PDB码表作为第一个文件名。因为是开源的,所以比较好弄。
7 W. z' N1 v8 v. p
: y% Z1 K" H" Y- u4 S8 A巨硬的开源吗?有代码可以参考吗?它自己不能导出词库啊?- Y8 `: ]" o' _8 Z, A% @% L* }
要完全自己分析, ...
5 k0 o, P0 Z9 E6 ]
# v2 G. k% g, M# }
巨硬的源代码被Uglee搞丢了,这也是行货treo没有捆绑巨硬而捆绑梅花的一个重要原因吧。
! O' I( p! Y( k8 ?0 f2 Z
! Y/ c6 Y8 o, m多谢osfans,感觉treo可以再用个几年,一直等到新的nova系统出来了。
回复 支持 反对

使用道具 举报

发表于 2008-9-19 12:50 | 显示全部楼层
这个必须赞美,开始制作zhwiki
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-19 13:18 | 显示全部楼层
又重新写了一个wiki制作程序,将排好序的内容先保存到kdic文本格式的文件中,再进行压缩,这样对内存的要求大大降低,老爷也能跑了。
- F) S/ r' o; ^! e7 l; t$ Z, R- [$ a8 g! D5 {6 A4 n
确保无误后再上传。
回复 支持 反对

使用道具 举报

发表于 2008-9-19 17:45 | 显示全部楼层
发现用这个wiki工具做维基文库非常之快……几分钟搞定
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-19 19:23 | 显示全部楼层
那是你机器牛,呵呵。
回复 支持 反对

使用道具 举报

发表于 2008-9-22 12:33 | 显示全部楼层
不感谢是没有人性的!!!
回复 支持 反对

使用道具 举报

头像被屏蔽
发表于 2008-9-26 09:03 | 显示全部楼层
收益非浅!
回复 支持 反对

使用道具 举报

发表于 2008-9-27 09:21 | 显示全部楼层
我用你的MBCreator.exe,把我的搜狗词库txt另存为ansi格式。% a8 C% \9 g4 w, C/ X4 ^8 A" F
然后码表名称为PIME_XZ_GBK,pdb为:fdsa
% F8 C  ?: ^( [- d9 h" P这是不会出现out of rage 之类的错误了,可以转换,但将近200k的东西转换出来才8k,肯定不对吧?4 ]2 j1 D. R% ?
! U( {2 p6 _; [4 w6 L& H5 D
另外,希望楼主好心一下,能为广大网友写一份较为详细的把自己掌上电脑内已有词库中自造词提取出来然后和网上新下载同一个作者提供的新版词库数据合并的教程,好么?5 B" X; q# c; Y8 @
可能比较累,但毕竟有很多热心网友,比如我这样的,对这个码表制作不精通,但希望逐步学会diy的啊。
9 Y2 y  l+ D9 l
6 [2 k% W+ c  ~. Q' B先谢谢了。$ t1 m. w- o0 J

- i& ~! F) [% E* ~3 Q7 W7 d因为,尽管我下载了很多掌易工具,但还是没有一次成功合并过词库数据。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 10:36 | 显示全部楼层
你试试我这个工具吧,mbCreator不是我做的。' \) W. C6 B% J+ n0 O, f
我这个就是步骤在首页已经说明:
8 P/ O& l8 J9 m* T9 }* J
! v8 e  J3 h3 w( s6 U. ~& A在码表文件中选择合适的掌易输入法码表(PDB或TXT格式都可以),
1 Q& f) A* [- m) u' f然后会在“码表信息”中提示简单的码表信息,
4 K% ]# f1 v0 ^$ n最后单击“添加词库”,然后选择词库文件,& Z, U6 j( k$ w' Z
添加完成后,会提示要保存的新掌易码表文件。
回复 支持 反对

使用道具 举报

发表于 2008-9-27 14:58 | 显示全部楼层
你好,我看你的介绍写了支持搜狗词库的转换了。
, B% g  v% o5 R% E5 N* s4 L4 `' e- f我是这样操作的:
7 N& {7 M9 `7 j) ]/ e1、从电脑搜狗输入法导出txt文本格式词库。
) g' Z/ R& O4 E6 p6 j, P9 j' w2、打开此文本,并删除其中“;说明
: W3 v. E$ M! d: ~: o% g# S1 e;本文件是搜狗拼音输入法导出的txt文本词库。本词库只用于查看用途,重新导入输入法将会以细胞词库的格式存在,而不会覆盖原来的用户词库。所以要想完全的复现用户词库,请使用【用户词库备份】功能。3 n; s( ~/ i' J: l
;小提示:在输入法里删除特定词汇,请使用ctrl+shift+1快捷键。”这些文字。
! U; t7 n' R( D' _3、文本另存为ansi格式。
) g1 ^: A1 q* l9 Y: p# A! p4、用你的软件打开,提示format  error!
5 b9 l& A% `) x9 Q# j7 x# a: v& W3 a) g  `. J, w9 O- ~- e
此时,我重新打开词库文本文件,然后把以下信息复制到最前面1 B" V, E  s( S% h2 v
“[INFO]8 N9 V  H* `; R) m
name=拼音
% u, @0 s6 ?4 F7 ztype=0
" r7 u# E0 M& B( H# m$ fkey_length=6# r0 E  K2 T: A# E! q' x& G
used_char=abcdefghijklmnopqrstuvwxyz
/ U2 z& C: d5 H# x  \% L; p' T; ewild_char=
: a: k6 p0 q; I$ m) R! ~8 Ckey_syncopate=zhuang'chuang'shuang'……an'ai'ze'za'yu'yo'a'o'e. D; ?) h4 d  h
key_translate=
) k1 t& a, [- \- n; V' l7 |( L' u. g: Gsmart_key=<zh-z'<ch-c'<sh-s'<n-l'<l-r'<f-h'>an-ang'>en-eng'>in-ing$ _6 I. X3 @' J" z" Z
gradually_search=1
- h; S: X1 U. zfrequency_adjust=1
/ H/ P' E, d# ^9 z: K  ]5 ]( X  `3 e( v7 k
[DATA]”3 F$ H0 I8 S: [
. j, x2 L0 a* I
这样就能用你的这个掌易码表工具打开了,而且显示:
# M4 n/ l1 {! T7 a  w2 h* w----------------------9 ~" g9 H: z$ y, R7 F
名称:拼音
! m- K2 D; Y7 U( i码长:6
! n. Z( v1 ^* f# B" n" m# J; A" Z码元:a(一直到)z
- s5 @, p% m4 M0 x+ w0 ]万能吗:. ^' x  A4 [) H8 \) A
词数:22604* ^8 A0 U3 ^1 k! C
---------------------: K- Q% a( G3 F5 p9 r" z
) j- j" A" A9 S+ [
[ 本帖最后由 xuzhou 于 2008-9-27 15:04 编辑 ]
回复 支持 反对

使用道具 举报

发表于 2008-9-27 15:09 | 显示全部楼层
你说的“最后单击“添加词库”,然后选择词库文件,添加完成后,会提示要保存的新掌易码表文件。”4 A- j+ S6 T6 ^; ?) e0 k* q

4 P4 E1 M% a% o; \; Y0 L$ O——————————3 }: T' V% q& G& _2 M2 t" n4 F
这两步,我就不会做了。
! ]# ]7 r+ F# H. |7 g因为在我刚才操作的基础上,在“字符集”选项为“GBK”的情况下,我选择“添加词库”按钮,在弹出的对话框中找到backup文件夹下面目前在用的词库,想把目前在用的词库倒进刚才那个词数:22604的词库中时,提示“操作失败”!
+ U0 K$ Z7 n2 b* _% O: l: a. O! B' M$ ~- I# c5 {
也就是说,你说的“最后单击“添加词库”,然后选择词库文件,添加完成后,会提示要保存的新掌易码表文件。”
( G) w! B0 ^* x" |  k1 j3 R# w* f——我不理解,也不会操作,请再稍微详细解释一下,好么?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 15:32 | 显示全部楼层
是我没说不清楚,
- p$ N* n! g7 T" @0 k; i) n先打开一个合适的掌易拼音码表,然后直接添加搜狗词库,不需要转换编码(直接是你上次上传的编码),在程序中自动识别。 那样应该就没问题了。
回复 支持 反对

使用道具 举报

发表于 2008-9-27 16:45 | 显示全部楼层
先打开一个合适的掌易拼音码表——我电脑里backup文件夹中的巨狗加加词库用这个软件打不开啊,提示出错“错误的字符集”。6 G/ Q7 l2 M5 K6 Z4 Z& ~
/ \+ K* x6 h$ L) t
还是期待能有个图文并茂较好的软件说明。: X' o4 A2 L& X% k3 c; F
: T! o1 N! Z& w8 \/ O
还有,你说的“合适的”是指我用过一段时间已经积累一定自造词的词库还是说刚下载的新版词库?. \, w* F+ b: Z4 t
0 r( ?/ Y9 O. C# r
[ 本帖最后由 xuzhou 于 2008-9-27 16:52 编辑 ]
回复 支持 反对

使用道具 举报

发表于 2008-9-27 17:41 | 显示全部楼层

码表制作工具“提取用户词库”的问题

在对含有PalmOS字符集的码表进行用户词库提取时,发生错误。
: m, ^! f3 p+ h- i0 z2 R3 i7 q3 [& L/ ?
. I* \* b6 D$ Q' ?: y2 W对比过程已完成,但最后一步存为txt文件时,提示操作失败。
: _. z6 @- \  v+ i" c# b7 x- R( ~, l: U3 U
log显示如下:1 ~" T6 \5 ]' c9 m) f
-----------------------------------------------------------------------------------------------4 W' t5 Z% {/ D. u' Z
Traceback (most recent call last):+ r  ]* l4 S' B  }: Z( `1 S/ q( q
  File "pdbEditor.py", line 1244, in OnConvertIME
2 t0 m, K* @# o. |) S9 ^! h8 ~UnicodeEncodeError: 'ascii' codec can't encode characters in position 4-5: ordinal not in range(128)
. B9 Y9 w  Q2 C! B+ l" u7 @2 \- D-----------------------------------------------------------------------------------------------
2 {0 p" }: A0 v4 r5 N: ]
/ u" `( `5 e! P4 ~是否是因为在对比码表时,也进行了字符集的判断?
, }2 s) X9 l% j0 t% w% U& n
  s2 b: d, w. J(QQ上咨询你了,osfans这两天似乎没上啊)
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 18:41 | 显示全部楼层
QQ没上,呵呵,已更新。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 18:41 | 显示全部楼层
是保存的时候没改变编码。
回复 支持 反对

使用道具 举报

发表于 2008-9-27 18:51 | 显示全部楼层
下载了你9月27日也就是今天更新的版本,一切正常了!# ]  T# K, z+ d7 v8 s9 X
看来是软件问题啊。8 m4 h# c8 y. k" |
原来很简单的问题,你的软件概念也达到了,只是存在bug导致我采取各种方法都不能成功。
0 I) g9 H3 o- v: d0 M7 R呵呵,下午还调试了一下午,结果晚上7点回家一用最新更新的程序竟然很简单解决了。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 18:59 | 显示全部楼层
啊?也是这个问题?不好意思。主要是palm上有些符号是特有的,在电脑上显示不了,呵呵。
回复 支持 反对

使用道具 举报

发表于 2008-9-27 20:37 | 显示全部楼层

掌易码表的“PDB类型”问题

osfans来看一下! ~! k/ {; F8 R7 n& `

3 ~8 H. p% H) B" r/ V原来REI提供的MBCreator.exe工具中,制作码表时要填上一个“PDB类型”的字段,似乎是掌易用来区分不同码表的。现在的码表工具转换时,PDB类型是如何写入的呢?  $ h9 R/ K: S4 h- o$ m$ g
8 n4 y  m/ y" C1 A( `
发现会有这样的问题:用现在的工具转换的不同码表,掌易不能区分,会引发出一些奇怪的问题(比如:会自动冒出来一个名叫PIME_XXXX_PALMOS的码表、新制作的码表复制到RAM中掌易不能识别)
( a  L" _$ l6 b; x. Z1 z8 N: N
! g- h3 S! F/ Q& a1 H' M期待解决一下
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 21:05 | 显示全部楼层
现在是根据文件名称和编码来自动完成的,你可以用16进制编辑器打开文件编辑最前面的几个字节。
: D$ S7 g6 u2 L, P7 M" W$ P
3 o3 u! e$ ?7 O9 G[ 本帖最后由 osfans 于 2008-9-27 21:12 编辑 ]
回复 支持 反对

使用道具 举报

发表于 2008-9-27 21:09 | 显示全部楼层
原帖由 osfans 于 2008-9-27 21:05 发表
7 a# N! y1 W( e- B1 f, \( M9 j现在是根据文件名称和编码来自动完成的,你可以用16进制编辑器打开进行编辑。
" b; F: e  ]8 g, v$ m2 [& @
osfans能否提供一下之前版本的pdbEditor ?5 i& X, Y$ Y% s/ r8 Y( r: a

# A0 z# h2 I! |; k最新版本的pdbEditor似乎生成码表掌易无法识别(???)
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 21:14 | 显示全部楼层
我也没有备份,二楼有个源代码,倒是好久没更新了。我这可以识别啊。你是不是又有什么新的字符了?
回复 支持 反对

使用道具 举报

发表于 2008-9-27 21:22 | 显示全部楼层

回复 105楼 osfans 的帖子

没有添加新的字符,只是导出自己的用户词库后,重新再转换一遍
9 K/ W; l5 ^( w. O' I8 i1 l: n9 a
1 F4 g- u2 U: Y8 ~诡异了,现在新转换的码表,用explorer安装到ram中后,再用打开掌易,掌易识别不到,查看一下,发现码表已经从ram中消失,应该是被掌易“处理”掉了。。。
/ G' c' l8 h' n( c9 L) Z6 J  z& }2 B6 z3 J9 R( C# E6 F: e& D

: ?, k$ G$ b4 W7 @' x$ i2 g% o------------------------------------------; Y* `$ c6 ]4 G) @) `1 ]! F. }
哦,对了6 E8 K8 B+ x, w6 l
新生成的码表,安装到RAM中后,第一次打开掌易(0927简体版)时,会导致系统crash一次,日志如下:MemoryMgr.c, Line 3752: NULL handle' o' N+ j' k( n, {+ H% N

% v% e" c- f! c$ P, ~0 Z之后,试图将新码表装入ram,打开掌易后,码表便会失踪。。。& `2 x, k' H4 X) T2 [; X2 b# M

, H: q( F; p! B& @3 V[ 本帖最后由 TOPBOY 于 2008-9-27 21:32 编辑 ]
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 21:33 | 显示全部楼层
那是不是文件名和文件类型不对啊?跟以前的重名?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-27 21:35 | 显示全部楼层
对了,码表能不能转换回去变成文本文件?
回复 支持 反对

使用道具 举报

发表于 2008-9-28 07:33 | 显示全部楼层
真是好强大啊?
回复 支持 反对

使用道具 举报

发表于 2008-9-28 20:09 | 显示全部楼层
我用topboy的080928新发布的巨狗加加,用你的工具导入我的自定义词库以后,在掌易中显示的词库名称为:pime_导入_plamos2 N# \5 I$ T) B- H
这样如果用几个词库的话,看来用了这个工具以后,都会生成一个相同名称的词库。6 G( z& y) z" X8 Z3 ~

5 {1 c! _" F5 A/ U- k希望楼主改进一下,能在导入自定义词的词库保存的时候保存为和原来词库一样的名称较好。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-28 20:50 | 显示全部楼层
已经改了,呵呵
回复 支持 反对

使用道具 举报

发表于 2008-9-29 00:12 | 显示全部楼层
最新的版本是0927还是0928?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-9-29 00:13 | 显示全部楼层
那个问题27号就已经改了,就是27号最后更新。
回复 支持 反对

使用道具 举报

发表于 2008-9-29 00:14 | 显示全部楼层
明白啦~~用着感觉真爽,感谢~
回复 支持 反对

使用道具 举报

发表于 2008-10-19 15:32 | 显示全部楼层

压 enwiki 内存出错

整个文件都解到内存的,19G啊,发指啊……
  O; L# ?! ]9 R+ ^- [$ Y7 }* _* r/ f) N
osfans 有没有空改改程序,至少一段段转存吧。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-10-19 18:31 | 显示全部楼层
是有个临时存储的,不过我估计存不下./ b6 T1 F' ?1 j6 {' U! h5 x
你别解压,可以直接读压缩文件的.
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-10-19 18:33 | 显示全部楼层
好象不行,还得分几个字典.
回复 支持 反对

使用道具 举报

发表于 2008-10-20 14:50 | 显示全部楼层
原帖由 osfans 于 2008-10-19 18:31 发表 8 h; u: Z7 q8 Q* e5 q
是有个临时存储的,不过我估计存不下.
3 Z- v/ {! o( L1 \$ t( _7 J你别解压,可以直接读压缩文件的.
# }9 k2 B/ ~, x+ r8 N2 ?9 K* J

. r3 L! V8 D& b9 {4 k( t; u5 }我没有解压,直接用的,但是 python 的 bzip2 接口打开文件基本上也应该是在解压吧。/ |9 j7 Z3 @: _1 d# M2 |
反正 4G 的服务器内存不够用……
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-10-21 00:42 | 显示全部楼层
4G啊,哇哇,关键还是英文的太大了吧?9 d8 v+ ~6 ]$ T: ~8 j
我看看能不能优化一下,先分段保存,再分段排序。
回复 支持 反对

使用道具 举报

发表于 2008-10-21 05:51 | 显示全部楼层
感谢提供工具。$ Y0 J1 ?- C! x9 \5 [
刚成功转换中文的 Wiki。# `4 p1 R& n* f& ^& J/ l7 M
请问英文的wiki是否可以如法炮制?哪里有英文wiki的下载链接?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

QQ|Archiver|手机版|小黑屋|吹友吧 ( 京ICP备05078561号 )

GMT+8, 2025-3-10 23:33 , Processed in 0.408630 second(s), 13 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表