|
莫道不销魂,帘卷西风,人比黄花瘦。; @+ T. b5 i0 h- N4 k
1 Q: _4 b3 H i5 ?) F% ^
这个词库的工作,我想也大概如此。这个词库用了我接近小半年的时间,算是个奇迹了。伴随着我论文的结束,这个词库也暂时算是划上了休止符,我也懒得去继续折腾了。* m! L4 G2 X5 z) M
- A, b( m5 x7 e
本词库是根据进化版掌易巨硬搜狗词库改编(在此谢谢原作者Topboy),原掌易词库大小2.77M。我个人觉得是掌易上最好的词库了。他用了巨硬的字,加上强大的搜狗的词库,如果对内存不介意的朋友,我强烈推荐,之前我也一直在用。$ d: V8 p3 b) s8 C7 J1 n
& K# v5 }. ?# }$ D我曾经仔细分析了里面的内容,许多词组,作为手机用户,可能是一辈子都用不到的,有时为了找到自己想要的词组,得不停翻页。也有些词组,比如我说过的,我这里打的是比方,比如”一诺千金“,而词库里面却有“一若千金”,“一诺万金”等等。。。。市面上还有个精简的巨硬转过来的词库,800多K。我也试过,太精简了,里面有些常用词组却没有。我拿来再精简的话,就没有没有什么可以用的了。( m$ V6 J% {; u6 `
5 H$ o- _! G* v, d原进化版巨狗词库基本解决了掌易切音问题,比如“wanan”晚安都能直接上屏了。这个词库里面去掉了一些我自己觉得用不到的词组。其中的标点符号,沿袭原作者的(我也觉得做的很棒的),按u可以调出标点符号,配合词组置顶功能,可以非常方便的调出标点符号,而不需要长按。按uu可以调出一些常用短语。按v是“我爱你”,呵呵。 E. V9 F; |5 I, G Q
8 y8 E: n) `& ?: L' [& Z' _
词库还添加了一些以前搜狗词库没有的字词,比如“赟”、“旻”、“崝”、“骉”biao,“侗tong”,“囧jiong”,“槑mei”等,因为人名中要用到。还有考虑到有需要,真正做到“以人为本”,有些比如呆“X”等字也都添加。记得在控制台里面,中文系统的字符集选择“中文GBK”,我试过,不然是乱码。最终的词库大概1M多点,相比原来的小了大概1.7M左右,我觉得也是词库体积的黄金分割点了,再大或再小都不方便了。
{( v) T# F9 s1 j! z7 Z/ C& S; W
2 f$ L* r/ A& C& f$ [1 X
' G2 S- C/ `" E x, p* m说明下:
2 A; K: B1 L0 n2 A% v0 J1.单字的问题 这个词库删单字是我是非常认真的,有时常常放大单字,在头脑里过一遍,确定这个字用不到,才删除掉的。因为和词组不一样,如果单字没有了,就没法上屏了,所以这个工作做的很仔细,也所以,前面的工作进展很缓慢。并且经过我自己一个月和群里朋友一个月的试过,证明基本没什么大问题。
" T* S# i, H) v: t+ L. \2 T& q1 O* N2 E
2.地名和人名的问题 全国有很多的地方,有很多的县,我的想法是保留省和市,最往下就删除了。这样就很简单了,你在一个地方呆,自己再添加些你用到的地名和人名,我想更合适些。
6 R* l7 @, ~' I9 q& A( ]5 u3 J7 t4 l, n: R! e
3.码表名字的问题 蓝色的海是我的网名,蓝色代表忧郁,海代表深沉,蓝色的海这个名字多拉风啊!但是有朋友要换掉,这个词库是本人花了小半年时间才搞好的。没有功劳也有苦劳,没有苦劳也有疲劳,所以就自己做主,用自己的名字来命名。下面附上码表工具MBGEN,你可以把蓝色的海,改成黄色的海,黑色的海,...都可以。码表工具有说明,需要转换的朋友,仔细看下说明,我就不啰嗦了。
# f8 \1 b( w" O5 ?
+ { ^+ N$ R" W+ k% W. [, q$ \* D建议配合输入状态下,menu菜单键的置顶功能,将常用标点和常用的字词置顶,这样可以实现盲打,提高输入效率。置顶的优先级大概是这样的,4 2 1 3 5,不知道这样写能不能看懂。
, J$ W# B" {3 a) |7 W6 L. V0 ~! A, u" q' l7 ]0 Y
/ d1 A& j( F- Q/ L. ^; w刚回来看到有些新胖因为权限不够,没能下。其实一开始,我是不设权限的,后来看到1000多人下载,不到100个人留言。所以希望能理解,我也是新胖一步步走来的,所以新胖下载不了的可以pm我,我给你发过去。或者加入群里面,群共享里面有的。讨论群:82562767
, C; V9 X+ k' a' k* m& [, J' w0 M# `3 a( r* C9 s) v/ |
好了,说完了,大家enjoy!
1 t. ]! U' r* v( @$ i
" n3 @3 p, R, V: o下载码表说明:/ |+ Y: R- T* Y' f% z/ L
蓝色的海:对应的是精简的字和词,全部做了删减;2 \. c" L+ M+ p' p: v) y
宁静的海:提取巨硬GBK的单字,单独做了一个码表;4 }) s4 V+ [) b) m+ o
那时花开:巨硬GBK的单字,加精简后的词组,组成的码表。
- ~0 ~. u. U5 I* g# j
) J" F1 v" K/ \! @: M8 ^码表名称是为了我区分码表的方便,下载后用mbgen工具可以修改码表名称,工具里面有详细说明。
7 w7 V- T: k, t' q0 T M. b+ @: |" }; D a- }
下载方案1:单独使用"蓝色的海",基本可以满足日常需要了;
D5 X) F; L$ k& m; G! f下载方案2:使用"蓝色的海",配合"宁静的海",基本无敌了;
* A0 e+ M9 b+ T z- B1 g7 w9 }) F 在掌易设置里面,分别勾选里两个码表的“启用”,设置好切换码表键,遇到罕见的字切换下码表。
3 b( H2 @9 I$ Y. h: ^! D6 L下载方案3:单独使用"那时花开",偶尔单字翻页麻烦些,但是不需要切换码表。1 C, j. D. |( D# [
/ T1 F' f& s* t; _; r* f4 H
6月4日 根据网友jaychen1988的建议,添加了粤语的部分。" D( `9 \7 j4 M% }9 J
5月1日 “蓝色的海”添加了“姑娘”,算是个不小的bug,添加了多音字“粘”,添加了一个朋友要加的2个人名用字。以后可能改用五笔码表,这个码表基本停止更新了,我觉得也该结束了吧,没什么大的改动了
! a X! V5 K3 _5 n8 h4月14日 “蓝色的海”添加了“邡fang”,“堃kun”,地名和人名中会用到
7 W8 Z, Y4 F- g/ |/ e" T$ n4月13日 “蓝色的海”添加了“琨kun”,可能姓名中用到* ^& x1 v4 k/ O+ C2 R
4月12日 蓝色的海”添加了“鄞yin”,“喆zhe”
) l5 A' |* E, s) _5 u4月11日“蓝色的海”添加了“婧jing”,谢谢讨论群里的朋友!同时添加了少量词组。
0 W/ i5 t) ]% K4月9日 更新了当2个词库一起用时会出现码表重复的问题,修改了对应的“黯然销魂全单字版”(单个使用时,没有任何问题),再次谢谢mayongqiang网友!# D4 D3 e' p* _: K
4月7日 更新了全部单字加精简词库版本(黯然销魂(单字全))的词组切音和符号不能按u上屏问题,谢谢讨论群的朋友”等待“的指出。现在看来,这个版本也算蛮完美的了。, @( i0 |$ Z: {) _; I3 N
4月6日 更新一个bug,打不出“局”。 添加了单字"唁“ ,词组“嘻嘻”、 3 `8 p7 z9 p- N7 i# H; p
4月5日 更新:樨xi,囍xi,璟jing,漕cao
# Z& f8 _7 b2 S0 E( T4y月1日更新:“菏泽”、“噻”、“嵊”、“甪”(古镇名 甪直),谢谢论坛的mayongqiang等热心网友的建议。
9 J7 }# [/ h3 Q0 ]! |0 ]6 z( F
[ 本帖最后由 sky981 于 2009-6-4 21:19 编辑 ]
, I. `/ E1 [; H2 k; X3 B1 ]0 q9 B0 X3 X% x- b
[ Edited by sky981 on 2010-5-2 20:19 ] |
评分
-
查看全部评分
|