|
《简明英汉汉英词典合集》整理版
% }/ x; r' O9 c解开江边小鸟制作的pdb后,原词典对应的文本文件大小104M,共2700731词条。整理后文本文件67M,共1607338词条。其中英汉1163937词条,汉英443400词条。, l& t5 a0 k$ [, U* t
《中国汉语成语字词典合集》整理版9 N4 n+ a1 G+ N8 o( n- X
解开江边小鸟制作的pdb后,原词典对应的文本文件大小44M,共267715词条。整理后文本文件27M,共147584词条。; _- Q: J7 f, _1 d) q: G/ K( v
整理说明:, v* y8 {$ r1 g$ k7 _* A- U. M+ Z; T
1、程序很简单,每个词条使用"\n"(ASCII:0A)分隔开的。而释义和词条条目是用"\t"(ASCII:09)分隔。所以遍序检索"\n",可以逐条读出,然后截取词条条目。
3 d; }; S, ?9 R3 B如果条目相同,词条总长度长的保留,词条总长度短的写入另一个文件。6 Q' X5 f3 A& g* r, g
如果条目不同,将保留的词条写入最终的文件(无论同条目的有多少条,遍序下来只保留了最长释义的一条)。
( m+ V" Z! Y% H' R' ]2 D {; V2、这种思路很简单,对《简明英汉汉英词典合集》很有效,因为本来简明合集释义简单,保留最长释义词条的思路足够。5 R4 M2 M3 O" F) P4 q
3、但是对于《中国汉语成语字词典合集》,我不是特别满意。主要是这本词典中,对单字的释义,各个词典本身的风格不一样,比如“大”,有的词典就一条:“大”,有的词典还分“大1”“大2”,有的词典还分“大2(1 接上页”。单纯的挑选长释义词条而删除短释义词条的方法,造成在单字方面筛选后不合理。1 p( {- C5 d! o8 h, k, t
当然,对词组方面没有任何问题。! \' @+ P8 J( K+ S
4、稍后整理后公布源程序,VC++6.0.
# k& ]8 G% k- o6 y0 E
3 X* y7 e; a% H" y; a江边小鸟 发布这两个词典的原帖,原词典也可以在这里下载。* F7 M2 i6 ^; B0 a) t2 S
http://bbs.tompda.com/viewthread.php?tid=2124695 |
评分
-
查看全部评分
|