|
《简明英汉汉英词典合集》整理版+ V+ ^+ p# L0 S S: Q
解开江边小鸟制作的pdb后,原词典对应的文本文件大小104M,共2700731词条。整理后文本文件67M,共1607338词条。其中英汉1163937词条,汉英443400词条。
+ F% n) W7 M$ l1 C- z4 f. r《中国汉语成语字词典合集》整理版$ o* b* O; O- _, l: `% T
解开江边小鸟制作的pdb后,原词典对应的文本文件大小44M,共267715词条。整理后文本文件27M,共147584词条。6 P! [$ C. T, g; v
整理说明:
: L7 `* o# n4 J# P# `& N1、程序很简单,每个词条使用"\n"(ASCII:0A)分隔开的。而释义和词条条目是用"\t"(ASCII:09)分隔。所以遍序检索"\n",可以逐条读出,然后截取词条条目。
# X& Y2 M1 A& u, U/ L, B4 G如果条目相同,词条总长度长的保留,词条总长度短的写入另一个文件。
% y! g! {8 {, J7 s4 O3 |如果条目不同,将保留的词条写入最终的文件(无论同条目的有多少条,遍序下来只保留了最长释义的一条)。2 c2 s& R( m2 w: j' L( s
2、这种思路很简单,对《简明英汉汉英词典合集》很有效,因为本来简明合集释义简单,保留最长释义词条的思路足够。+ ?' V0 R& d2 a
3、但是对于《中国汉语成语字词典合集》,我不是特别满意。主要是这本词典中,对单字的释义,各个词典本身的风格不一样,比如“大”,有的词典就一条:“大”,有的词典还分“大1”“大2”,有的词典还分“大2(1 接上页”。单纯的挑选长释义词条而删除短释义词条的方法,造成在单字方面筛选后不合理。
/ J, F- T6 M4 W' X6 p当然,对词组方面没有任何问题。
5 w3 A9 p0 f% w9 y5 i4、稍后整理后公布源程序,VC++6.0.- {0 i; Q4 Y$ E, ~4 a- h9 A- A2 R; K
' g8 T) P" O5 ^. W* e江边小鸟 发布这两个词典的原帖,原词典也可以在这里下载。
/ T; \4 s/ z1 v p' c! Q9 Q" h2 ehttp://bbs.tompda.com/viewthread.php?tid=2124695 |
评分
-
查看全部评分
|