找回密码
 加入我们

QQ登录

只需一步,快速开始

搜索
查看: 1828|回复: 18

[软硬件讨论] 编程整理江边小鸟的两本大而全的合集词典

[复制链接]
发表于 2007-9-19 10:40 | 显示全部楼层 |阅读模式
《简明英汉汉英词典合集》整理版
4 t- R( ]/ U6 ~  ?- g解开江边小鸟制作的pdb后,原词典对应的文本文件大小104M,共2700731词条。整理后文本文件67M,共1607338词条。其中英汉1163937词条,汉英443400词条。9 F( v( Z* s: y+ ~6 T
《中国汉语成语字词典合集》整理版1 r  z7 H6 Z, P: z  t( l8 c
解开江边小鸟制作的pdb后,原词典对应的文本文件大小44M,共267715词条。整理后文本文件27M,共147584词条。
3 x* [# O+ D% u: [整理说明:8 Y% z  J) e& y8 ^/ @
1、程序很简单,每个词条使用"\n"(ASCII:0A)分隔开的。而释义和词条条目是用"\t"(ASCII:09)分隔。所以遍序检索"\n",可以逐条读出,然后截取词条条目。
9 t" K2 S+ S- e  X; W如果条目相同,词条总长度长的保留,词条总长度短的写入另一个文件。
; f- `( u( ^: d: C7 [如果条目不同,将保留的词条写入最终的文件(无论同条目的有多少条,遍序下来只保留了最长释义的一条)。  t  J6 t5 L( F' Q4 \3 j  v' S8 Y
2、这种思路很简单,对《简明英汉汉英词典合集》很有效,因为本来简明合集释义简单,保留最长释义词条的思路足够。
9 K$ I" c. ?# y3、但是对于《中国汉语成语字词典合集》,我不是特别满意。主要是这本词典中,对单字的释义,各个词典本身的风格不一样,比如“大”,有的词典就一条:“大”,有的词典还分“大1”“大2”,有的词典还分“大2(1 接上页”。单纯的挑选长释义词条而删除短释义词条的方法,造成在单字方面筛选后不合理。
% F! @  }1 f7 g当然,对词组方面没有任何问题。
; |# I2 I  P9 f4、稍后整理后公布源程序,VC++6.0.
# `3 Z. I* U( r, u) |; {0 d4 _0 H) X
) x# \$ w7 y( ]- f江边小鸟 发布这两个词典的原帖,原词典也可以在这里下载。
+ K. G- H! O4 Hhttp://bbs.tompda.com/viewthread.php?tid=2124695

评分

参与人数 1威望 +10 收起 理由
寂夜清风 + 10 精品文章,加分支持

查看全部评分

 楼主| 发表于 2007-9-19 10:40 | 显示全部楼层
第一部《简明英汉汉英词典合集》整理版发布完毕。% V9 y& v4 a) \/ W0 n
欢迎大家测试。
8 t, i/ M2 N; A3 K7 {为了防止和《简明英汉汉英词典合集》原本冲突,我不但将文件名ecceall.pdb改为ecceallbase.pdb。而且内置的词典名也加入了“修订”二字。
' R, r" {/ K" v6 B大家可以对比一下和原词典的区别。: p% Q/ _7 d% q$ t# |
分卷
: w  n2 E# Q& G9 B* i: h2 l# ^! Q* J9 D+ B" k8 Y0 c
感谢热心chaolun兄弟,我已将附件移至本站“下载中心”" p1 Q+ I: J$ F: k" w. \1 H- W

, y/ N$ \1 r% A0 M  r --.jpg
% o7 M7 ^& N! `. J# T
, U- o- N& B/ Y7 ?& c6 ]" O5 y8 R4 @0 R5 W

! p! d6 ~# o- ?# X5 f4 f  v! G0 T$ ], ][ 本帖最后由 wells 于 2007-9-21 10:29 编辑 ]
 楼主| 发表于 2007-9-19 10:41 | 显示全部楼层
第二部 《中国汉语成语字词典合集》整理版
* X/ [% b: a6 ^6 d* ?文件名由原版的chinesedict.pdb改为chinesedict1.pdb,词典内部名字也增加了“修订”两字。* O5 }" V5 x$ z" j+ o

7 c! u5 p  B. C& r感谢热心的chaolun兄弟,我已将附件移至本站“下载中心”,谢谢
  {# {# t1 i8 @4 \2 e7 b, C- J/ }
' A( V* c3 [4 M* @' j2 }! B[ 本帖最后由 wells 于 2007-9-21 10:31 编辑 ]
-.jpg
发表于 2007-9-19 10:56 | 显示全部楼层
期待发布
发表于 2007-9-19 14:55 | 显示全部楼层
支持!
发表于 2007-9-19 15:45 | 显示全部楼层
支持。。回头我整理到下载中心去
发表于 2007-9-19 19:50 | 显示全部楼层
下了要顶的
发表于 2007-9-19 21:26 | 显示全部楼层
谢谢楼主。下了就得顶
发表于 2007-9-20 21:25 | 显示全部楼层
pdbhaohao
发表于 2007-9-20 22:12 | 显示全部楼层
太好了
发表于 2007-9-21 09:41 | 显示全部楼层
不错不错!!!强烈支持!!
发表于 2007-9-21 10:30 | 显示全部楼层
英汉词典最后一个压缩包无法下载
发表于 2007-9-21 10:35 | 显示全部楼层
楼上的妖妖,实在抱歉,因为我刚才在转移附件 。已打包移到下载中心了
发表于 2007-9-21 10:36 | 显示全部楼层
原帖由 wells 于 2007-9-21 10:35 发表
1 |% [! H* G( B' v( E* Q" `楼上的妖妖,实在抱歉,因为我刚才在转移附件 。已打包移到下载中心了

. q( A% V3 g& F5 \" }- \: B怒了!就差part18了,现在又要我跑去下载中心重新下载你那个34MB的东西……
发表于 2007-9-21 10:41 | 显示全部楼层
辛苦你了
发表于 2007-9-21 10:44 | 显示全部楼层
原帖由 wells 于 2007-9-21 10:41 发表 , Z& N+ v6 \! v! L! a; S- A
辛苦你了

: y, l/ M( E; K4 a# [1 ypart18上传一下,网络不行,无法下载你那么大的包
发表于 2007-9-21 10:49 | 显示全部楼层
抱歉抱歉,我手头已经没有分卷了,有劳哪位给放一个part18上来
 楼主| 发表于 2007-9-21 10:55 | 显示全部楼层
呵呵,我也删掉了。: `. F' {' P$ K: h9 @
今天争取整理好程序,将整理词典的源程序公开。
发表于 2007-9-21 10:55 | 显示全部楼层
谢谢热心楼主
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

QQ|Archiver|手机版|小黑屋|吹友吧 ( 京ICP备05078561号 )

GMT+8, 2024-11-3 04:21 , Processed in 0.412277 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表