|
BusLineDataSpider build20081205 -------轻松拥有最新的BusLine线路数据
d6 |$ k9 k' R2 i' e$ R( N- t. s
; e2 k; o' U/ S7 h2008年12月5日16点 build20081205 更新说明
2 J9 J& Q4 x& P$ t' Q! s& G
3 r: d; A; q% \; O; E' a 这个版本开放了“软件运行日志”功能,软件的运行流程都会被写入到日志文件。这一功能对普通使用者意义不大,主要是开发者用来对软件进行纠错。但是考虑到软件在抓取数据时,可能会因为数据格式异常而导致抓取中止。因此如果大家在抓取数据时出现异常,可以把日志文件发给我供我参考纠错。打开这一功能的方法是:在BusLineDataSpider.exe的同一个目录下建立一个名为“Debug”的文件夹即可。生成的日志文件就会被写到“Debug”文件夹内,软件每一次运行都会生成一个日志。没有“Debug”文件夹的话,则此功能自动关闭。2 @+ q1 K5 t5 a( A
! L9 J- o) r; V* T/ K* w
很多朋友回复说在抓取时出现了“在抓取XXX线路时,访问无效网址”这一错误提示,这一问题主要是由于提供数据源的网站出现了非常规格式的数据,导致了以前的解析策略不能正常工作,这一问题留在下一版本解决。暂时的解决办法就是调整抓取范围,跳过有问题的线路,继续抓取。见谅。6 O+ q4 v3 P' r3 @3 X% L
: X! S8 M1 r7 Q8 ~ J% ?' N3 \% ~+ X
-----------------------------------------------------------------------
! v, _: g- ~* N1 K; S& a
) I$ \3 m9 c: g1 a; \+ w0 H* G* `! J% c1 ^- [9 p/ V
1 作用
/ L S8 O" C2 z6 k2 x3 p2 [: e 自动生成BusLine所使用的公交线路数据,从而再也不用为找不到最新的BusLine数据而发愁。# g$ m& v; h( `7 z$ v
# p* I6 Q' f" I, M6 o; C; Q: w5 w% y
2 工作原理# K- i3 `9 ]/ a4 e& Z7 A. C
从网络上自动抓取数据,按照BusLine规定的格式生成txt文件。
+ S5 [$ d7 T" ]) k% Z+ K+ Q" u8 Z" K" s
3 运行条件9 i4 R9 ?5 E8 ~
需要.Net2.0 Framework运行库的支持。如果下载后发现程序不能运行,请前往以下地址下载:% d& y6 p2 h( S0 p- a" i9 x
http://www.onlinedown.net/soft/38669.htm: X3 M: k- M- S3 Z% K0 V
如果电脑上装有飞信,可以用一个变通方法来解决没有安装.Net2.0 Framework运行库的问题,见备注。3 s& C! }* m: m, y' S; ^- E
$ G6 w$ i5 C1 W( g7 C) g! {: ?
4 使用方法2 i# I; T) t @! Z0 p
1)城市名称请填写城市拼音,如beijing。
' Y3 z" g$ D" c% ?) S 2)线路范围表示想获取的线路数据的范围值,如想获取1路到200路的数据填写1-200,点击“按范围抓取”按钮。如果想获取整个城市的公交数据,一般情况下填写1-999即可。从1搜索到999,如果网速不够快将耗费不少时间,请耐心等待。( P9 F' q1 J* T8 l
3)线路名称表示如果有如“机场专线”,“高新专线”这种不带号码的公交车,它的数据将不会被前一种方式所获得。请把此类公交名称填写到“线路名称”框内,点击“按名称抓取”即可。
+ x8 P" |' ]( W. y1 F 4)代理服务器不明白什么意思的朋友不填即可。
+ c5 `- H; `" ~' h0 \ 5)一切准备就绪,请点击“按范围抓取”或者“按名称抓取”,然后耐心等待。在抓取的过程中这两个按钮不再起作用,如果想修改参数重新抓取请先点击“停止抓取”按钮。
9 D' d. A3 I/ o 6)抓取完毕会弹出操作完毕的提示框,此时点生成文件即可。生成的文件和程序在同一目录下。5 \, B+ _ i( \* b) C
7)文件生成好后,还不能被BusLine直接读取,请使用“BusFile Builder”这个软件生成PDB文件。+ E! i0 P5 B) [; `
8)在抓取数据的过程中,成功获取到的线路会显示在成功列表里,如果网络连接超时将会把当前抓取的线路放入到失败列表,在其他线路抓取完毕后会对其重新抓取,直到全部成功。等不及的朋友请点击“停止抓取”。: K7 l0 ?/ q& x9 v) t
8 f' d; v! ^" o: Z
5 相关说明, Y4 I: {* Y( t9 B
1)如果提示抓取完毕但是并没有任何数据,表示没有该城市的数据信息。
1 s4 b: C m6 q( ~$ A 2)如果抓取的线路不存在,会继续搜寻包含有此名称的其他线路。例:如果不存在“5路”,可能将会出现“55路”,“305路”车的数据。
0 T8 I* i1 }) ]5 X* M$ S8 e 3)根据上面的与规则,所以查询“1”路车,可能会出现“1路”,“城乡1路”,“机场1路”等数据。但是如果其中任意一条数据在读取时连接超时,范围值“1”将被加入“失败列表”,有关“1”的线路将会被全部重新抓取。$ v1 @. N" y& M) \& F+ T. m
4)在软件运行过程中,每一次抓取的数据都会和以前的数据合并在一起,因此并不会因为重新抓取而清空上一次的数据。如果想清空数据重新抓取,请关闭软件再重新运行。% V6 t, {" v, O. M3 D
5)软件在运行过程中,无论抓取多少次,所抓取到的数据都保存在内存中,只有点击“生成文件”按钮,才会被写入硬盘。如果因为网速太慢而范围值太大,等待过久,请及时保存文件,避免数据丢失。) I3 J/ [. c( @$ Y- Y% V: _
6)如果在运行过中,如抓取1-100,中途在抓取到50时,因为弹出“网络连接超时”对话框从而导致抓取不能继续进行,此时可以调整范围值,将其修改为50-100,再重新点击抓取按钮。如果不修改范围值,将会重头开始。
, G) t# X* ?4 ~% p5 D: H 7)如果软件运行崩溃或者生成数据格式有误,请发邮件跟我联系,谢谢大家的反馈。所有数据均来自网络,线路名称本身正确与否概不负责。& {4 p7 ~8 A) j, R
8)线路数据均来自网站http://www.8684.cn5 e) k" Y0 j3 I4 j4 x
9)BusFileBuilder不能正常运行的朋友请参看本页30楼的办法,我没测试过,不保证一定成功。
3 j9 R1 \0 h0 p* b7 ~8 W# d& T& b
6 备注信息, |- z! k6 j6 }; R6 C9 U
用飞信自带文件代替安装.Net2.0Framework运行库的办法:找到飞信的安装文件夹,将其下的“VMDotNet”文件夹、“Fetion.exe”文件和本程序“BusLineDataSpider.exe”三个文件拷贝到一个新的文件夹内。将“BusLineDataSpider.exe”重命名为“FetionFx.exe”,然后运行“Fetion.exe”即可。' O- V+ V. M8 m# v; K
6 r: n. y& N6 x5 u7 广而告之( ~7 ^. x! K% |, U6 n+ y+ E V
《回拨助手》:http://bbs.maxpda.com/viewthread.php?tid=159100
) j4 L I7 \; W" ^- f" R2 u. B/ y' m
8 感谢在软件开发过程中所有帮助过我的朋友$ T1 H( k; A y; S
% |+ f9 r" ]! T8 f' [------------------------ C/ a% H+ ]1 k, q A( H
小超 6 `# K. ?2 l0 K! C& n6 b
ourloveliness gmail.com7 {& t) B# u4 V f, T- g
2008-12-04 |
|