|
BusLineDataSpider build20081205 -------轻松拥有最新的BusLine线路数据
4 [& P7 A0 @# N7 T
$ g" z& n7 N* ?0 C" Q2008年12月5日16点 build20081205 更新说明 b1 t: N0 t( g! j: W) }6 Z1 M$ r
/ @1 t6 V1 Y0 |" t9 t2 g2 I 这个版本开放了“软件运行日志”功能,软件的运行流程都会被写入到日志文件。这一功能对普通使用者意义不大,主要是开发者用来对软件进行纠错。但是考虑到软件在抓取数据时,可能会因为数据格式异常而导致抓取中止。因此如果大家在抓取数据时出现异常,可以把日志文件发给我供我参考纠错。打开这一功能的方法是:在BusLineDataSpider.exe的同一个目录下建立一个名为“Debug”的文件夹即可。生成的日志文件就会被写到“Debug”文件夹内,软件每一次运行都会生成一个日志。没有“Debug”文件夹的话,则此功能自动关闭。 E% g9 ]3 F, |1 J' u
" p$ U$ w6 M. ]4 R2 H$ P& k- u$ _ 很多朋友回复说在抓取时出现了“在抓取XXX线路时,访问无效网址”这一错误提示,这一问题主要是由于提供数据源的网站出现了非常规格式的数据,导致了以前的解析策略不能正常工作,这一问题留在下一版本解决。暂时的解决办法就是调整抓取范围,跳过有问题的线路,继续抓取。见谅。
/ I( n F- j$ L% D" i0 D8 ]* I7 z% L# D
-----------------------------------------------------------------------% `/ y6 N/ t: N* W: ^$ e
+ b% ]4 L. _, n! h; [
& V; U: m$ C# s8 Y" j$ _6 R1 作用
8 u8 G: Y1 X! e8 K" ~ 自动生成BusLine所使用的公交线路数据,从而再也不用为找不到最新的BusLine数据而发愁。5 H, o0 t. e O# B7 e7 q0 Z
7 e( A5 U1 Y& F& W; I0 ^/ |; E2 工作原理, ^2 N! P* K+ p3 C. y1 x& u3 X
从网络上自动抓取数据,按照BusLine规定的格式生成txt文件。
8 |) n4 s. z* r; L3 p' D4 q4 l5 e* }; k' R: L- a
3 运行条件* V u9 |- [+ _0 Z' V E9 Q2 w1 E
需要.Net2.0 Framework运行库的支持。如果下载后发现程序不能运行,请前往以下地址下载:* V/ Q$ ?1 \2 h" I9 P0 X) f, X
http://www.onlinedown.net/soft/38669.htm
D; D# E1 Q8 z* ?; n ^; y" S& Y如果电脑上装有飞信,可以用一个变通方法来解决没有安装.Net2.0 Framework运行库的问题,见备注。
H% |0 c8 E6 X
- K+ v$ A& M4 L; d4 使用方法1 Z/ T( v# a" b7 J* q! ^
1)城市名称请填写城市拼音,如beijing。
* E: q% b. C4 L# k3 _8 Y a; I# X! i/ K 2)线路范围表示想获取的线路数据的范围值,如想获取1路到200路的数据填写1-200,点击“按范围抓取”按钮。如果想获取整个城市的公交数据,一般情况下填写1-999即可。从1搜索到999,如果网速不够快将耗费不少时间,请耐心等待。% k( Y7 G" ]6 D2 H' ~1 B
3)线路名称表示如果有如“机场专线”,“高新专线”这种不带号码的公交车,它的数据将不会被前一种方式所获得。请把此类公交名称填写到“线路名称”框内,点击“按名称抓取”即可。 ' S, |3 a+ O2 H9 p/ }/ Z& d6 g
4)代理服务器不明白什么意思的朋友不填即可。
Q! R3 `! K' U 5)一切准备就绪,请点击“按范围抓取”或者“按名称抓取”,然后耐心等待。在抓取的过程中这两个按钮不再起作用,如果想修改参数重新抓取请先点击“停止抓取”按钮。* i5 L8 `) `2 V$ m3 r# \& L
6)抓取完毕会弹出操作完毕的提示框,此时点生成文件即可。生成的文件和程序在同一目录下。
1 u8 o4 ]" @% K1 w) n/ l7 W A 7)文件生成好后,还不能被BusLine直接读取,请使用“BusFile Builder”这个软件生成PDB文件。
7 R/ {/ y; X) b( x4 ` 8)在抓取数据的过程中,成功获取到的线路会显示在成功列表里,如果网络连接超时将会把当前抓取的线路放入到失败列表,在其他线路抓取完毕后会对其重新抓取,直到全部成功。等不及的朋友请点击“停止抓取”。
6 z' A, {( Y( D3 Y- I- M5 t& \& E6 M/ \9 a# c. [
5 相关说明. f/ i8 y; y4 L1 o$ h2 s1 ?! K
1)如果提示抓取完毕但是并没有任何数据,表示没有该城市的数据信息。
, ~" u# `5 k3 b; s0 m ~$ l- M 2)如果抓取的线路不存在,会继续搜寻包含有此名称的其他线路。例:如果不存在“5路”,可能将会出现“55路”,“305路”车的数据。
+ d; g$ W( n2 {' Z 3)根据上面的与规则,所以查询“1”路车,可能会出现“1路”,“城乡1路”,“机场1路”等数据。但是如果其中任意一条数据在读取时连接超时,范围值“1”将被加入“失败列表”,有关“1”的线路将会被全部重新抓取。, p: ^$ q8 [2 V2 c
4)在软件运行过程中,每一次抓取的数据都会和以前的数据合并在一起,因此并不会因为重新抓取而清空上一次的数据。如果想清空数据重新抓取,请关闭软件再重新运行。
$ k6 B4 ^6 t7 A/ }% _* X" H1 j# T- ? 5)软件在运行过程中,无论抓取多少次,所抓取到的数据都保存在内存中,只有点击“生成文件”按钮,才会被写入硬盘。如果因为网速太慢而范围值太大,等待过久,请及时保存文件,避免数据丢失。
4 n. f( ^) n( |3 C 6)如果在运行过中,如抓取1-100,中途在抓取到50时,因为弹出“网络连接超时”对话框从而导致抓取不能继续进行,此时可以调整范围值,将其修改为50-100,再重新点击抓取按钮。如果不修改范围值,将会重头开始。
, M! a6 w3 n7 {8 i 7)如果软件运行崩溃或者生成数据格式有误,请发邮件跟我联系,谢谢大家的反馈。所有数据均来自网络,线路名称本身正确与否概不负责。9 ~3 Q& ^/ I2 k' b
8)线路数据均来自网站http://www.8684.cn
& c" z# l) [- l& s& D 9)BusFileBuilder不能正常运行的朋友请参看本页30楼的办法,我没测试过,不保证一定成功。
/ ` u% P0 E2 ^9 ]- z+ ^. c$ W- B) J2 |" B7 W
6 备注信息- D+ ~, c7 g$ N+ Q
用飞信自带文件代替安装.Net2.0Framework运行库的办法:找到飞信的安装文件夹,将其下的“VMDotNet”文件夹、“Fetion.exe”文件和本程序“BusLineDataSpider.exe”三个文件拷贝到一个新的文件夹内。将“BusLineDataSpider.exe”重命名为“FetionFx.exe”,然后运行“Fetion.exe”即可。 X3 D/ E7 _; ^& O* Q
8 _/ `8 w4 |/ q9 M7 k* T! }( T
7 广而告之/ s% g' G4 h$ {
《回拨助手》:http://bbs.maxpda.com/viewthread.php?tid=1591003 D( b2 J0 W( ^; y- d1 m
8 ]" e3 \* F$ I. a" C6 ^
8 感谢在软件开发过程中所有帮助过我的朋友
5 F4 o" J9 y9 U" k4 B# |, Y, Z1 T7 W( ~ c
-----------------------4 @2 I$ {# b% a/ x
小超 9 i' d0 `. X7 R0 V2 f
ourloveliness gmail.com E; V0 J( b" X5 E. R
2008-12-04 |
|