|
感谢作者,原帖地址http://www.hi-pda.com/forum/view ... &extra=page%3D1
( d6 x! U% o Q4 w) @) s3 b3 u9 m! T' A8 X3 Y
2009年4月2日 更新说明
& \) s8 k/ ^2 e1 o+ @4 r$ M" y) R, p* R# _+ S" e; S1 ?3 x
1 更新网页解析规则,解决个别城市无法顺利抓取的问题。
& N% G1 L' S0 v$ A! D4 d$ A6 t2 e/ ^) d) e9 R
2009年4月1日 更新说明
6 F0 ~( g6 W1 p4 u$ U( m8 V, Q' y
/ F, {; ?! s0 a迫于Palmer们强大的压力,熬夜推出全新版本。为了节约时间,没有制作界面,请谅解。
0 Y8 Q$ B/ o$ D7 M; V, v% v时间仓促,未能仔细测试,欢迎指正。感谢各位朋友的支持。
! l9 M6 o4 S7 x0 [
4 T* A; y# j( ~: E% N! _-----------------------------------------------------------------------
; R- e! u5 [! a {: q6 U# a, C, j& s
2009年03月25日 更新说明
* ^# T! ]- _! C0 ^5 ], u
7 r0 Z. F* H! a( z j' O3 v! j1 因公交数据源更新,相应地调整了数据抓取路径。# a/ o% n3 a. V: ?% b% V# ]
0 z* M/ V$ e2 S2 P/ O, T
$ J+ ^0 A8 K4 x' G* U3 [* j' H最近因为8684更新了数据访问路径,导致了BusLineDataSpider无法正常抓取数据。
v; d# l) ~: \% o, j) W今晚忙里偷闲,赶着更新了一下,欢迎大家测试。9 l- r2 X4 _& h+ a+ n
) b& Q4 @ a+ E( T
-----------------------------------------------------------------------
1 q9 r; c3 Z6 ~( P3 {$ m) g/ o& |! @( I6 ~6 E: \; E U
2008年12月12日 更新说明! A! K' g, H9 D2 {* T9 d$ _
" C: v) U1 x* I5 b8 h" Y1 增加一个配置文件 用户可以通过配置相关属性 在生成时取消某些线路信息 如公交公司 乘车价格1 c! h: [) {% o3 k* y, I. e
2 将同类型的线路生成在一起 方便修改路线文件
4 _6 a7 n- E# p% i* ~5 z( ^, m q/ Z' z
-----------------------------------------------------------------------5 Z- E9 X" P* `2 Q8 l5 A. l6 P% m5 t
# M. X, W- P8 T7 N5 X+ g
2008年12月5日16点 build20081205 更新说明
+ n: \7 D4 s( `" M$ v L9 T( [& x9 I& S
这个版本开放了“软件运行日志”功能,软件的运行流程都会被写入到日志文件。这一功能对普通使用者意义不大,主要是开发者用来对软件进行纠错。但是考虑到软件在抓取数据时,可能会因为数据格式异常而导致抓取中止。因此如果大家在抓取数据时出现异常,可以把日志文件发给我供我参考纠错。打开这一功能的方法是:在BusLineDataSpider.exe的同一个目录下建立一个名为“Debug”的文件夹即可。生成的日志文件就会被写到“Debug”文件夹内,软件每一次运行都会生成一个日志。没有“Debug”文件夹的话,则此功能自动关闭。
, O( _6 G* I: F- r( Q [2 W
9 @) p( ~) ^7 S0 x6 }+ y9 m$ [ 很多朋友回复说在抓取时出现了“在抓取XXX线路时,访问无效网址”这一错误提示,这一问题主要是由于提供数据源的网站出现了非常规格式的数据,导致了以前的解析策略不能正常工作,这一问题留在下一版本解决。暂时的解决办法就是调整抓取范围,跳过有问题的线路,继续抓取。见谅。
) } x5 \. |( c5 E! E0 p9 t: O1 A. m7 J
-----------------------------------------------------------------------
, E# p$ r( s6 k3 P: R; [( k& b O2 V$ @% q
' W& ~8 ]3 x3 X1 作用
5 \" F, ], d+ U e" A 自动生成BusLine所使用的公交线路数据,从而再也不用为找不到最新的BusLine数据而发愁。
4 E7 L% u5 F1 P( L9 E: K7 d, l" l0 V
2 工作原理
" @* O- B$ t. e7 H, M& J) V4 o 从网络上自动抓取数据,按照BusLine规定的格式生成txt文件。
* v( J" g9 U- {. }" ~, V9 J
& G* y0 B! F3 I9 z3 运行条件0 V, Q" u6 Q5 _. E$ B; b1 c* H0 E
需要.Net2.0 Framework运行库的支持。如果下载后发现程序不能运行,请前往以下地址下载:4 X/ H0 j+ |: w' j5 \. s$ `
http://www.onlinedown.net/soft/38669.htm: `6 y3 _8 _. i T9 S7 a, s
" `8 y. `- ]9 H e! z; D1 l- y
4 使用方法
% @ y5 ?* H. e- ? 1)城市名称请填写城市拼音,如beijing。
! _1 ^8 l, _9 J9 X' P) F 2)线路范围表示想获取的线路数据的范围值,如想获取1路到200路的数据填写1-200,点击“按范围抓取”按钮。如果想获取整个城市的公交数据,一般情况下填写1-999即可。从1搜索到999,如果网速不够快将耗费不少时间,请耐心等待。
1 j) a& u$ D R# ?& O& J 3)线路名称表示如果有如“机场专线”,“高新专线”这种不带号码的公交车,它的数据将不会被前一种方式所获得。请把此类公交名称填写到“线路名称”框内,点击“按名称抓取”即可。
$ J3 |8 L8 |1 R- \ 4)代理服务器不明白什么意思的朋友不填即可。
5 E. y4 q3 ~* m2 f3 @; N4 c 5)一切准备就绪,请点击“按范围抓取”或者“按名称抓取”,然后耐心等待。在抓取的过程中这两个按钮不再起作用,如果想修改参数重新抓取请先点击“停止抓取”按钮。$ `' x; q5 K/ t. n! z5 i" y7 u
6)抓取完毕会弹出操作完毕的提示框,此时点生成文件即可。生成的文件和程序在同一目录下。
5 l, q# {. p' v9 l. U, a 7)文件生成好后,还不能被BusLine直接读取,请使用“BusFile Builder”这个软件生成PDB文件。4 s9 S8 K( {3 X! p! R2 Y6 V) u/ C
8)在抓取数据的过程中,成功获取到的线路会显示在成功列表里,如果网络连接超时将会把当前抓取的线路放入到失败列表,在其他线路抓取完毕后会对其重新抓取,直到全部成功。等不及的朋友请点击“停止抓取”。- @' k3 e0 y8 ^, i0 B% j
( y6 E2 g. y% q Z5 u
5 相关说明* m; v0 }- ^/ e' q6 _
1)如果提示抓取完毕但是并没有任何数据,表示没有该城市的数据信息。
/ T9 z$ s+ K: ]4 L, ^& Q 2)如果抓取的线路不存在,会继续搜寻包含有此名称的其他线路。例:如果不存在“5路”,可能将会出现“55路”,“305路”车的数据。0 z- ]+ Y1 J% p
3)根据上面的与规则,所以查询“1”路车,可能会出现“1路”,“城乡1路”,“机场1路”等数据。但是如果其中任意一条数据在读取时连接超时,范围值“1”将被加入“失败列表”,有关“1”的线路将会被全部重新抓取。
9 E! N* [" m' W9 }. J 4)在软件运行过程中,每一次抓取的数据都会和以前的数据合并在一起,因此并不会因为重新抓取而清空上一次的数据。如果想清空数据重新抓取,请关闭软件再重新运行。- X9 N( \ G, D& l6 D
5)软件在运行过程中,无论抓取多少次,所抓取到的数据都保存在内存中,只有点击“生成文件”按钮,才会被写入硬盘。如果因为网速太慢而范围值太大,等待过久,请及时保存文件,避免数据丢失。; k. x1 q9 i6 h; }8 `$ d
6)如果在运行过中,如抓取1-100,中途在抓取到50时,因为弹出“网络连接超时”对话框从而导致抓取不能继续进行,此时可以调整范围值,将其修改为50-100,再重新点击抓取按钮。如果不修改范围值,将会重头开始。
h/ P4 R& X' k3 Y8 O! I 7)如果软件运行崩溃或者生成数据格式有误,请发邮件跟我联系,谢谢大家的反馈。所有数据均来自网络,线路名称本身正确与否概不负责。
& \, Q; }9 \4 E( I9 R7 e 8)线路数据均来自网站http://www.8684.cn
7 Y* I, @: l7 H! d- N 9)BusFileBuilder不能正常运行的朋友请参看本页30楼的办法,我没测试过,不保证一定成功。
J3 @3 W5 u* {$ | Y6 ?( ]9 D6 M* o, u3 s6 [
6 广而告之
8 d5 r: I! Q# t8 R, e 《回拨助手》:http://bbs.maxpda.com/viewthread.php?tid=159100' v9 Y9 `+ T# A1 H2 G' K* e
. t6 ]( |. D8 t( f8 R7 ?# ~( H
7 感谢在软件开发过程中所有帮助过我的朋友
6 z% ?0 I9 v: ]+ v0 z
& L# X& U# o5 H. g3 u-----------------------
+ L+ f; u' z- |0 b小超 , X u( i& J, s3 z
gmail.com#ourloveliness(#左右交换即可 #即@)
7 _- t- Y6 F- p Q6 q/ N2 ?2008-12-04
! R" [* W* M9 p, z" R2 m
5 E% f+ n/ Q# C" q0 n
我在运行时是在dos下的界面,与截图不符,截图是旧版本的,但是一样能用,只是不能选线路范围了,而是把线路全部抓取出,请大家测试
/ w' M! K+ S: Z5 [) r9 N( v9 l2 E
+ e% {, W) c* a[ 本帖最后由 xiaoyu0314 于 2009-4-2 16:26 编辑 ] |
|