|
感谢作者,原帖地址http://www.hi-pda.com/forum/view ... &extra=page%3D1
& F$ C$ ~0 y# B3 I: ? X
! j/ J6 U; |0 M2009年4月2日 更新说明# O8 C: `, y( ?2 Z* N
( L9 V4 B D) }; c. B
1 更新网页解析规则,解决个别城市无法顺利抓取的问题。
! ]' G' m( z1 \: w% S+ x) Z2 r
; S2 r( E5 Y4 r4 a# R% |2009年4月1日 更新说明
" W( W4 U. `, ]4 m n* i3 Q+ g$ M( t5 `7 ]& @/ i
迫于Palmer们强大的压力,熬夜推出全新版本。为了节约时间,没有制作界面,请谅解。
; n# f2 V( ]9 q时间仓促,未能仔细测试,欢迎指正。感谢各位朋友的支持。
# T% g9 i" A: ^6 u+ d5 w. s W3 u9 [& o/ x' N# G8 z5 S: x( t
-----------------------------------------------------------------------
: p2 U" m+ _8 j8 |- ~
{' { \- ~( Y- _$ O7 _, k2009年03月25日 更新说明% [) d- V i# M' C3 [* r# Q `
' {6 E6 h$ I( T- _* }4 }, X
1 因公交数据源更新,相应地调整了数据抓取路径。
/ ^" [8 Y4 K. [( b6 |$ N; A
4 `4 Y7 K1 t, Z+ x, Q% l& [* Q/ ^+ [ ] l( N4 Q
最近因为8684更新了数据访问路径,导致了BusLineDataSpider无法正常抓取数据。6 \0 U, ^; U/ `) Q* z9 \8 ~
今晚忙里偷闲,赶着更新了一下,欢迎大家测试。
. f5 @; n4 z" c2 O! k( h8 Z+ p% y) w7 Q& G5 D7 X( o3 b
-----------------------------------------------------------------------
/ R7 Y, U- Q1 {6 l* o
' u. F( Q i8 ]6 u/ [7 q' V2008年12月12日 更新说明
7 d& R7 ]1 T2 N U3 J& v X5 ~, ~) _: u* r2 J- u
1 增加一个配置文件 用户可以通过配置相关属性 在生成时取消某些线路信息 如公交公司 乘车价格
# Y) ^2 q0 [- T0 w! a& F, Z" p2 将同类型的线路生成在一起 方便修改路线文件! m' U# O: v1 O0 O* m y# l9 o5 B
& P' q* ~) V. h1 N/ M-----------------------------------------------------------------------
" |: r- w" u+ G" P4 e. M: S) ]" h0 D: o5 U( J! t
2008年12月5日16点 build20081205 更新说明 y3 ^6 l5 j) l% _. {" c
7 J+ \3 j7 N+ j% E5 z
这个版本开放了“软件运行日志”功能,软件的运行流程都会被写入到日志文件。这一功能对普通使用者意义不大,主要是开发者用来对软件进行纠错。但是考虑到软件在抓取数据时,可能会因为数据格式异常而导致抓取中止。因此如果大家在抓取数据时出现异常,可以把日志文件发给我供我参考纠错。打开这一功能的方法是:在BusLineDataSpider.exe的同一个目录下建立一个名为“Debug”的文件夹即可。生成的日志文件就会被写到“Debug”文件夹内,软件每一次运行都会生成一个日志。没有“Debug”文件夹的话,则此功能自动关闭。
9 Y- j( W1 n% w& L* t4 V- k6 @7 Z& v, }0 H1 X( _3 ?& Q
很多朋友回复说在抓取时出现了“在抓取XXX线路时,访问无效网址”这一错误提示,这一问题主要是由于提供数据源的网站出现了非常规格式的数据,导致了以前的解析策略不能正常工作,这一问题留在下一版本解决。暂时的解决办法就是调整抓取范围,跳过有问题的线路,继续抓取。见谅。 `8 J8 V+ f+ z: h! c
- `/ ~. t9 H7 f-----------------------------------------------------------------------# I/ J/ h' E7 V
3 S; o- D# e; O
" y8 Q" C% j. U& o0 J5 R+ n
1 作用% Y6 t+ [8 Z6 b6 i
自动生成BusLine所使用的公交线路数据,从而再也不用为找不到最新的BusLine数据而发愁。
1 }/ Q# [/ [4 o( |0 g4 `& k3 X2 }6 D( l, q; c! }0 p: b0 A
2 工作原理
2 U; A! d7 F" G# x3 W! ^0 Z+ D. W 从网络上自动抓取数据,按照BusLine规定的格式生成txt文件。$ ?4 e$ f/ a" B6 V
" B7 O: @- k7 ]* r' R5 I+ A3 运行条件
' I, w+ ?' t" Y) }) K 需要.Net2.0 Framework运行库的支持。如果下载后发现程序不能运行,请前往以下地址下载:
" a$ u3 J* E2 i% B http://www.onlinedown.net/soft/38669.htm) o' l1 J2 G( \3 J( r- E6 b9 k S* w, T
3 r5 N& h. `* R' h/ ^
4 使用方法
J8 t$ c4 D' w" p5 e& ?, l$ j 1)城市名称请填写城市拼音,如beijing。
M7 U7 ~8 c+ ~( M9 Y 2)线路范围表示想获取的线路数据的范围值,如想获取1路到200路的数据填写1-200,点击“按范围抓取”按钮。如果想获取整个城市的公交数据,一般情况下填写1-999即可。从1搜索到999,如果网速不够快将耗费不少时间,请耐心等待。' z0 ^+ Q. H: X8 I2 I: ~/ I
3)线路名称表示如果有如“机场专线”,“高新专线”这种不带号码的公交车,它的数据将不会被前一种方式所获得。请把此类公交名称填写到“线路名称”框内,点击“按名称抓取”即可。 % C v. Z. z! B% C: \/ {
4)代理服务器不明白什么意思的朋友不填即可。* n) l' \4 c }
5)一切准备就绪,请点击“按范围抓取”或者“按名称抓取”,然后耐心等待。在抓取的过程中这两个按钮不再起作用,如果想修改参数重新抓取请先点击“停止抓取”按钮。
, K9 Y! W% N) ^0 G 6)抓取完毕会弹出操作完毕的提示框,此时点生成文件即可。生成的文件和程序在同一目录下。# M( r5 S. w" x% n9 P2 Z
7)文件生成好后,还不能被BusLine直接读取,请使用“BusFile Builder”这个软件生成PDB文件。+ r6 j; X0 `9 K) _$ u
8)在抓取数据的过程中,成功获取到的线路会显示在成功列表里,如果网络连接超时将会把当前抓取的线路放入到失败列表,在其他线路抓取完毕后会对其重新抓取,直到全部成功。等不及的朋友请点击“停止抓取”。
g( B/ P, X2 f" [! m4 ^( a% ?: a- x6 z' _! F
5 相关说明! D" {2 Z# B2 I. j
1)如果提示抓取完毕但是并没有任何数据,表示没有该城市的数据信息。: h7 j* G- S/ E6 y0 u' f% S
2)如果抓取的线路不存在,会继续搜寻包含有此名称的其他线路。例:如果不存在“5路”,可能将会出现“55路”,“305路”车的数据。
. B. u5 M. t+ ?2 C9 |# g 3)根据上面的与规则,所以查询“1”路车,可能会出现“1路”,“城乡1路”,“机场1路”等数据。但是如果其中任意一条数据在读取时连接超时,范围值“1”将被加入“失败列表”,有关“1”的线路将会被全部重新抓取。 G/ A* H* T6 A) m& m: U4 p" c
4)在软件运行过程中,每一次抓取的数据都会和以前的数据合并在一起,因此并不会因为重新抓取而清空上一次的数据。如果想清空数据重新抓取,请关闭软件再重新运行。$ S- z% c3 n% d7 T. q% M1 p
5)软件在运行过程中,无论抓取多少次,所抓取到的数据都保存在内存中,只有点击“生成文件”按钮,才会被写入硬盘。如果因为网速太慢而范围值太大,等待过久,请及时保存文件,避免数据丢失。
7 m7 H6 }9 U8 \; U2 b) X 6)如果在运行过中,如抓取1-100,中途在抓取到50时,因为弹出“网络连接超时”对话框从而导致抓取不能继续进行,此时可以调整范围值,将其修改为50-100,再重新点击抓取按钮。如果不修改范围值,将会重头开始。
: O4 W& p! n* x 7)如果软件运行崩溃或者生成数据格式有误,请发邮件跟我联系,谢谢大家的反馈。所有数据均来自网络,线路名称本身正确与否概不负责。
/ p. b0 \; q7 R* K0 _# F4 j 8)线路数据均来自网站http://www.8684.cn
! S8 x! d# Q6 l0 a! M# Q0 T 9)BusFileBuilder不能正常运行的朋友请参看本页30楼的办法,我没测试过,不保证一定成功。
9 P) N N" T# m; m3 R/ U) D3 |9 J( h8 d+ V* E6 N6 A* Q
6 广而告之
- G% m; k7 Y' @ 《回拨助手》:http://bbs.maxpda.com/viewthread.php?tid=159100* X5 ?% [0 V$ K8 i6 }. N; D% l" e
}! J% s Y/ [4 x
7 感谢在软件开发过程中所有帮助过我的朋友
% t0 Y; O' K- H& [4 y5 w
% g, h, Y- Q: J-----------------------4 K& }! t, |' @, l }
小超 ! h Y5 l. [! j2 k5 p3 J' |
gmail.com#ourloveliness(#左右交换即可 #即@)
5 D2 ?+ W% Z: s/ `5 u/ Y2008-12-04! W: e X6 h" u3 T
4 o7 J7 F! H W: G7 s( h! m+ E我在运行时是在dos下的界面,与截图不符,截图是旧版本的,但是一样能用,只是不能选线路范围了,而是把线路全部抓取出,请大家测试
1 U3 u0 J+ v- s E
# I, L3 @2 f$ `" ^* |; m[ 本帖最后由 xiaoyu0314 于 2009-4-2 16:26 编辑 ] |
|