|
感谢作者,原帖地址http://www.hi-pda.com/forum/view ... &extra=page%3D1; c+ B2 a6 o% D
7 \$ I4 }- I+ Y$ g3 e2009年4月2日 更新说明# M6 J% ~; \# o7 p* P
: g, S7 V5 `0 ~6 N g: W
1 更新网页解析规则,解决个别城市无法顺利抓取的问题。
2 s, l# M/ d, V5 k# R; z3 I( P, K6 B3 K
2009年4月1日 更新说明
& a6 p. C: T; X$ v t9 ^6 B( B4 O% J! _* a, V+ V" n
迫于Palmer们强大的压力,熬夜推出全新版本。为了节约时间,没有制作界面,请谅解。3 m6 n, R" T) W2 E- b% ]) t4 H
时间仓促,未能仔细测试,欢迎指正。感谢各位朋友的支持。. G, B0 X$ b6 s4 u+ ?
+ w* u6 y6 N v4 u& o-----------------------------------------------------------------------
- [4 ?0 [1 [7 s0 U* B% Z3 p) \0 E/ n
2009年03月25日 更新说明
9 e1 a2 {. V: T" O+ m* }
7 Y/ m9 W+ K. l t* w; P* O1 因公交数据源更新,相应地调整了数据抓取路径。
: z t4 M% u, P: k7 T2 q+ x6 y7 {2 V7 q' W- R2 D$ X9 [
0 E' ?0 s$ V- @: O( M最近因为8684更新了数据访问路径,导致了BusLineDataSpider无法正常抓取数据。
, E# p7 f5 U1 Y& @0 ~+ V+ [今晚忙里偷闲,赶着更新了一下,欢迎大家测试。
9 \. |- u4 I& g) z; i( f
- y( s- j7 N- _0 b( y3 ^-----------------------------------------------------------------------. u7 d5 j4 b9 c. U) C
3 u( S/ V8 o$ F: w. b2008年12月12日 更新说明+ j0 M7 u( w3 W# K
7 Z" y, o1 L6 @. [; D% w ~* ^1 增加一个配置文件 用户可以通过配置相关属性 在生成时取消某些线路信息 如公交公司 乘车价格 {; k6 q5 R7 D
2 将同类型的线路生成在一起 方便修改路线文件
/ K1 @" J7 }( a; |' V* ~7 ]3 E9 S2 y% ]2 _
-----------------------------------------------------------------------$ X) |) D$ \# w
6 a x0 H1 [+ }' |' G. i+ H2008年12月5日16点 build20081205 更新说明
5 ?1 D' `( e! p' {: C- k$ G h2 ~* ?
这个版本开放了“软件运行日志”功能,软件的运行流程都会被写入到日志文件。这一功能对普通使用者意义不大,主要是开发者用来对软件进行纠错。但是考虑到软件在抓取数据时,可能会因为数据格式异常而导致抓取中止。因此如果大家在抓取数据时出现异常,可以把日志文件发给我供我参考纠错。打开这一功能的方法是:在BusLineDataSpider.exe的同一个目录下建立一个名为“Debug”的文件夹即可。生成的日志文件就会被写到“Debug”文件夹内,软件每一次运行都会生成一个日志。没有“Debug”文件夹的话,则此功能自动关闭。
3 C: L! k3 K% h4 Q1 J: t% T, J! S' K l8 u( j1 ~
很多朋友回复说在抓取时出现了“在抓取XXX线路时,访问无效网址”这一错误提示,这一问题主要是由于提供数据源的网站出现了非常规格式的数据,导致了以前的解析策略不能正常工作,这一问题留在下一版本解决。暂时的解决办法就是调整抓取范围,跳过有问题的线路,继续抓取。见谅。
+ O9 L8 e, b0 w* V8 r* ]6 U; E R1 d z4 R; _/ b2 N
-----------------------------------------------------------------------
; a% Z. ~6 [. }) `" Z& h) k, a/ P
- z; l5 k( E5 @9 t2 C3 T
1 作用
- C# {2 w8 P1 l4 F6 _7 i 自动生成BusLine所使用的公交线路数据,从而再也不用为找不到最新的BusLine数据而发愁。- S' z, U7 s! O: i
( f/ D( `4 ^$ h6 O
2 工作原理
) U: n1 b( F- N/ g; `6 a 从网络上自动抓取数据,按照BusLine规定的格式生成txt文件。1 K' ^/ V8 I3 q7 i- W8 J
9 `" s& d( M* ` G
3 运行条件
) I# ^0 j) ^5 u- b8 Z# Z* ] 需要.Net2.0 Framework运行库的支持。如果下载后发现程序不能运行,请前往以下地址下载:
- t+ Z- l4 B! h) y; x3 T http://www.onlinedown.net/soft/38669.htm
$ L! q% x1 a! g" I% x
" p: A3 h! e: a! y$ m8 u1 P- T3 i! o4 使用方法
* U6 K! h/ X7 a; c) \# L7 i; J 1)城市名称请填写城市拼音,如beijing。
: R) i$ v9 q$ T) ? 2)线路范围表示想获取的线路数据的范围值,如想获取1路到200路的数据填写1-200,点击“按范围抓取”按钮。如果想获取整个城市的公交数据,一般情况下填写1-999即可。从1搜索到999,如果网速不够快将耗费不少时间,请耐心等待。# f$ O- O, ^. e7 N! A4 q" Q
3)线路名称表示如果有如“机场专线”,“高新专线”这种不带号码的公交车,它的数据将不会被前一种方式所获得。请把此类公交名称填写到“线路名称”框内,点击“按名称抓取”即可。
: g( J3 M* p% T6 i( o% k8 F& r- F# H 4)代理服务器不明白什么意思的朋友不填即可。) Y8 {/ B* N8 w9 [
5)一切准备就绪,请点击“按范围抓取”或者“按名称抓取”,然后耐心等待。在抓取的过程中这两个按钮不再起作用,如果想修改参数重新抓取请先点击“停止抓取”按钮。
' Q: Q3 R8 v6 F$ W. a% D: U 6)抓取完毕会弹出操作完毕的提示框,此时点生成文件即可。生成的文件和程序在同一目录下。
% C( I7 b: a1 s2 V; Y 7)文件生成好后,还不能被BusLine直接读取,请使用“BusFile Builder”这个软件生成PDB文件。3 Q6 @' l6 L- _& K6 j
8)在抓取数据的过程中,成功获取到的线路会显示在成功列表里,如果网络连接超时将会把当前抓取的线路放入到失败列表,在其他线路抓取完毕后会对其重新抓取,直到全部成功。等不及的朋友请点击“停止抓取”。
- F' l4 b e9 ]& d
; T \% ]; n" |6 _! r' R5 c6 `5 相关说明" P/ ~5 E$ S5 [, ~1 l6 O$ g! V0 ~
1)如果提示抓取完毕但是并没有任何数据,表示没有该城市的数据信息。
4 v- U3 q. K) W, l7 k; _ 2)如果抓取的线路不存在,会继续搜寻包含有此名称的其他线路。例:如果不存在“5路”,可能将会出现“55路”,“305路”车的数据。
/ c4 z2 B0 P) r4 G$ ^) c) ^- ? 3)根据上面的与规则,所以查询“1”路车,可能会出现“1路”,“城乡1路”,“机场1路”等数据。但是如果其中任意一条数据在读取时连接超时,范围值“1”将被加入“失败列表”,有关“1”的线路将会被全部重新抓取。' G5 ^. R% K, t d3 t: G. `" P
4)在软件运行过程中,每一次抓取的数据都会和以前的数据合并在一起,因此并不会因为重新抓取而清空上一次的数据。如果想清空数据重新抓取,请关闭软件再重新运行。% s( o+ P0 L9 l8 {# f* ~3 Y4 v
5)软件在运行过程中,无论抓取多少次,所抓取到的数据都保存在内存中,只有点击“生成文件”按钮,才会被写入硬盘。如果因为网速太慢而范围值太大,等待过久,请及时保存文件,避免数据丢失。
0 U6 d4 m4 R: L 6)如果在运行过中,如抓取1-100,中途在抓取到50时,因为弹出“网络连接超时”对话框从而导致抓取不能继续进行,此时可以调整范围值,将其修改为50-100,再重新点击抓取按钮。如果不修改范围值,将会重头开始。% L" O: S' O8 D9 B* s6 s; h
7)如果软件运行崩溃或者生成数据格式有误,请发邮件跟我联系,谢谢大家的反馈。所有数据均来自网络,线路名称本身正确与否概不负责。
& L4 R! q: A' ], n 8)线路数据均来自网站http://www.8684.cn
7 L; ]3 z$ T4 k) K 9)BusFileBuilder不能正常运行的朋友请参看本页30楼的办法,我没测试过,不保证一定成功。
/ |5 u9 Q. c. V4 H& t6 f1 r& ^ V+ m
6 广而告之
' N5 y4 I. g2 f7 G! s( a 《回拨助手》:http://bbs.maxpda.com/viewthread.php?tid=159100
' d* a5 B( R* m
3 L5 a- h \4 m* x2 {4 o7 感谢在软件开发过程中所有帮助过我的朋友4 u6 x# d- b( V7 `, o( C
! x$ Q4 P3 C9 N# N9 s% ]+ U-----------------------
' ?9 d1 q" f. n( T% ^; V$ N9 u3 D5 N- u9 f7 a小超 % G' u, O p7 j2 V j6 ?0 U% G5 ?* Z
gmail.com#ourloveliness(#左右交换即可 #即@)1 y6 i D( L. O* w* D. ^* J
2008-12-04
. T1 q" ]" `4 ~9 t0 `
0 G) o+ g/ m5 \, E% p/ ?* e4 P" O我在运行时是在dos下的界面,与截图不符,截图是旧版本的,但是一样能用,只是不能选线路范围了,而是把线路全部抓取出,请大家测试6 n/ Q/ X" W( z2 c) T# A2 z2 o9 Q
1 }7 Y+ Q# |$ `5 c( X. j: o' e
[ 本帖最后由 xiaoyu0314 于 2009-4-2 16:26 编辑 ] |
|