Previous topicNext topic
 慧眼时时彩趋势分析系统
Help > 基本操作 >
自定义彩种及开奖号码采集器用法

软件提供了一个自定义彩种功能,基本上达到了“时时彩”全彩种支持,现在有了开奖号码采集器更是如虎添翼,可以自动更新开奖数据,完美采集各类彩票网站的数据,只要有类似走势图的网址即可。现在对自定义彩种及开奖号码采集器的使用进行介绍。

一、初始化自定义彩种:首次使用自定义彩种或想重定义自定义彩种,需要进行初始设置。

1、鼠标移动到自定义彩种右侧“设置。。。”链接文本,点击该文本进入自定义彩种初始化设置窗口。

2、软件支持3个不同的自定义彩种,可分别设置名称、开奖次数、期号位数、自动采集文本位置等。

2.1当前彩种设定:选定3个不同的自定义彩种的其中一个,点击“应用”按钮后当前的自定义彩种设置才会生效。

2.2名称:自己可设定。

2.3开奖次数:当确实明确该彩种开奖的次数,且彩种的期号是按日期进行编号的,如类似重庆时时彩的20150421-008这样的,可填入实际的开奖次数,否则一率设置为0。

2.4期号位数:此参数暂无意义。

2.5导入外部文本到数据库:用于初始化自定义彩种数据库。自定义彩种得预先准备一个不少于10期的开奖数据文本,格式要求按上图的要求。现在有开奖号码采集器制作这个初始文本简单快速多了。

2.6导入外部文本用上次文本:选定后将以上次导入过的文本(该文本应该可能已更新过了)重新导入。

2.7自动采集外部文本的结果:此选项用于进入到K线系统后软件自动采集外部文本的结果。具体意义见后续的内容。

2.8文本位置:可以在此设置窗口预先设置自动采集外部文本的位置。

2.9采集时间点位:可以在此设置窗口预先设置进入到K线系统后自动采集的时间点位。具体意义见后续的内容。

二、运行开奖号码采集器

1、运行采集器:采集器可以脱离趋势软件单独运行,为了方便看各种不同的彩种,建议大家设置不同的目录,再将采集器的运行程序复制到各个目录内。

里面有三个文件:一个是当前目录下采集器的设置参数,一个是主程序,一个是采集结果文本,通常是运行主程序后自动产生另外两个文件。当然也可以从别的地方复制过来文件,然后进行适当的修改。

参数设置文件如下:

采集结果文本:这个文本的格式是按自定义彩种设置窗口那的规定来的,即期号与奖号之间有一个半角的空格。

2、采集器主界面介绍:由5个区域组成,分别是采集网址输入区、网页预览区、网页返回区、采集结果区及采集参数设置区。要查看“网页预览区”时需要切换一下选项卡,要加大网页预览区的显示大小可以最大化采集器。

3、采集设置步骤

基本步骤:输入采集网址点击“连接网页”按钮网页有返回后,根据网页返回的文本进行采集参数设置点击“尝试采集”按钮,对比采集结果是不是正确的并适当调整采集参数参数正确后,点击“进入正常采集”按钮。

3.1采集网址:

3.1.1登录时采集网址:就是采集器开启后的采集网址,这个是用来采集更多的数据用于初始化开奖数据库用的。采集器用这个网址采集一次后就转用开奖时采集网址进行采集。

3.1.2开奖时采集网址:正常开奖时对应的采集网址,为了读取顺畅,我们一般用数据量较少的网址。

从以下网址对比来看,我们就知道区别了:

当然有时我们没有这样数据量有区别的网址,这时我们可以将这两个输入框设置成一样的,不影响采集结果。两个网址对应的页面应该要一样的,不然采集结果将不正确甚至采集不出来。

3.2连接网页:点击“连接网页”按钮后,采集器将连接“开奖时采集网址”对应的网页,连接成功后网页返回文本窗口将会有返回文本。我们根据这个文本进行采集参数设置。

按以上规则填写采集参数:

3.2.1网页返回是文本数据,期号与奖号对应的行是有规律的,这就便于程序固定采集,我们只要制订好了规则,采集器就可以一直不停的工作下去。

3.2.2采集基准:一般默认为从左或从右的第一个字符;有时碰到期号前面带有不定长的“序号”时,以“寻找基准点字符”就很有效了。

3.2.3期号的采集:按上图的说明定好期号的第一位,然后从这一位开奖向右进行截取数据。

软件有个要求,就是期号不能超过12位,此时如有超长的期号我们可以只截取一部分,去掉期号最左边的一些数据,不影响软件看趋势的。

有的网页是将最新开奖的数据放在最上面的,即它的期号是按大的往小的从上往下排列的。这时我们就要选“从下第几行开始采集”的选项了。

有时期号那可能有多余的字符,我们可以用“去除字符”的办法滤除掉,一般就去掉空格、逗号什么的。

3.2.4奖号的采集:同期号吧,设置大同小异。为了方便采集,奖号可以从左或从右设置起始位进行截取数据(截取数据都是从左向右的),视情况设置,比如有的网页从左边数的话,奖号的第一位不是在同一位置上,这时从右边开始定位的就很管用了。

3.3尝试采集:采集参数设置好后,可以点“尝试采集”进行检验采集参数是否设置正确。不正确的话重新设置参数,再重新尝试采集,直到正确为止。

尝试采集的时候如果有原来的数据,可点“清空旧数据”,将以最新的采集设置进行采集。

3.4进入正常采集:采集参数设置正确后,就可以点击“进入正常采集”了,采集器将进入自动采集状态。

3.4.1结果保存位置:默认保存到采集器所在的目录,可以根据需要保存到另外的目录。

3.4.2下次从本文件尾写入:选定此选项后,下次开启采集器时,采集到的开奖数据将累计到当前设置的结果输出文本的后面,而不是清空旧数据。

3.4.3运行后自动采集并最小化:选定此选项后,采集器将自动运行并最小化于系统任务栏。设置好采集参数后,就可以让采集器一直工作下去了。

3.4.4运行后何时采集:按默认的设置值即可,图中所示为15秒,即15秒后最小化于系统任务栏。

3.4.5累计数据:选定此选项后,每次执行采集操作时,自动将最新的数据累加到旧数据的后面,而不是清空。去掉此选项后,每次执行采集操作时将清空旧数据,得到的结果将只有最新网页页面的数据。这在正常开奖的过程中,可以去掉这个选项,慧眼趋势软件可以更快的读取到最新的开奖数据。

3.4.6为了得到更多的数据,我们可以购买个windows虚拟主机,然后将我们的采集器放到上面24小时不间断运行,这样子采集个几万期的数据不是问题。

3.4.7多次采集:防止因被采集的网址数据更新不及时错过一个采集周期,选上之后会在上次采集操作后二次打开采集进程,可以设置多次采集的时间间隔,可默认设置为0,因为采集时有个预读取时间,可以达到采集进程失败后立即重启采集进程。

3.4.8自动校时:系统时间的准确与否会影响到采集的及时性,但自动校时的间隔不宜过短。

4、相关的各个时间点位设置

下面重点讲一下这个时间点位的设置,有些人一时理解不过来,慢慢来吧。下面列出一个时间点位的图,也许比较容易理解。

采集器每60秒(即一分钟)执行一次采集操作。

通过观察网页的更新时间,我们就是制定出最佳的时间点位,获得最快的更新速度。如果设置不恰当,可能就会出现奖号延迟1期的现象。尽量避免在网页更新内容前连接网页,否则读取的数据将还是上一期的,最新的读取将只能是在下一周期。

网页真实更新完毕,在我们这边(客户端)看到时是有个时间差的。多尝试几个时间点位的设置,以获得最佳效果。预读取时间的长短,可以通过观察点击“连接网页”按钮后,到网页预览更新完成所需要的时间,此时间即为预读取时间,一般大概也就5~10秒左右吧。

采集时间点位:观察网站更新奖号的时间点,此时间点即为采集时间点位。往前推个预读取时间,理论上应为网页更新完毕的时间,如果太早了,网页还未更新完毕,还是上一期的内容,则最新的读取将只能是在下一周期,我们应尽量避免这种情况,所以这个预读取时间的选定很关键。

5、趋势软件读取采集结果

5.1采集:此按钮为按下状态时,趋势软件将自动读取采集器的结果,每分钟执行一次。非按下状态时,将退出自动采集状态。

5.2文件:定位到采集器输出的文本文件。

5.3重建:怀疑数据有异常时可点此按钮重建开奖数据库。

5.4时间点位:此设置一般比采集器的采集时间点位少个2-5秒即可。