一孑 posted on 九月 22, 2009 08:11
在文章《如何添加自己的采集任务》中已有说明,尽管是按照Soukey采摘1.0版本进行的说明,又尽管Soukey采摘已经升级到1.6,但并不会影响当前系统的使用, 同时在Soukey采摘帮助tag中,还提供了两篇文章针对数据采集再次进行了说明 ,如果针对采集规则配置还有疑问的用户,可以查看这些内容,如果还不会配置,那就联系一孑吧。 最新消息: 1、从国庆后,本站不在提供源码下载,如果需要源码请到http://sourceforge.net/projects/soukeygetdata/ 下载; 2、国庆后发布Soukey采摘1.6正式版本,届时会启用... [更多...]

Posted in:   Tags: ,
限制条件的作用是为了可以增加采集数据的匹配准确度,譬如:同样的数据前置为<td>后置为</td>,此时可以通过限制条件进行数据匹配,只采集中文、数字等内容。 数据输出加工是对已采集的数据进行简单的数据加工,最终得到准确的采集数据。譬如:很多网站的网址都采用相对网址,此时采集后的数据直接入库系统将会无法识别,针对此种情况,可以通过增加前缀的方式把采集的网址进行合成一个最终的完整网址。 采集Ajax页面原理同采集普通的页面,但采集Ajax页面需要注意三个方面: 1、需要利用第三方工具发现真实的请求Url地址及参数,通常Ajax都是由js进行... [更多...]

Posted in: 操作答疑  Tags:
网站数据采集是一个比较专业的活,通过此类软件就可以知道,因为这类型的软件通常比较难于上手,比起word、excel来讲确实比较难。但一旦你做起了这份工作,有了一些经验,那就很容易了,就好像用word一样容易(当然如果把word用熟确实还要有一段路要走,呵呵)。Soukey采摘是不会提供软件使用帮助的,一是因为一孑比较懒,有这个功夫还不如写点博文,说说其他的,搞个帮助出来最终看的人还不多确实比较伤心,二来是因为Soukey采摘是因为当前Soukey采摘使用起来比较容易,对于一些复杂的地方都用红色字体做了标识,所以也就无需再用帮助说明了,还有一点也是最重要的,永远不要低估用户的潜力,呵呵。 ... [更多...]

Posted in: 操作答疑  Tags:

Blog Roll

    最新评论

    一孑工作室声明
    本站文章均为原创,如果转载请注明出处。

    © Copyright 2010『一孑工作室』
    管理我的网站
    京ICP备10018014号