新建采集任务,在采集规则中,限制条件可选择“匹配时去掉网页符号”,今日(2009-7-15)发现无法去掉网页符号,此为一个bug。

修正如下:(前提条件为:您具备一定的c#编程能力,如无法自行修改,请稍等最新版本)

1、下载源码,打开项目工程;

2、找到文件cGatherWeb.cs文件,在Gather目录下;

3、 第221行,strCut += "[^<>].*?";  删除“.”,修改后为:strCut += "[^<>]*?";

4、重新编译即可。

给各位造成的不便,深感抱歉,谢谢大家对Soukey采摘的支持。


Posted in: 技术文档  Tags:
不允许评论

Blog Roll

    最新评论

    一孑工作室声明
    本站文章均为原创,如果转载请注明出处。

    © Copyright 2010『一孑工作室』
    管理我的网站
    京ICP备10018014号