新建采集任务,在采集规则中,限制条件可选择“匹配时去掉网页符号”,今日(2009-7-15)发现无法去掉网页符号,此为一个bug。
修正如下:(前提条件为:您具备一定的c#编程能力,如无法自行修改,请稍等最新版本)
1、下载源码,打开项目工程;
2、找到文件cGatherWeb.cs文件,在Gather目录下;
3、 第221行,strCut += "[^<>].*?"; 删除“.”,修改后为:strCut += "[^<>]*?";
4、重新编译即可。
给各位造成的不便,深感抱歉,谢谢大家对Soukey采摘的支持。