最近一直在完善Soukey采摘的两个功能:数据加工及数据导出
1、数据加工:可支持在数据采集后,进行字符串合并、字符串替换、字符串截取等操作,这样做可以有效的提升需要使用数据的精度,尽管这样做会降低数据采集的性能;
2、数据导出:在1.0版本中数据导出是一个鸡肋的功能, 此次对数据导出进行了有效加强,可以导出:文本、excel、access、mssqlserver、mysql等,同时还可进行web发布;
配合数据加工的功能,可以在一定程度上实现自动化的数据采集、加工、发布等操作,具体完善的功能可参见稍后的版本发布说明。
完成此功能后,暂时不对Souk...
[更多...]
Posted in: Tags:
最新消息,
soukey采摘,
bug
新建采集任务,在采集规则中,限制条件可选择“匹配时去掉网页符号”,今日(2009-7-15)发现无法去掉网页符号,此为一个bug。
修正如下:(前提条件为:您具备一定的c#编程能力,如无法自行修改,请稍等最新版本)
1、下载源码,打开项目工程;
2、找到文件cGatherWeb.cs文件,在Gather目录下;
3、 第221行,strCut += "[^<>].*?"; 删除“.”,修改后为:strCut += "[^<>]*?...
[更多...]
Posted in:
技术文档 Tags:
bug
Soukey采摘已经提交到了专业的软件下载站提供下载服务。
注意:Soukey采摘需要在Microsoft .net Framework 2.0环境下方可正常运行,由于工作失误并未提供readme进行详细说明,望大家谅解。
同时发现blogengine.net文章缩略时出现乱码,比较郁闷。
Posted in: Tags:
soukey采摘,
最新消息
/* Style Definitions */
table.MsoNormalTable
{mso-style-name:普通表格;
mso-tstyle-rowband-size:0;
mso-tstyle-colband-size:0;
mso-style-noshow:yes;
mso-style-priority:99;
mso-style-qformat:yes;
mso-style-parent:"";
mso-padding-alt:0cm 5.4pt 0cm 5.4pt;
mso-para-margin:0cm;
mso-para-...
[更多...]
Normal
0
7.8 磅
0
2
false
false
false
EN-US
ZH-CN
X-NONE
...
[更多...]
Normal
0
7.8 磅
0
2
false
false
false
EN-US
ZH-CN
X-NONE
MicrosoftInternetExplorer4
...
[更多...]
Soukey采摘1.0测试版终于可以提供下载了,同时源码也更新到了,都可通过本站下载。
相比较前一个版本,从功能上没有发生太大的本质变化,只是修改了大量的bug,并且加强了软件的操作,毕竟如果软件面向大众用户,软件的操作一定要更简单化。同时提供了在线更新的功能,可通过软件自动检查最新版本,并进行最新版本的下载。Soukey采摘功能 如下:
1、多任务、多线程的网页数据采集;
2、支持cookie、post方式;
3、采集数据具备任务临时保存功能,保障数据采集的有效性;临时数据保持为xml文件;
4、采集数据支持导出,可导出Excel及文本文...
[更多...]
Posted in: Tags:
soukey采摘