一孑 posted on 七月 23, 2009 07:21
最近一直在完善Soukey采摘的两个功能:数据加工及数据导出 1、数据加工:可支持在数据采集后,进行字符串合并、字符串替换、字符串截取等操作,这样做可以有效的提升需要使用数据的精度,尽管这样做会降低数据采集的性能; 2、数据导出:在1.0版本中数据导出是一个鸡肋的功能, 此次对数据导出进行了有效加强,可以导出:文本、excel、access、mssqlserver、mysql等,同时还可进行web发布; 配合数据加工的功能,可以在一定程度上实现自动化的数据采集、加工、发布等操作,具体完善的功能可参见稍后的版本发布说明。 完成此功能后,暂时不对Souk... [更多...]

Posted in:   Tags: , ,
新建采集任务,在采集规则中,限制条件可选择“匹配时去掉网页符号”,今日(2009-7-15)发现无法去掉网页符号,此为一个bug。 修正如下:(前提条件为:您具备一定的c#编程能力,如无法自行修改,请稍等最新版本) 1、下载源码,打开项目工程; 2、找到文件cGatherWeb.cs文件,在Gather目录下; 3、 第221行,strCut += "[^<>].*?";  删除“.”,修改后为:strCut += "[^<>]*?... [更多...]

Posted in: 技术文档  Tags:
一孑 posted on 七月 14, 2009 09:53
Soukey采摘已经提交到了专业的软件下载站提供下载服务。 注意:Soukey采摘需要在Microsoft .net Framework 2.0环境下方可正常运行,由于工作失误并未提供readme进行详细说明,望大家谅解。 同时发现blogengine.net文章缩略时出现乱码,比较郁闷。

Posted in:   Tags: ,
  /* Style Definitions */ table.MsoNormalTable {mso-style-name:普通表格; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-qformat:yes; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-... [更多...]

Posted in: 操作答疑  Tags:
Normal 0 7.8 磅 0 2 false false false EN-US ZH-CN X-NONE ... [更多...]

Posted in: 操作答疑  Tags:
Normal 0 7.8 磅 0 2 false false false EN-US ZH-CN X-NONE MicrosoftInternetExplorer4 ... [更多...]

Posted in: 操作答疑  Tags:
一孑 posted on 七月 5, 2009 14:07
Soukey采摘1.0测试版终于可以提供下载了,同时源码也更新到了,都可通过本站下载。 相比较前一个版本,从功能上没有发生太大的本质变化,只是修改了大量的bug,并且加强了软件的操作,毕竟如果软件面向大众用户,软件的操作一定要更简单化。同时提供了在线更新的功能,可通过软件自动检查最新版本,并进行最新版本的下载。Soukey采摘功能 如下: 1、多任务、多线程的网页数据采集; 2、支持cookie、post方式; 3、采集数据具备任务临时保存功能,保障数据采集的有效性;临时数据保持为xml文件; 4、采集数据支持导出,可导出Excel及文本文... [更多...]

Posted in:   Tags:

Blog Roll

    最新评论

    一孑工作室声明
    本站文章均为原创,如果转载请注明出处。

    © Copyright 2010『一孑工作室』
    管理我的网站
    京ICP备10018014号