c# 导出Excel的方法很多,在此不进行一一介绍,可通过网上查找。在此仅说明如果使用excel组件时,导出excel后无法彻底关闭excel的问题。
通过 new Interop.Excel.Application()后,在系统中就建立了excel.exe进程,当完成导入工作后,尽管使用了GC.Collect(),但还会存在有可能无法冠词excel进程的问题。给出的方法是杀掉excel进程,但需要在杀excel进程 前需要获知程序创建的进程ID,以便通过ID杀掉进程,而不是通过名称杀掉进程,看到网上有些例子是通过名称杀进程,这样做有可能导致正在使用的excel文件也会被杀掉,造...
[更多...]
Posted in:
技术文档 Tags:
导出,
excel,
soukey采摘
Soukey蜘蛛是采用socket来下载网页源码的。Socket 请求发送采用的是ASCII,接收的时候采用的是默认的编码,查看了一下是gb2312,这个过程中如果网页是gb2312 时,对中文是可以解析出来的,如果是UTF8会出现部分乱码。如果接受也采用ASCII,则无论GB2312或UTF8都会出现乱码。
查了一些资料,在socket send与receive需要使用相同的编码。即如果是UTF8的页面则需要用utf8格式,测试通过。
但此种方式都需要在正式探测页面时首先获取网页的编码(或直接由用户子指定),对Soukey蜘蛛而言并不是最好的方式,所以,此问题暂不进行...
[更多...]
Posted in: Tags:
爬虫,
soukey,
采摘
很早就在sourceforge.net上建立了soukey采摘的项目,但一直没有持续更新,从今天开始,进行源码的更新管理。最新源码都可通过以下地址下载,同时本站也继续提供源代码,如果您想加入Soukey采摘的开发,那这个对您就非常有意义了。
地址为:http://sourceforge.net/projects/soukeygetdata/
坦率的说,sourceforge的操作是比较复杂的,但功能是非常强大的。没有试用过google code,不知道google code的使用是否会简单一些。
sourceforge使用说明简要
1、注册账户;
...
[更多...]
Posted in: Tags:
sourceforge
2009/6/1发布的源代码新增功能:
1、任务增加了网址下一页的导航规则,但暂时不支持js跳转;
2、增加了正在运行任务详细信息的查看功能;
修改了一些bug。
自从soukey采摘发布以来,一直没有时间对整个软件进行一次完整的测试,所以,现在还无法提供一个完整的安装版本。下一步,提供网页图片下载及任务的实时保存,这部分功能初步预计2周的时间完成,完成后,会做一次完整的代码整理,并且做一次完整的测试,并发布第一个版本,那时会提供完整的软件安装包。
当前仅限源码提供。
Posted in: Tags:
soukey 一孑 数据采集