网络矿工V1.64预计2010年3月1日发布,增强数据加工工具,增加数据多任务操作。数据回写经过实际验证,效果与发布数据一致,所以此功能你意义不大,如果需要写入数据库,则重新发布到数据库即可。
同时,新版本还会优化直接入库采集操作,将日志输出到文本,及仅输出错误日志。用户可选择不在将日志输出给界面,降低程序对内存的侵占。同时还会增加系统所引用的正则表达式的修改功能,针对特殊的网页系统内置的正则表达式无法采集实现,可通过外接接口配置自定义的正则表达式来实现数据采集,提高数据采集的精准度。
以上内容,已购用户均可免费升级。同时,针对部分网站提供的图片数据信息,我们会利用office的ocr功能封装一个小工具,用于图片的文字识别,经过我们的内部测试,office自带的之别功能不是很强,但对于部分网站电话采用图片的形式,识别精度还是很高的,所以,此部分针对数据采集还是用处很大。