今天办公室同事求助。这几天领导要他查找大量历史文件。
该单位以及上级的大部分材料和文件都是用EMAIL/邮件收发文的。而且,经常是PDF/RAR/word/excel/WPS/JPG各种格式的掺杂在一起。
文件名也没有规律。有的叫新建文档,有的用文号命名,有的用文件标题命名。
这可难倒他了!
收文他只收过最近几个月的,这几个月的文件他大不了用电脑自带的搜索功能慢慢搜索。可是领导要的文件有的是几年前的。这些文件很多都归档放起来了,如果去一大堆的纸质材料里头去找这些材料,犹如大海捞针!
于是他找到我帮忙,看看有没有什么捷径方法,能够快速搞定。
方案1, 利用邮箱自带的搜索功能。
现在常用的邮箱什么QQ,163等等邮箱,在网页端都有搜索功能。直接在邮件搜索里头输入要找的文件标题的几个核心关键字。比如要找《关于印发《计算机技术与软件专业技术资格(水平)考试暂行规定》和《计算机技术与软件专业技术资格(水平)考试实施办法》的通知》(它的文号是 [国人部发[2003]39号]),这篇文章,直接搜索【软件专业技术资格】,或者【国人部发】
用这个方案,找到了30%的文件。
优点,查找速度快。
缺点,找到的概率低。
方案2, 将所有的附件下载下来
邮件的量少,手工一个一个下载,倒是可以。
我朋友这个邮箱有5000多份邮件,不可能手动下载,所以写了一个程序。下载了1天,总共5G多的附件。
下载完成后,将里头的rar/zip等压缩包搜索出来,然后解压出来。然后利用Windows自带的搜索功能搜索。
比如要找《关于印发《计算机技术与软件专业技术资格(水平)考试暂行规定》和《计算机技术与软件专业技术资格(水平)考试实施办法》的通知》(它的文号是 [国人部发[2003]39号])这篇文章,直接搜索【软件专业技术资格】,或者【国人部发】。
不过发现Windows自带的搜索功能速度非常慢,搜索一次要10多分钟到半小时。
所以又找了个搜索工具提高搜索速度。
这次,效率和准确率就高了很多。
直接搜索【软件专业技术资格】,或者【国人部发】。10秒就能搜索出结果。
好在当初的那些文件里头大部分标题都是按文号或者标题命名。
所以最后和同事两个人一起,找到了大概90%的文件。
剩余的10%可能不是用邮件发过来的,或者命名是乱的而且是一个PDF或者图片,这种确实没办法找到。他只能默默的到档案室里头慢慢的一本一本找了。
不过总体来说,帮他节省了不少时间。他还是很开心的。
效果如下
优点,查找速度快,覆盖面较为全面。
缺点,第一次下载所有邮件非常耗时(下载了1天),如果内容是PDF或者图片,而且文件名是乱起的,确实搜索不到。
如果你有更好的方法,欢迎指导。
如果留言的人多的话,也许我会考虑后续做成软件。