硬盘中收藏的照片,日久天长缺乏整理,可能会出现“重复”现象,重复的照片会占用多余的磁盘空间,造成资源的浪费。在这些重复的文件中,有的文件名相同但内容不同,有的文件名不同但内容相同。若查重过程中操作不慎,会造成照片丢失的遗憾。本文讲述照片查重和防止因消除重复文件操作不而当造成照片丢失的技巧。
小知识:照片重复的两种情形及其弊端
文件异名但内容重复:有时,因照片整理或共享,一些照片的名字很有可能被更改,这样有的照片虽然看似文件名都不同,但其内容实际上是完全相同的,这样就造成了相同照片白白占用磁盘空间的浪费现象。
文件同名但内容不同:由于相机对默认目录中文件命名的数量一般都有限制,所以很可能出现照片名重复的现象。例如佳能单反默认目录存储张数为10000张,超过编号9999后,重新自动建立文件夹,文件名重新从0001编号。这样拍摄的照片一多之后,便会出现重复的编号。在照片归类时若所用查找重复文件的方法不当,以为同名的照片是同一张照片,不小心就容易在复制或清理时覆盖或删除,造成同名照片中的一张或一系列的丢失。
1. 系统自带功能比较查重
在Windows 8.1或Windows 10系统环境下归集数码照片文件,在文件移动过程中若发现重复提示,要看清弹出的“替换或跳过文件”对话框(图1)。其中有3个选项,如果贸然选择了“替换目标中的文件”选项,很可能会造成同名但内容不同的照片因被覆盖而丢失;如果选择了“跳过这些文件”选项,而误以为目标文件夹中已经有了这些重复文件,因此在移动完毕后顺便将源文件夹中的遗留文件删掉,这样也会丢失照片文件。
为了防止由上面两种情况造成的照片丢失,最保险的做法是点击第三个选项“让我决定每个文件”,之后在文件对比列表中就可以一目了然地看到,虽然文件名是相同的,但照片可能是完全不同的两张。随后,可以将同名但不同内容的照片前的复选框都选中,点击“继续”按钮,这样就会在目标文件夹中保留同名照片,重复的文件名中的一张将以添加编号的方式出现(图2)。这样就巧妙地解决了文件同名但照片内容不同的文件保留问题。
在一些经典看图软件中,就集成有查找重复图片的功能。例如,用ACDSee Pro 6这款专门的看图软件就可以很方便地找出重复的图片。在ACDSee Pro 6窗口中点击“工具→查找重复项”命令,弹出重复项查找器向导;添加照片所在的文件夹(可添加多个文件夹,还可以选择“包含子文件夹”),选择在本列表或在本列表与另一个列表之间查找重复文件(图3);接下来选择查找文件名相同的文件还是内容完全相同的文件;执行下一步操作,软件便会自动扫描出文件列表中所有重复的图片,选择要删除的图片,执行下一步操作即可完成冗余图片的删除和空间的释放(图4)。
3. 文件搜索工具搜索查重
想要知道某个已知文件名的照片是否存在同名的照片,可使用Everything快速搜索工具来搜索。在存放照片的驱动器或总文件夹上右击鼠标并选择“搜索Everything”,在弹出的搜索窗口中输入要查重的照片文件名,软件随即会自动列出所有与此照片重名的文件。通过文件大小和修改日期,可初步判断重名文件是不是同一张图片(图5)。
但这一方法也不能百分百保证是同一图片。对于文件名和文件大小均相同的图片,也存在内容不同的特殊情况。为保险起见,这时最好通过在搜索结果列表中用右键菜单命令,调用系统图片预览或专用看图软件,实地查看照片的内容并作出抉择。
4. 文件查重专用工具查重
对于更加灵活需求的重复文件查找,可使用专业查重软件DoubleKiller Pro来处理。先通过该软件的“扫描选项”设置排除的文件夹或要查找的文件夹、文件类型(图6);然后通过“比较选项”设置比较的项目,可在文件名、文件大小、文件日期、文件内容之间作多项选择(图7);最后点击“运行”按钮,即可获得比较结果。
该软件对32位的系统支持较好。若使用64位系统,请改用其他工具,如Easy Duplicate Finder。该软件可以查出真正重复的文件,不管文件名是否相同,它会通过对文件实质性的内容进行对比来确定重复文件(图8)。小技巧在DoubleKiller Pro的“扫描选项”窗口中,选中“扫描*.zip压缩包”复选框,可扫描和比较zip压缩包中的图片。