用递归写Win32的文件夹遍历

  • A+
所属分类:网络安全

文件夹遍历技术是一种非常有用的技术,在文件的搜索以及杀毒软件中都使用了这种技术。以下我将讨论如何在Win32下实现这种技术。

文件夹遍历技术的核心就是使用递归算法,关于递归算法,我这里就不多介绍了,不明白的朋友请找出谭先生的《C程序设计》参阅相关内容。

以下是我的算法伪代码:

void function( LPCTSTR lpszPath )
{
    开始查找;
    if ( 没有找到文件 )
        return;
    do
    {
        if ( 找到的文件是目录 )
            function( 找到的目录 );
        else
            对文件进行操作;
    } while ( 查找下一个文件并成功 );
}

实现这个算法所需要用到的API函数以及结构体有:

  • FindFirstFile;
  • FindNextFile;
  • WIN32_FIND_DATA。

在此我假定你已经明白了以上函数及结构体的用法,now let's begin。

现在我来编写开始查找的代码。在这之前,我先假定函数参数lpszPath传入的路径格式为X:(根目录)或X:Dir(非根目录),因为Win32程序设计中通常使用的就是这种路径格式。你一定注意到了,如果路径是根目录,它的后边有一个路径分隔符“”,反之则没有。那么我在写代码的时候必须对这两种情况分别处理。这段代码如下:

TCHAR szFind[MAX_PATH];
lstrcpy( szFind, lpszPath );
if ( !IsRoot( szFind ) ) // IsRoot是我自己编写的函数,若参数是根目录,则返回true
    lstrcat( szFind, "\" );
lstrcat( szFind, "*.*" ); // 找所有文件
WIN32_FIND_DATA wfd;
HANDLE hFind = FindFirstFile( szFind, &wfd );
if ( INVALID_HANDLE_VALUE == hFind ) // 如果没有找到或查找失败
    return;

下面我将讨论的是如果找到了文件,该怎么办。不过在此之前,请你进入MS-DOS方式,并输入dir回车,你看到了什么?

大小: 15.63 K
尺寸: 398 x 297
浏览: 39 次
点击打开新窗口浏览全图

是的,DOS是不会说假话的,不像Windows一样总把重要的东西隐藏起来不让你看到——如果你所在的不是根目录,你将会看到“.”与“..”这两个目录——这是在资源管理器中看不到的。从DOS时代走过的朋友们大抵都明白吧,一个点代表的是当前目录,两个点代表的是上一级目录。那么我在处理信息时,就一定得把它们两个过滤出去,原因我在下面解释。do-while段的代码如下:

do
{
    if ( lstrcmp( wfd.cFileName, _T(".") ) == 0 || lstrcmp ( wfd.cFileName, _T("..") ) == 0 )
        continue// 过滤这两个目录
    if ( wfd.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY )
    {
        TCHAR szFile[MAX_PATH];
        if ( IsRoot( lpszPath ) )
            wsprintf( szFile, "%s%s", lpszPath, wfd.cFileName );
        else
            wsprintf( szFile, "%s\%s", lpszPath, wfd.cFileName );
        function( szFile ); // 如果找到的是目录,则进入此目录进行递归
    }
    else
    {
        // 对文件进行操作
    }
while ( FindNextFile( hFind, &wfd ) );
FindClose( hFind ); // 关闭查找句柄

现在我来解释为什么要把那两个带点的目录过滤出去。如你所见,如果找到的是目录,那么进入此目录进行递归——那么若是当前目录呢?答案很明显,如果不对其进行过滤,那么程序将进入“当前目录”进行递归。是了,如是将导致递归无休止地进行下去。

算法就这么多了,由于这是一个极其耗费系统资源的算法,因此你在程序中用到它的时候,最好将其放到一个单独的线程中运行,否则将会导致你的程序在查找过程中没有任何响应。

如果你还有更好的算法,请贴在下面我们一起讨论。

附:IsRoot函数源码

BOOL IsRoot( LPCTSTR lpszPath )
{
    TCHAR szRoot[4];
    wsprintf( szRoot, "%c:\", lpszPath[0] );
    return ( lstrcmp( szRoot, lpszPath ) == 0 );
}