C # 살균 파일 이름 (char c in Path.GetInvalidFileNameChars())

최근에는 여러 위치에서 여러 MP3를 저장소로 옮겼습니다. ID3 태그 (TankLib-Sharp! 덕분에)를 사용하여 새 파일 이름을 구성하고 있었고 다음과 같은 결과가 나타났습니다 System.NotSupportedException.

“주어진 경로 형식이 지원되지 않습니다.”

File.Copy()또는 중 하나에 의해 생성되었습니다 Directory.CreateDirectory().

내 파일 이름을 삭제해야한다는 것을 깨닫는 데 오래 걸리지 않았습니다. 그래서 나는 명백한 일을했다.

public static string SanitizePath_(string path, char replaceChar)
{
    string dir = Path.GetDirectoryName(path);
    foreach (char c in Path.GetInvalidPathChars())
        dir = dir.Replace(c, replaceChar);

    string name = Path.GetFileName(path);
    foreach (char c in Path.GetInvalidFileNameChars())
        name = name.Replace(c, replaceChar);

    return dir + name;
}

놀랍게도 계속 예외가 발생했습니다. Path.GetInvalidPathChars()경로 루트에서 유효하기 때문에 ‘:’은 세트에 없습니다 . 나는 그것이 의미가 있다고 생각하지만, 이것은 매우 일반적인 문제 여야합니다. 누구나 경로를 위생 처리하는 짧은 코드가 있습니까? 내가 가장 철저하게 생각해 보았지만 아마도 과잉 인 것 같습니다.

    // replaces invalid characters with replaceChar
    public static string SanitizePath(string path, char replaceChar)
    {
        // construct a list of characters that can't show up in filenames.
        // need to do this because ":" is not in InvalidPathChars
        if (_BadChars == null)
        {
            _BadChars = new List<char>(Path.GetInvalidFileNameChars());
            _BadChars.AddRange(Path.GetInvalidPathChars());
            _BadChars = Utility.GetUnique<char>(_BadChars);
        }

        // remove root
        string root = Path.GetPathRoot(path);
        path = path.Remove(0, root.Length);

        // split on the directory separator character. Need to do this
        // because the separator is not valid in a filename.
        List<string> parts = new List<string>(path.Split(new char[]{Path.DirectorySeparatorChar}));

        // check each part to make sure it is valid.
        for (int i = 0; i < parts.Count; i++)
        {
            string part = parts[i];
            foreach (char c in _BadChars)
            {
                part = part.Replace(c, replaceChar);
            }
            parts[i] = part;
        }

        return root + Utility.Join(parts, Path.DirectorySeparatorChar.ToString());
    }

이 기능을 더 빠르고 덜 바로크하게 만들기위한 개선 사항은 대단히 감사하겠습니다.



답변

파일 이름을 정리하려면 다음을 수행하십시오.

private static string MakeValidFileName( string name )
{
   string invalidChars = System.Text.RegularExpressions.Regex.Escape( new string( System.IO.Path.GetInvalidFileNameChars() ) );
   string invalidRegStr = string.Format( @"([{0}]*\.+$)|([{0}]+)", invalidChars );

   return System.Text.RegularExpressions.Regex.Replace( name, invalidRegStr, "_" );
}

답변

더 짧은 해결책 :

var invalids = System.IO.Path.GetInvalidFileNameChars();
var newName = String.Join("_", origFileName.Split(invalids, StringSplitOptions.RemoveEmptyEntries) ).TrimEnd('.');

답변

Andre의 탁월한 답변을 바탕으로 예약어에 대한 Spud의 의견을 고려 하여이 버전을 만들었습니다.

/// <summary>
/// Strip illegal chars and reserved words from a candidate filename (should not include the directory path)
/// </summary>
/// <remarks>
/// http://stackoverflow.com/questions/309485/c-sharp-sanitize-file-name
/// </remarks>
public static string CoerceValidFileName(string filename)
{
    var invalidChars = Regex.Escape(new string(Path.GetInvalidFileNameChars()));
    var invalidReStr = string.Format(@"[{0}]+", invalidChars);

    var reservedWords = new []
    {
        "CON", "PRN", "AUX", "CLOCK$", "NUL", "COM0", "COM1", "COM2", "COM3", "COM4",
        "COM5", "COM6", "COM7", "COM8", "COM9", "LPT0", "LPT1", "LPT2", "LPT3", "LPT4",
        "LPT5", "LPT6", "LPT7", "LPT8", "LPT9"
    };

    var sanitisedNamePart = Regex.Replace(filename, invalidReStr, "_");
    foreach (var reservedWord in reservedWords)
    {
        var reservedWordPattern = string.Format("^{0}\\.", reservedWord);
        sanitisedNamePart = Regex.Replace(sanitisedNamePart, reservedWordPattern, "_reservedWord_.", RegexOptions.IgnoreCase);
    }

    return sanitisedNamePart;
}

그리고 이것은 내 단위 테스트입니다

[Test]
public void CoerceValidFileName_SimpleValid()
{
    var filename = @"thisIsValid.txt";
    var result = PathHelper.CoerceValidFileName(filename);
    Assert.AreEqual(filename, result);
}

[Test]
public void CoerceValidFileName_SimpleInvalid()
{
    var filename = @"thisIsNotValid\3\\_3.txt";
    var result = PathHelper.CoerceValidFileName(filename);
    Assert.AreEqual("thisIsNotValid_3__3.txt", result);
}

[Test]
public void CoerceValidFileName_InvalidExtension()
{
    var filename = @"thisIsNotValid.t\xt";
    var result = PathHelper.CoerceValidFileName(filename);
    Assert.AreEqual("thisIsNotValid.t_xt", result);
}

[Test]
public void CoerceValidFileName_KeywordInvalid()
{
    var filename = "aUx.txt";
    var result = PathHelper.CoerceValidFileName(filename);
    Assert.AreEqual("_reservedWord_.txt", result);
}

[Test]
public void CoerceValidFileName_KeywordValid()
{
    var filename = "auxillary.txt";
    var result = PathHelper.CoerceValidFileName(filename);
    Assert.AreEqual("auxillary.txt", result);
}

답변

string clean = String.Concat(dirty.Split(Path.GetInvalidFileNameChars()));

답변

System.IO.Path.GetInvalidFileNameChars() 잘못된 문자를 확인 하는 방법을 사용하고 있으며 아무런 문제가 없습니다.

다음 코드를 사용하고 있습니다.

foreach( char invalidchar in System.IO.Path.GetInvalidFileNameChars())
{
    filename = filename.Replace(invalidchar, '_');
}

답변

단순히 문자를 밑줄로 바꾸는 것이 아니라 어떤 방식으로 문자를 유지하고 싶었습니다.

내가 생각한 한 가지 방법은 일반 문자로 사용되지 않는 (내 상황에서) 비슷한 모양의 문자로 문자를 바꾸는 것이 었습니다. 그래서 나는 잘못된 문자 목록을 가져 와서 비슷한 것을 발견했습니다.

다음은 유사하게 인코딩하고 디코딩하는 기능입니다.

이 코드에는 모든 System.IO.Path.GetInvalidFileNameChars () 문자에 대한 전체 목록이 포함되어 있지 않습니다. 따라서 나머지 문자를 밑줄로 바꾸거나 확장하는 것은 사용자의 책임입니다.

private static Dictionary<string, string> EncodeMapping()
{
    //-- Following characters are invalid for windows file and folder names.
    //-- \/:*?"<>|
    Dictionary<string, string> dic = new Dictionary<string, string>();
    dic.Add(@"\", "Ì"); // U+OOCC
    dic.Add("/", "Í"); // U+OOCD
    dic.Add(":", "¦"); // U+00A6
    dic.Add("*", "¤"); // U+00A4
    dic.Add("?", "¿"); // U+00BF
    dic.Add(@"""", "ˮ"); // U+02EE
    dic.Add("<", "«"); // U+00AB
    dic.Add(">", "»"); // U+00BB
    dic.Add("|", "│"); // U+2502
    return dic;
}

public static string Escape(string name)
{
    foreach (KeyValuePair<string, string> replace in EncodeMapping())
    {
        name = name.Replace(replace.Key, replace.Value);
    }

    //-- handle dot at the end
    if (name.EndsWith(".")) name = name.CropRight(1) + "°";

    return name;
}

public static string UnEscape(string name)
{
    foreach (KeyValuePair<string, string> replace in EncodeMapping())
    {
        name = name.Replace(replace.Value, replace.Key);
    }

    //-- handle dot at the end
    if (name.EndsWith("°")) name = name.CropRight(1) + ".";

    return name;
}

자신 만의 모양을 선택할 수 있습니다. 창에서 문자표 앱을 사용하여 광산을 선택했습니다.%windir%\system32\charmap.exe

검색을 통해 조정하면이 코드를 업데이트합니다.


답변

문제는 먼저 Path.GetDirectoryName나쁜 문자열을 호출한다는 것 입니다. 파일 이름이 아닌 문자가 있으면 .Net은 문자열의 어느 부분이 디렉토리인지 throw인지 알 수 없습니다. 문자열 비교를 수행해야합니다.

전체 경로가 아닌 파일 이름 만 나쁜 것으로 가정하면 다음을 시도하십시오.

public static string SanitizePath(string path, char replaceChar)
{
    int filenamePos = path.LastIndexOf(Path.DirectorySeparatorChar) + 1;
    var sb = new System.Text.StringBuilder();
    sb.Append(path.Substring(0, filenamePos));
    for (int i = filenamePos; i < path.Length; i++)
    {
        char filenameChar = path[i];
        foreach (char c in Path.GetInvalidFileNameChars())
            if (filenameChar.Equals(c))
            {
                filenameChar = replaceChar;
                break;
            }

        sb.Append(filenameChar);
    }

    return sb.ToString();
}