在專案開發中不少朋友都會遇到字串編碼、解碼或者編碼轉換的問題。
為了方便初學者朋友,我就在這裡拋磚引玉地講解一下吧。
在C#中我們一般使用
System。Text。Encoding
來處理字串編碼的問題。
1、字串解碼
string code = “00430023662f4e0095e85f884f1896c576848bed8a00”;
有這麼一段程式碼,我們如何把它轉換成可識別的中文呢?
有經驗或對各種編碼比較熟悉的朋友可能直接就可以看出來,但是我們在不知道編碼的情況下如何快速把該編碼轉換為漢字呢?
string text = Encoding。UTF8。GetString(byte[] bytes);
在知道這是UTF8編碼的情況下我們可以透過GetString來進行解碼。
不知道編碼其實我們可以透過遍歷的方式來窮舉一下就可以了:
[csharp]
view plaincopyprint?
string
sources =
“C#是一門很優雅的語言”
;
string
code =
“00430023662f4e0095e85f884f1896c576848bed8a00”
;
foreach
(var encoding
in
Encoding。GetEncodings())
{
string
temp_code =
string
。Concat(encoding。GetEncoding()。GetBytes(sources)。Select(item => item。ToString(
“x”
)。PadLeft(2,
‘0’
)));
if
(temp_code == code)
{
Console。WriteLine(temp_code);
Console。WriteLine(encoding。Name);
}
}
如果沒有sources字串,只有code編碼的時候也可以遍歷所有encoding,看看什麼encoding可以輸出正常的中文即可。
或者在直接知道編碼的情況下:
[csharp]
view plaincopyprint?
string
code =
“00430023662f4e0095e85f884f1896c576848bed8a00”
;
byte
[] buffer = Regex。Matches(code,
“[0-9a-fA-F]{2}”
)。Cast
()。Select(item => Convert。ToByte(item。Value, 16))。ToArray();
Console。WriteLine(Encoding。BigEndianUnicode。GetString(buffer));
2、字串編碼
編碼就相對比較簡單了。
[csharp]
view plaincopyprint?
string
temp_code =
string
。Concat(encoding。GetEncoding()。GetBytes(sources)。Select(item => item。ToString(
“x”
)。PadLeft(2,
‘0’
)));
我們上面的解碼過程中就是把字串用各種編碼方式進行編碼然後和已有的編碼比較。
3、編碼轉換
[csharp]
view plaincopyprint?
byte
[] buffer = Encoding。UTF8。GetBytes(sources);
//可能是從其他地方獲取過來的引數
buffer = Encoding。Convert(Encoding。UTF8
/*原始編碼*/
, Encoding。ASCII
/*目標編碼*/
, buffer);
PS:
在web開發中可能經常遇到的是url編碼、解碼的問題,或者url引數亂碼等等。。。
Server。UrlEncode(“”);Server。UrlDecode(“”);System。Web。HttpUtility。UrlEncode(“”);System。Web。HttpUtility。UrlDecode(“”);System。Uri。EscapeDataString(“”);System。Uri。UnescapeDataString(“”);
通常可以使用這些工具類來編碼、解碼。亂碼一般都是因為傳送方和接收放使用的編碼不一致造成的,在解碼過程中加上正確的編碼即可。