java - 關于字符串編碼。
問題描述
public static void main(String[] args) throws Exception { String str = 'resource'; System.out.println(Arrays.toString(getHash(str,'MD5').getBytes()));//使用默認解碼后輸出}public static String getHash(String str, String hashType) { try {MessageDigest digest = MessageDigest.getInstance(hashType);digest.reset();byte[] b = digest.digest(str.getBytes());System.out.println(Arrays.toString(b)); //編碼前輸出return new String(b); //使用默認編碼 } catch (NoSuchAlgorithmException e) {e.printStackTrace(); } return str;}
輸出:[-106, -85, 78, 22, 63, 78, -32, 58, -86, 77, 16, 81, -86, 81, -46, 4]
[-17, -65, -67, -17, -65, -67, 78, 22, 63, 78, -17, -65, -67, 58, -17, -65, -67, 77, 16, 81, -17, -65, -67, 81, -17, -65, -67, 4]
為什么編碼前和編碼后再解碼所輸出的不一樣?
問題解答
回答1:你可能認為(new String(b)).getBytes().equals(b),實際上并非如此。(盡管new String(s.getBytes()).equals(s)一定是。)
因為byte[]轉換成String時,有些字節是未必能轉換成字符的,比如第一個-106、第二個-85就是,所以轉換成String時前兩個就變成了未知字符(表面上會顯示?,但實際上是一個Unicode字符),再轉成byte[](你這邊defaultCharset應該是UTF-8吧),每個未知字符就變成3個字節了。
如果用GBK的話,情況還算好,但還是略有不同:
[-106, -85, 78, 22, 63, 78, -32, 58, -86, 77, 16, 81, -86, 81, -46, 4][-106, -85, 78, 22, 63, 78, 63, 58, -86, 77, 16, 81, -86, 81, 63, 4]
所以結論是:如果用String表示一個Hash值,不能把byte[]強轉換成String,而是按慣例轉換成16進制表示。
相關文章:
1. javascript - js setTimeout在雙重for循環中如何使用?2. atom開始輸入!然后按tab只有空格出現沒有html格式出現3. java - 線上應用,如果數據庫操作失敗的話應該如何處理?4. MySQL中的enum類型有什么優點?5. MYSQL 根據兩個字段值查詢 但兩個值的位置可能是互換的,這個怎么查?6. css - 如何選擇字體?7. javascript - 有適合開發手機端Html5網頁小游戲的前端框架嗎?8. javascript - h5微信中怎么禁止橫屏9. mysql - linux連接數據庫報錯10. mysql - 這種分級一對多,且分級不平衡的模型該怎么設計表?
