文章已经收录于JAVA知识大全:GitHub: JavaPointer
魔数有什么用大多数情况下,我们都是通过扩展名来识别一个文件的类型的,比如我们看到一个.txt类型的文件我们就知道他是一个纯文本文件。但是,扩展名是可以修改的,当一个文件的扩展名被修改过,怎么识别一个文件的类型呢?这就用到了我们提到的“魔数”。很多类型的文件,其起始的几个字节的内容是固定的(或是有意填充,或是本就如此)这几个字节的内容也被称为魔数,因为根据这几个字节的内容就可以确定文件类型。有了这些魔术数字,我们就可以很方便的区别不同的文件。
什么是魔数?每个class文件的头4个字节称为魔数(Magic Number),其值为:0xCAFEBABE,它的唯一作用是用于确定这个文件是否为一个能被虚拟机接受的class文件。使用魔数而不是扩展名来进行识别主要是基于安全的考虑,因为文件的扩展名可以随意地被改动。
根据文件魔数(magic number)判断文件类型 可根据MultipartFile读取文件字节 /** * 根据multipartFile读取文件字节 * @param multipartFile * @return */public static String getFileType(MultipartFile multipartFile) throws IOException { String res = null; try { InputStream inputStream = multipartFile.getInputStream(); is = (FileInputStream) inputStream; byte[] b = new byte[28]; is.read(b, 0, b.length); /** * 得到上传文件十六进制文件头 */ String fileCode = bytesToHexString(b); Iterator<String> keyIter = FILE_TYPE_MAP.keySet().iterator(); while (keyIter.hasNext()) { String key = keyIter.next(); // 对比常用文件魔数值 if (key.toLowerCase().startsWith(fileCode.toLowerCase()) || fileCode.toLowerCase().startsWith(key.toLowerCase())) { res = FILE_TYPE_MAP.get(key); break; } } } catch (FileNotFoundException e) { e.printStackTrace(); } finally { if (is != null) { is.close(); } } return res;}/** * * 得到上传文件的文件头 * * @param src * * @return * */public static String bytesToHexString(byte[] src) { StringBuilder stringBuilder = new StringBuilder(); if (src == null || src.length <= 0) { return null; } for (int i = 0; i < src.length; i++) { int v = src[i] & 0xFF; String hv = Integer.toHexString(v); if (hv.length() < 2) { stringBuilder.append(0); } stringBuilder.append(hv); } return stringBuilder.toString();}#####根据上传文件路径得到文件字节,对比魔数值
public static String getFileType(String filePath) throws IOException { String res = null; try { FileInputStream is = new FileInputStream(filePath); byte[] b = new byte[28]; is.read(b, 0, b.length); String fileCode = bytesToHexString(b); Iterator<String> keyIter = FILE_TYPE_MAP.keySet().iterator(); while (keyIter.hasNext()) { String key = keyIter.next(); // 验证前5个字符比较 if (key.toLowerCase().startsWith(fileCode.toLowerCase()) || fileCode.toLowerCase().startsWith(key.toLowerCase())) { res = FILE_TYPE_MAP.get(key); break; } } } catch (Exception e) { e.printStackTrace(); } finally { if (is != null) { is.close(); } } return res;}/** * * 得到上传文件的文件头 * * @param src * * @return * */public static String bytesToHexString(byte[] src) { StringBuilder stringBuilder = new StringBuilder(); if (src == null || src.length <= 0) { return null; } for (int i = 0; i < src.length; i++) { int v = src[i] & 0xFF; /** *此方法返回的字符串表示的无符号整数参数所表示的值以十六进制(基数为16) **/ String hv = Integer.toHexString(v); if (hv.length() < 2) { stringBuilder.append(0); } stringBui lder.append(hv); } return stringBuilder.toString();} 常见文件类型魔数 /** * 常用文件格式 * */private static void getAllFileType() { FILE_TYPE_MAP.put("ffd8ffe000104a464946", "jpg"); // JPEG (jpg) FILE_TYPE_MAP.put("89504e470d0a1a0a0000", "png"); // PNG (png) FILE_TYPE_MAP.put("47494638396126026f01", "gif"); // GIF (gif) FILE_TYPE_MAP.put("49492a00227105008037", "tif"); // TIFF (tif) FILE_TYPE_MAP.put("424d228c010000000000", "bmp"); // 16色位图(bmp) FILE_TYPE_MAP.put("424d8240090000000000", "bmp"); // 24位位图(bmp) FILE_TYPE_MAP.put("424d8e1b030000000000", "bmp"); // 256色位图(bmp) FILE_TYPE_MAP.put("41433130313500000000", "dwg"); // CAD (dwg) FILE_TYPE_MAP.put("3c21444f435459504520", "html"); // HTML (html) FILE_TYPE_MAP.put("48544d4c207b0d0a0942", "css"); // css FILE_TYPE_MAP.put("696b2e71623d696b2e71", "js"); // js FILE_TYPE_MAP.put("7b5c727466315c616e73", "rtf"); // Rich Text Format (rtf) FILE_TYPE_MAP.put("38425053000100000000", "psd"); // Photoshop (psd) FILE_TYPE_MAP.put("46726f6d3a203d3f6762", "eml"); // Email [Outlook Express 6] (eml) 便宜美国vps FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "doc"); // MS Excel 注意:word、msi 和 excel的文件头一样 FILE_TYPE_MAP.put("5374616E64617264204A", "mdb"); // MS Access (mdb) FILE_TYPE_MAP.put("252150532D41646F6265", "ps"); FILE_TYPE_MAP.put("255044462d312e350d0a", "pdf"); // Adobe Acrobat (pdf) FILE_TYPE_MAP.put("2e524d46000000120001", "rmvb"); // rmvb/rm相同 FILE_TYPE_MAP.put("464c5601050000000900", "flv"); // flv与f4v相同 FILE_TYPE_MAP.put("00000020667479706d70", "mp4"); FILE_TYPE_MAP.put("49443303000000002176", "mp3"); FILE_TYPE_MAP.put("000001ba210001000180", "mpg"); // FILE_TYPE_MAP.put("3026b2758e66cf11a6d9", "wmv"); // wmv与asf相同 FILE_TYPE_MAP.put("4d546864000000060001", "mid"); // MIDI (mid) FILE_TYPE_MAP.put("504b0304140000000800", "zip"); FILE_TYPE_MAP.put("526172211a0700cf9073", "rar"); FILE_TYPE_MAP.put("235468697320636f6e66", "ini"); FILE_TYPE_MAP.put("4d5a9000030000000400", "exe");// 可执行文件 FILE_TYPE_MAP.put("3c25402070616765206c", "jsp");// jsp文件 FILE_TYPE_MAP.put("4d616e69666573742d56", "mf");// MF文件 FILE_TYPE_MAP.put("3c3f786d6c2076657273", "xml");// xml文件 FILE_TYPE_MAP.put("494e5345525420494e54", "sql");// xml文件 FILE_TYPE_MAP.put("7061636b616765207765", "java");// java文件 FILE_TYPE_MAP.put("406563686f206f66660d", "bat");// bat文件 FILE_TYPE_MAP.put("1f8b0800000000000000", "gz");// gz文件 FILE_TYPE_MAP.put("6c6f67346a2e726f6f74", "properties");// bat文件 FILE_TYPE_MAP.put("cafebabe0000002e0041", "class");// bat文件 FILE_TYPE_MAP.put("49545346030000006000", "chm");// bat文件 FILE_TYPE_MAP.put("04000000010000001300", "mxp");// bat文件 FILE_TYPE_MAP.put("504b0304140006000800", "docx");// docx文件 FILE_TYPE_MAP.put("6431303a637265617465", "torrent"); FILE_TYPE_MAP.put("cafebabe0000002e00", "class"); FILE_TYPE_MAP.put("57415645", "wav"); FILE_TYPE_MAP.put("41564920", "avi"); FILE_TYPE_MAP.put("6D6F6F76", "mov"); // Quicktime (mov) FILE_TYPE_MAP.put("FF575043", "wpd"); // WordPerfect (wpd) FILE_TYPE_MAP.put("CFAD12FEC5FD746F", "dbx"); // Outlook Express (dbx) FILE_TYPE_MAP.put("2142444E", "pst"); // Outlook (pst) FILE_TYPE_MAP.put("AC9EBD8F", "qdf"); // Quicken (qdf) FILE_TYPE_MAP.put("E3828596", "pwl"); // Windows Password (pwl) FILE_TYPE_MAP.put("2E7261FD", "ram"); // Real Audio (ram) FILE_TYPE_MAP.put("null", null); // null} 测试结果 public static void main(String[] args) throws Exception { String type = getFileType("/Users/mac/Pictures/WechatIMG8.jpeg"); System.out.println("Except : " + type);}#####测试结果如下:
Ps:对于没有魔数值得文件可以结合文件后缀来判断文件类来判断
/** * 处理没有魔数的文件类型 * * @param fileName * @return */public static String getNotMargicFileType(String fileName) { if (!StringUtils.isEmpty(fileName)) { String suffixType = fileName.substring(fileName.lastIndexOf(".") + 1).trim().toLowerCase(); return suffixType; } return null;}GitHub: https://github.com/Rise1024/JavaPointer
java后端知识宇宙汇集,java基础(面向对象、集合、多线程)、框架(spring、springboot、doubbo、springcloud)、数据库(mysql 、oracle)、消息中间件(rabbitmq、kafka)等后端知识 正更新中@@