成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Java獲取URL鏈接的文件類型

開發 后端
在寫網絡爬蟲的時候,需要根據鏈接來獲取文件類型,將內容正確存儲。之前我都是根據鏈接的后綴來判斷的。URLConnection提供了兩種方法可以猜測數據的MIME類型。詳細請看下文

在寫網絡爬蟲的時候,需要根據鏈接來獲取文件類型,將內容正確存儲。之前我都是根據鏈接的后綴來判斷的,比如:

http://img12.360buyimg.com/da/20120330/88_31_ZySDre.jpg

這個鏈接指向的文件就是個jpg文件。但是后來發現有諸如

http://jprice.360buyimg.com/getSkuPriceImgService.action?skuId=1850001109&origin=1&webSite=1&type=1的鏈接,這招就不靈了。后來谷歌百度了一下也沒發現解決辦法。后來機緣巧合在Java Network Programming上找到了一個辦法:

URLConnection class provides two static methods to help programs figure out the MIME type of some data; you can use these if the content type just isn't available or if you have reason to believe that the content type you're given isn't correct。

就是說URLConnection提供了兩種方法可以猜測(根據實測結果,這個猜測是相當的準)數據的MIME類型。

第一個是:

  1. public static String guessContentTypeFromName(String name) 

這個方法根據URL文件部分的后綴名來判斷類型,跟之前我的方法一樣。這個不能解決上面那個問題。

第二個是:

  1. public static String guessContentTypeFromStream(InputStream in)  

這個方法是根據流的前面幾個字節來判斷類型,這個就不需要文件后綴名了,完全可以解決上面那個問題。

測試代碼如下:

  1. BufferedInputStream bis = null;  
  2. HttpURLConnection urlconnection = null;  
  3. URL url = null;          
  4.         url = new URL(strUrl);  
  5.     urlconnection = (HttpURLConnection) url.openConnection();  
  6.     urlconnection.connect();  
  7. bis = new BufferedInputStream(urlconnection.getInputStream());  
  8.     System.out.println("file type:"+HttpURLConnection.guessContentTypeFromStream(bis)); 

原文鏈接:http://www.cnblogs.com/lisperl/archive/2012/05/21/2511224.html

責任編輯:林師授 來源: lisperl的博客
相關推薦

2010-03-10 09:27:36

Linux鏈接文件類型

2021-02-05 08:03:52

Java

2010-01-05 15:32:33

2010-03-01 15:34:38

Linux文件類型

2009-10-21 10:50:59

Linux文件類型

2010-01-12 11:37:06

Linux常見文件

2009-11-16 12:17:46

PHP上傳文件類型

2010-05-21 10:02:56

2011-06-01 10:48:28

Android系統

2017-06-09 06:14:41

2019-04-12 14:26:17

Linux命令文件

2010-04-02 13:15:01

Oracle跟蹤

2010-05-25 17:01:44

2019-01-14 09:20:35

Linux類型文件

2009-08-12 16:44:13

.NET文件類型

2023-12-04 15:42:10

類型Linux

2009-07-20 18:06:26

ASP.NET限制上傳

2024-08-26 12:18:07

Python代碼存根

2019-08-25 23:57:00

命令行Linux移動文件

2013-05-31 10:36:56

ASP.net文件上傳
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91免费看片| 欧美日韩视频一区二区 | 成人一区二区在线 | 99精品热视频 | 在线观看免费国产 | 国产精品视频中文字幕 | 国产成人精品午夜视频免费 | 久久国内精品 | 在线一区| 亚洲精品久久久久久一区二区 | 日韩三级 | 一区二区免费看 | 超碰97干| 国产成人免费视频网站高清观看视频 | 欧美日韩精品专区 | 9porny九色视频自拍 | 国产午夜精品一区二区三区四区 | 97国产成人 | 中文字字幕在线中文乱码范文 | 欧美国产精品一区二区三区 | 91久久久久久久久 | 国产精品大片在线观看 | 欧美日韩在线观看视频网站 | 高清一区二区视频 | 影音av| 国产精品日韩 | 黑人巨大精品 | 成人激情视频在线 | 欧产日产国产精品视频 | 亚洲精品电影网在线观看 | 欧美激情精品久久久久久免费 | 国产精品揄拍一区二区 | 国产视频三区 | 国产一极毛片 | 91麻豆精品国产91久久久更新资源速度超快 | 精品一区二区三区在线观看国产 | 成人在线观看免费视频 | 欧美成人精品欧美一级 | 亚洲福利在线观看 | 国产精品久久久久久久久久久久久 | 99精品久久99久久久久 |