成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ASP.NET技巧之?dāng)?shù)據(jù)采集程序淺析

開(kāi)發(fā) 后端
ASP.NET技巧之?dāng)?shù)據(jù)采集程序向你介紹如何使用ASP.NET實(shí)現(xiàn)數(shù)據(jù)采集程序的具體步驟,希望對(duì)你有所幫助。

ASP.NET技巧之?dāng)?shù)據(jù)采集程序介紹開(kāi)始首先我們來(lái)看看一點(diǎn)概念,所謂的數(shù)據(jù)采集程序也就是網(wǎng)頁(yè)小偷程序(大家別罵我哦),寫(xiě)完了來(lái)這里發(fā)點(diǎn)東西,希望大家有何高見(jiàn)共同研究.

ASP.NET技巧之?dāng)?shù)據(jù)采集程序***步,在下載數(shù)據(jù)的開(kāi)始,有些網(wǎng)站是要登錄了才能看到相應(yīng)的數(shù)據(jù),這個(gè)就需要我們發(fā)送登錄用戶(hù)名和密碼了,但我是登錄了,但他服務(wù)器也不是垃圾,在他那里重定向了,共產(chǎn)生了2個(gè)SESSION,這第2個(gè)SESSION我就不知道如何捕抓.于是我就投機(jī)^-^,用軟件將SESSION捕抓下來(lái)了1個(gè)叫Ethereal的軟件,用以下代碼加入到HTTP請(qǐng)求的頭部

  1. WebClient myWebClient = new WebClient();  
  2. string sessionkey=textBox78.Text;  
  3.      string refererurl=textBox77.Text;  
  4.      myWebClient.Headers.Clear();       
  5.      myWebClient.Headers.Add("Cookie",sessionkey);  
  6.      myWebClient.Headers.Add("Referer", refererurl);  
  7.      myWebClient.Headers.Add("User-agent""Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.5) Gecko/20031107 Debian/1.5-3"); 

這樣就欺騙了服務(wù)器了,哈哈

ASP.NET技巧之?dāng)?shù)據(jù)采集程序第二步,代碼下載

  1. byte[] myDataBuffer = myWebClient.DownloadData(remoteUri);  
  2.  download = Encoding.Default.GetString(myDataBuffer); 

ASP.NET技巧之?dāng)?shù)據(jù)采集程序第三步,數(shù)據(jù)的匹配了,我是將流讀取到數(shù)據(jù)里,然后用IndexOf得到2個(gè)關(guān)鍵字段的位置,然后用Substring取出來(lái)的,我知道這很笨,但用正則表達(dá)式難啊(誰(shuí)會(huì)的指點(diǎn)我下),匹配完了得到的字符串我就用以下的函數(shù)去掉了HTML代碼:

  1. private string StripHTML(string strHtml)  
  2.   {  
  3.    string [] aryReg ={  
  4.           @"<script[^>]*?>.*?</script>",  
  5.           @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",  
  6.           @"([\r\n])[\s]+",  
  7.           @"&(quot|#34);",  
  8.           @"&(amp|#38);",  
  9.           @"&(lt|#60);",  
  10.           @"&(gt|#62);",   
  11.           @"&(nbsp|#160);",   
  12.           @"&(iexcl|#161);",  
  13.           @"&(cent|#162);",  
  14.           @"&(pound|#163);",  
  15.           @"&(copy|#169);",  
  16.           @"&#(\d+);",  
  17.           @"-->",  
  18.           @"<!--.*\n"           
  19.          };  
  20.  
  21.    string [] aryRep = {  
  22.            "",  
  23.            "",  
  24.            "",  
  25.            "\"",  
  26.            "&",  
  27.            "<",  
  28.            ">",  
  29.            " ",  
  30.            "\xa1",//chr(161),  
  31.            "\xa2",//chr(162),  
  32.            "\xa3",//chr(163),  
  33.            "\xa9",//chr(169),  
  34.            "",  
  35.            "\r\n",  
  36.            "" 
  37.           };  
  38.  
  39.    string newReg =aryReg[0];  
  40.    string strOutput=strHtml;  
  41.    for(int i = 0;i<aryReg.Length;i++)  
  42.    {  
  43.     Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase );  
  44.     strOutput = regex.Replace(strOutput,aryRep[i]);  
  45.      
  46.    }  
  47.  
  48.    strOutput.Replace("<","");  
  49.    strOutput.Replace(">","");  
  50.    strOutput.Replace("\r\n","");  
  51.  
  52.  
  53.    return strOutput;  
  54.   }  

到了后面就是入庫(kù)了,這個(gè)大家都懂了吧.但是我還有點(diǎn)問(wèn)題就是,在我寫(xiě)數(shù)據(jù)的時(shí)候,出了EXCEPTION,說(shuō)我的字段太長(zhǎng)了,不能寫(xiě)進(jìn)到數(shù)據(jù)庫(kù),我用的是ACCESS,我試驗(yàn)下用SQL吧.

ASP.NET技巧之?dāng)?shù)據(jù)采集程序就向你介紹到這里,希望對(duì)你使用ASP.NET書(shū)寫(xiě)數(shù)據(jù)采集程序有點(diǎn)幫助。

【編輯推薦】

  1. ASP.NET運(yùn)行環(huán)境搭建淺析
  2. ASP.NET學(xué)習(xí)之ASP.NET概述
  3. ASP.NET優(yōu)點(diǎn)的十一方面淺析
  4. ASP.NET數(shù)據(jù)庫(kù)連接池設(shè)置淺析
  5. 如何學(xué)習(xí)ASP.NET之九步寶典
責(zé)任編輯:仲衡 來(lái)源: cnblogs
相關(guān)推薦

2009-08-04 10:02:36

中國(guó)站長(zhǎng)站

2009-08-05 10:17:55

ASP.NET TheASP.NET開(kāi)發(fā)技巧

2009-07-29 11:33:14

ASP.NET技巧ASP.NET應(yīng)用程序

2009-07-29 13:42:25

ASP.NET注釋

2009-08-10 13:32:15

ASP.NET TimASP.NET組件設(shè)計(jì)

2009-08-05 18:46:21

ComboBox顯示ASP.NET控件開(kāi)發(fā)

2009-08-03 13:38:18

ASP.NET編程模型

2009-07-20 16:08:04

ASP.NET應(yīng)用程序

2009-08-05 18:32:28

HtmlTextWriASP.NET控件開(kāi)發(fā)

2009-08-07 17:41:07

ASP.NET Web

2009-08-13 17:52:27

C#數(shù)據(jù)采集

2009-08-05 18:36:12

ASP.NET Che

2009-07-24 13:41:15

ASP.NET AJA

2009-08-03 18:35:51

ASP.NET數(shù)據(jù)緩存

2009-07-31 12:43:59

ASP.NET MVC

2009-08-05 15:50:13

ASP.NET優(yōu)點(diǎn)

2009-07-28 17:36:21

ASP.NET數(shù)據(jù)庫(kù)連

2009-08-04 14:56:34

ASP.NET數(shù)據(jù)類(lèi)型

2009-07-31 09:57:47

ASP.NET數(shù)據(jù)庫(kù)緩

2009-08-07 15:34:15

ASP.NET數(shù)據(jù)綁定
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 亚洲一区二区三区视频 | 亚洲男人天堂网 | 亚洲精品国产电影 | 人人爽人人草 | 国产999精品久久久 日本视频一区二区三区 | 成人在线精品视频 | 免费国产黄网站在线观看视频 | 日本免费黄色一级片 | 国产成人小视频 | 久久精品小短片 | 日本一区二区在线视频 | 精品日本久久久久久久久久 | 久久久精品一区 | 午夜免费看 | 欧美激情在线精品一区二区三区 | 91精品国产麻豆 | 男人av网 | 一级a爱片久久毛片 | 亚洲日本一区二区三区四区 | 欧美日韩中文字幕 | 在线免费亚洲视频 | 午夜视频免费在线观看 | 一级毛片大全免费播放 | 国产精品久久久久久婷婷天堂 | 亚洲国产欧美一区二区三区久久 | 97av视频在线 | 狠狠色综合网站久久久久久久 | 成人免费观看男女羞羞视频 | 国产精品成人在线播放 | 国产精品99久久久久久宅男 | 午夜小电影 | 成人毛片网站 | 精品99久久久久久 | 日韩二 | 91视频精选 | 成人a视频片观看免费 | 一区二区三区四区免费在线观看 | 男女网站在线观看 | 久久久久久亚洲精品 | 欧美成人综合 | 国产一区二区黑人欧美xxxx |