浅谈自动采集程序及入库 |
|
作者:未知 文章来源:网络文摘 更新时间:2006-5-6 12:22:49 |
【声明:转载此信息在于传递更多信息,其内容表达的观点并不代表本站立场,由这些信息所产生的一切后果本站不负任何责任。如果您对本信息有什么意见,欢迎和本站联系,谢谢!】http://CiDu.Net
最近网上流行着一些采集程序,更多人拿着这些东西在网上叫卖,很多不太懂的人看着那些程序眼羡,其实如果你懂一些ASP,了解自动采集程序的原理后,你会感觉实现自动化也是那么的简单. 原理及优点:通过XML中的XMLHTTP组件调用其它网站上的网页,然后批量截取或替换原有的信息使其转化成变量后再一一储存到数据库中。其主要的优点便是无需再手工添加大量的信息了,可以指定对某一个站信息的截取进行批量录入,达到省时省力的目的。与其单纯的ASP小偷程序不同的是:它已经不再依赖其目标网站。 简单事例:
1、<% 2、'声明取得目标信息的函数,通过XML组件进行实现。 3、Function GetURL(url) 4、Set Retrieval = CreateObject("Microsoft.XMLHTTP") 5、With Retrieval 6、.Open "GET", url, False 7、.Send 8、GetURL = bytes2bstr(.responsebody) 9、'对取得信息进行验证,如果信息长度小于100则说明截取失败 10、if len(.responsebody)<100 then 11、response.write "获取远程文件 <a href="&url&" target=_blank>"&url&"</a> 失败。" 12、response.end 13、end if 14、 15、End With 16、Set Retrieval = Nothing 17、End Function 18、' 二进制转字符串,否则会出现乱码的! 19、function bytes2bstr(vin) 20、strreturn = "" 21、for i = 1 to lenb(vin) 22、thischarcode = ascb(midb(vin,i,1)) 23、if thischarcode < &h80 then 24、strreturn = strreturn & chr(thischarcode) 25、else 26、nextcharcode = ascb(midb(vin,i+1,1)) 27、strreturn = strreturn & chr(clng(thischarcode) * &h100 + cint(nextcharcode)) 28、i = i + 1 29、end if 30、next 31、bytes2bstr = strreturn 32、end function 33、'声明截取的格式,从Start开始截取,到Last为结束 34、Function GetKey(HTML,Start,Last) 35、filearray=split(HTML,Start) 36、filearray2=split(filearray(1),Last) 37、GetKey=filearray2(0) 38、End Function 39、 40、Dim Softid,Url,Html,Title 41、 42、'获取要取页面的ID 43、 44、SoftId=Request("Id") 45、 46、 Url="http://www3.skycn.com/soft/"&SoftId&".html" 47、 48、 Html = GetURL(Url) 49、 50、'以截取天空软件的软件名为例子 51、 52、 Title = GetKey(Html,"<font color='#004FC6' size='3'>","</font></b></td></tr>") 53、 54、'打开数据库,准备入库 55、 56、dim connstr,conn,rs,sql 57、 58、connstr="DBQ="+server.mappath("db1.mdb")+";DefaultDir=;DRIVER={Microsoft Access Driver (*.mdb)};" 59、 60、set conn=server.createobject("ADODB.CONNECTION") 61、 62、conn.open connstr 63、 64、set rs=server.createobject("adodb.recordset") 65、 66、sql="select [列名] from [表名] where [列名]='"&Title&"'" 67、 68、rs.open sql,conn,3,3 69、 70、if rs.eof and rs.bof then 71、 72、rs("列名")=Title 73、 74、rs.update 75、 76、set rs=nothing 77、 78、end if 79、 80、set rs=nothing 81、 82、Response.Write"采集完毕!" 83、 84、%>
声明:以上信息资料大都是网上搜集而来,版权归作者,如有版权问题请留言告知我将马上改正。 文中所提到的各种观点只是原文观点,各种说法未经一一确认。并不代表本站认可此观点!!
|
资讯录入:admin 责任编辑:admin |
|
上一篇资讯: 浅谈ASP中Web页面间的数据传递
下一篇资讯: ASP 函数语法速查表 |
【字体:小 大】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 |