源码网,源码论坛,源码之家,商业源码,游戏源码下载,discuz插件,棋牌源码下载,精品源码论坛

 找回密码
 立即注册
查看: 422|回复: 27

[ASP编程] ASP获取网页全部图片地址并保存为数组的正则

[复制链接]

7万

主题

861

回帖

32万

积分

论坛元老

Rank: 8Rank: 8

积分
329525
发表于 2008-3-3 19:30:06 | 显示全部楼层 |阅读模式
ASP常用函数:getIMG()获取网页全部图片地址并保存为数组 目前还是有BUG的,最新的测试页面在: http://www.reallydo.com/getimg.asp
正则分析页面在: http://jorkin.reallydo.com/article.asp?id=380 
发现BUG请在后面留言,谢谢.
1.31修正
src=后面有空格不能正确匹配.已修正.
src=''为空时出错.已修正.
发现BUG: 图片路径有多个空格时只能保留一个.未修正.
2.18修正
图片路径有多个空格时只能保留一个的BUG.已修正.
复制代码 代码如下:
<% 
'功能:获取全部图片地址,保存到一个数组. 
'来源:http://jorkin.reallydo.com/article.asp?id=448 
'需要ReplaceAll函数:http://jorkin.reallydo.com/article.asp?id=406 

Function getIMG(sString) 
    Dim sReallyDo, regEx, iReallyDo 
    Dim oMatches, cMatch 
    '//定义一个空数组 
    iReallyDo = -1 
    ReDim aReallyDo(iReallyDo) 
    If IsNull(sString) Then 
        getIMG = "" 
        Exit Function 
    End If 
    '//格式化HTML代码 
    '//将每个 <img 换行 方便正则替换 
    sReallyDo = sString 
    On Error Resume Next 
    sReallyDo = Replace(sReallyDo, vbCr, " ") 
    sReallyDo = Replace(sReallyDo, vbLf, " ") 
    sReallyDo = Replace(sReallyDo, vbTab, " ") 
    sReallyDo = Replace(sReallyDo, "<img ", vbCrLf & "<img ", 1, -1, 1) 
    sReallyDo = Replace(sReallyDo, "/>", " />", 1, -1, 1) 
    sReallyDo = ReplaceAll(sReallyDo, "= ", "=", True) 
    sReallyDo = ReplaceAll(sReallyDo, "> ", ">", True) 
    sReallyDo = Replace(sReallyDo, "><", ">" & vbCrLf & "<") 
    sReallyDo = Trim(sReallyDo) 
    On Error GoTo 0 
    Set regEx = New RegExp 
    regEx.IgnoreCase = True 
    regEx.Global = True 
    '//去除onclick,onload等脚本 
    regEx.Pattern = "\s[on].+?=([\""|\'])(.*?)\1" 
    sReallyDo = regEx.Replace(sReallyDo, "") 
    '//将SRC不带引号的图片地址加上引号 
    regEx.Pattern = "<img.*?\ssrc=([^\""\'\s][^\""\'\s>]*).*?>" 
    sReallyDo = regEx.Replace(sReallyDo, "<img src=""$1"" />") 
    '//正则匹配图片SRC地址 
    regEx.Pattern = "<img.*?\ssrc=([\""\'])([^\""\']+?)\1.*?>" 
    Set oMatches = regEx.Execute(sReallyDo) 
    '//将图片地址存入数组 
    For Each cMatch in oMatches 
        iReallyDo = iReallyDo + 1 
        ReDim Preserve aReallyDo(iReallyDo) 
        aReallyDo(iReallyDo) = regEx.Replace(cMatch.Value, "$2") 
    Next 
    getIMG = aReallyDo 
End Function 
%> 
回复

使用道具 举报

0

主题

8878

回帖

0

积分

中级会员

Rank: 3Rank: 3

积分
0
发表于 2022-8-11 15:51:17 | 显示全部楼层
哈哈哈哈哈哈哈
回复 支持 反对

使用道具 举报

0

主题

1万

回帖

0

积分

中级会员

Rank: 3Rank: 3

积分
0
发表于 2022-8-16 20:33:15 | 显示全部楼层
非常vbcbvcvbvcb
回复 支持 反对

使用道具 举报

3

主题

1万

回帖

172

积分

注册会员

Rank: 2

积分
172
发表于 2022-10-5 14:31:00 | 显示全部楼层
看看怎么样再说
回复 支持 反对

使用道具 举报

6

主题

1万

回帖

247

积分

中级会员

Rank: 3Rank: 3

积分
247
发表于 2022-11-12 06:03:03 | 显示全部楼层
不错的源码论坛
回复 支持 反对

使用道具 举报

4

主题

1万

回帖

60

积分

注册会员

Rank: 2

积分
60
发表于 2022-11-19 17:35:26 | 显示全部楼层
给爸爸爸爸爸爸爸爸爸爸八佰伴八佰伴
回复 支持 反对

使用道具 举报

1

主题

1万

回帖

307

积分

中级会员

Rank: 3Rank: 3

积分
307
发表于 2023-1-23 18:16:14 | 显示全部楼层
来看看怎么样
回复 支持 反对

使用道具 举报

0

主题

1万

回帖

68

积分

注册会员

Rank: 2

积分
68
发表于 2023-3-31 11:57:00 | 显示全部楼层
来看看!!!
回复 支持 反对

使用道具 举报

0

主题

1万

回帖

0

积分

中级会员

Rank: 3Rank: 3

积分
0
发表于 2023-5-1 05:36:18 | 显示全部楼层
有什么好的服务器
回复 支持 反对

使用道具 举报

0

主题

1万

回帖

0

积分

中级会员

Rank: 3Rank: 3

积分
0
发表于 2023-6-24 02:33:29 | 显示全部楼层
hi哦和烦恼农家女
回复 支持 反对

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies

本版积分规则

手机版|小黑屋|网站地图|源码论坛 ( 海外版 )

GMT+8, 2024-9-21 01:47 , Processed in 0.079461 second(s), 26 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表