采集的时候有时候需要过滤掉多余的标签属性,比如img标签过滤掉除了src属性之外的所有属性例如删除titilealt等属性以及一些脚的onclick属性等。
例如过滤除了src之外的所有属性
$str=preg_replace(/\s(?!src)[a-zA-Z]+=[\\]{1}[^\\]+[\\]{1}/iu,$str);
上面的实例代码是过滤掉除了src属性外的所有标签属性
过滤设置过滤除了alt和src之外的所有属性,代码如下:
$str=preg_replace(/\s(?!(src
alt))[a-zA-Z]+=[^\s]*/iu,,$str);
过滤所有html标签的属性的正则表达式:
$str=preg_replace(/([a-z]+)[^]*/i,,$str);
只过滤alt属性的正则表达式:
(\s)alt=[^\s]*
预览时标签不可点收录于合集#个