代码小技巧正则表达式过滤html标签

采集的时候有时候需要过滤掉多余的标签属性,比如img标签过滤掉除了src属性之外的所有属性例如删除titilealt等属性以及一些脚的onclick属性等。

例如过滤除了src之外的所有属性

$str=preg_replace(/\s(?!src)[a-zA-Z]+=[\\]{1}[^\\]+[\\]{1}/iu,$str);

上面的实例代码是过滤掉除了src属性外的所有标签属性

过滤设置过滤除了alt和src之外的所有属性,代码如下:

$str=preg_replace(/\s(?!(src

alt))[a-zA-Z]+=[^\s]*/iu,,$str);

过滤所有html标签的属性的正则表达式:

$str=preg_replace(/([a-z]+)[^]*/i,,$str);

只过滤alt属性的正则表达式:

(\s)alt=[^\s]*

预览时标签不可点收录于合集#个


转载请注明:http://www.aierlanlan.com/rzfs/1239.html

  • 上一篇文章:
  •   
  • 下一篇文章: