干货一文读懂正则表达式,从此爬虫是路人

北京荨麻疹专治医院 http://m.39.net/pf/a_9214235.html
摘自百度

废话少说,直接进入正题。

在学习一样知识前,我们得先知道“是什么,有什么用,怎么用”吧?那好,下面就按这个模式学习。

一.什么是正则表达式

官方文邹邹的描述没意思,这玩意说人话就是类似于这么一个场景:在1-...中找出所有以1为开头的数字。怎么找?很明显,设置一种过滤规则,把以1开头的数字提取出来,不需要的就抛弃它。嗯,这就是说人话的正则表达式概念,由此可知正则表达式的概念是“描述、匹配一系列符合某个语规则的字符串搜索模式”。

二.正则表达式有什么用

1.在一堆信息中快速找出你想要的东西,比如从一个网页的html文件中找出里面包含的所有超链接

2.把字符串中某个部分替换开来,比如把“卢*伟牛*”中的“卢*伟”替换成“卢老师”

3.把字符串按照你想要的样子分割开来,比如把“卢*伟牛*”分成“卢*伟”和“牛*”

4.比如网站验证用户名是否符合规则什么的

三.正则表达式怎么用

要解决这个问题,我们把它分为“基本语法,demo案例”两个部分来学习。

1.基本语法

由于语法知识不少,自己总结的话又比较麻烦,鉴于菜鸟教程上有很好的语法讲解,所以就直接引用了,嘻嘻。以上两图均摘自菜鸟教程,链接:


转载请注明:http://www.aierlanlan.com/cyrz/4939.html