Python模式匹配与正则表达式
你可能熟悉文本查找,即按下Ctrl-F, 输入你要查找的词。“正则表达式”是Ctrl-F的升级版本。正则表达式很有,但如果不是程序员,很少会有人了解它,尽管大多数现代文本编辑器和文字处理器都有查找和查找替换功能,可以根据正则表达式查找。正则表达式可以节约大量时间,不仅适用于软件用户,也适用于程序员。学会正则表达式,别人需要数天的繁琐工作才能解决的问题,而且别人容易出错,而你只需要击键就能解决问题。
下面先看不用正则表达式查找文本模式。
假设你希望在字符串中查找电话号码,你知道模式:3个数字,1个短横线,3个数字,1个短横线,再是4个数字。例如:498-553-5453。
假定我们用一个名为isPhoneNumber()函数来检查字符串是否匹配模式,它返回True或False。打开一个新的文件编辑器,输入以下内容:
def isPhoneNumber(text): if len(text) !=12: return False for i in range(0,3): if not text[i].isdecimal(): return False if text[3]!='-': return False for i in range(4, 7): if not text[i].isdecimal(): return False if text[7] != '-': return False for i in range(8, 12): if not text[i].isdecimal(): return False return True print('498-553-5453 is a phone number:') print(isPhoneNumber('498-553-5453')) print('Moshi moshi is a phone number:') print(isPhoneNumber('Moshi moshi'))
运行该程序,输出看起来像这样:
498-553-5453 is a phone number: True Moshi moshi is a phone number: False
用参数'498-553-5453'调用isPhoneNumber()函数将返回True,用参数‘Moshi moshi’将返回False,第一项测试失败了,因为不是12个字符。
必须添加更多代码,才能再更长的字符串中寻找这种文本模式。用下面的代码,替换上述代码中的4个print函数调用:
message='Call me at 498-553-5453 tomorrow.415-233-2322 is my office.' for i in range(len(message)): chunk=message[i:i+12] if isPhoneNumber(chunk): print('Phone number found:' + chunk) print('Done')
该程序运行时,输出看起来是这样:
Phone number found:498-553-5453 Phone number found:415-233-2322 Done
在这个例子中,虽然message中的字符很短,但它也可能包含上百万个字符,程序运行仍然不需要1秒钟。使用正则表达式查找电话号码的类似程序,运行也不会超过一秒钟,但是用正则表达式编写这类程序会快得多。
注:本文部分文字和图片来源于网络,如有侵权,请联系删除。版权归原作者所有!此页面下方声明无效!
猜你喜欢LIKE
相关推荐HOT
Python打印出变量
我们现在要键入更多的变量并且把它们打印出来。这次我们将使用一个叫“格式化字符串 (format string)”的东西. 每一次你使用 " 把一些文本引用...详情>>
2022-11-07 10:37:00Python中的可变对象与不可变对象
总结:对象可以分为 可变对象和不可变对象 可变对象:该对象所指向的内存中的值是可以被改变的,如:String、Tuple、Number。不可变对象:该对...详情>>
2022-11-07 10:26:00Python 2的结束意味着什么
Python 2的官方错误修复和安全补丁将停止更新。核心开发团队将不会修复Python 2解释器或Python 2标准库中新发现的问题。但是企业供应商仍可以自...详情>>
2022-11-07 10:24:00django扩展user用户字段inlines方式?
User为Django自带User表,需要关联详细信息表,类为UserBaseMsg(表名为user_base_msg)和另外一张表的员工状态信息,类为UserWorkMsg(表名为user...详情>>
2022-11-07 10:23:24