如何用python正则表达式匹配字符串？

产品猿投稿 • 2023年2月27日下午4:18 • 技术文章 • 阅读 106

如何用python正则表达式匹配字符串？用python正则表达式匹配字符串的方法： 1、单个位置的字符串匹配这种情况我们可以使用这个(.+?)正则表达式来提取. 举例,一个字符…

如何用python正则表达式匹配字符串？

用python正则表达式匹配字符串的方法：

1、单个位置的字符串匹配

这种情况我们可以使用这个(.+?)正则表达式来提取. 举例,一个字符串"a123b",如果我们想提取ab之间的值123,可以使用findall配合正则表达式,这样会返回一个包含所以符合情况的list,代码如下:

importrestr="a123b"printre.findall(r"a(.+?)b",str)#输出['123']

1.1贪婪和非贪婪匹配

如果我们有一个字符串”a123b456b”,如果我们想匹配a和最后一个b之间的所有值而非a和第一个出现的b之间的值,可以用?来控制正则贪婪和非贪婪匹配的情况. 代码如下:

importrestr="a123b456b"printre.findall(r"a(.+?)b",str)

#输出['123']#?控制只匹配0或1个,所以只会输出和最近的b之间的匹配情况

printre.findall(r"a(.+)b",str)#输出['123b456']printre.findall(r"a(.*)b",str)#输出['123b456']

1.2多行匹配

如果你要多行匹配，那么需要加上re.S和re.M标志. 加上re.S后, .将会匹配换行符，默认.不会匹配换行符. 代码如下:

str="a23b\na34b"re.findall(r"a(\d+)b.+a(\d+)b",str)#输出[]#因为不能处理str中间有\n换行的情况re.findall(r"a(\d+)b.+a(\d+)b",str,re.S)#s输出[('23','34')]

加上re.M后,^$标志将会匹配每一行，默认^和$只会匹配第一行. 代码如下:

str="a23b\na34b"re.findall(r"^a(\d+)b",str)#输出['23']re.findall(r"^a(\d+)b",str,re.M)#输出['23','34']2、连续多个位置的字符串匹配

这种情况我们可以使用(?P<name>…)这个正则表达式来提取. 举例,如果我们有一行webserver的access日志:'192.168.0.1 25/Oct/2012:14:46:34 "GET /api HTTP/1.1" 200 44 "http://abc.com/search" "Mozilla/5.0"',我们想提取这行日志里面所有的内容,可以写多个(?P<name>expr)来提取,其中name可以更改为你为该位置字符串命名的变量,expr改成提取位置的正则即可. 代码如下:

importreline='192.168.0.125/Oct/2012:14:46:34"GET/apiHTTP/1.1"20044"http://abc.com/search""Mozilla/5.0"'reg=re.compile('^(?P<remote_ip>[^]*)(?P<date>[^]*)"(?P<request>[^"]*)"(?P<status>[^]*)(?P<size>[^]*)"(?P<referrer>[^"]*)""(?P<user_agent>[^"]*)"')regMatch=reg.match(line)linebits=regMatch.groupdict()printlinebitsfork,vinlinebits.items():printk+":"+v

输出的结果为:

status:200referrer:request:GET/apiHTTP/1.1user_agent:Mozilla/5.0date:25/Oct/2012:14:46:34size:44remote_ip:192.168.0.1

产品猿社区致力收录更多优质的商业产品，给服务商以及软件采购客户提供更多优质的软件产品，帮助开发者变现来实现多方共赢；

日常运营的过程中我们难免会遇到各种版权纠纷等问题，如果您在社区内发现有您的产品未经您授权而被用户提供下载或使用，您可按照我们投诉流程处理，点我投诉；

本文来自用户发布投稿，不代表产品猿立场；若对此文有疑问或内容有严重错误，可联系平台客服反馈；

部分产品是用户投稿，可能本文没有提供官方下下载地址或教程，若您看到的内容没有下载入口，您可以在我们产品园商城搜索看开发者是否有发布商品；若您是开发者，也诚邀您入驻商城平台发布的产品，地址：点我进入；

如若转载，请注明出处：https://www.chanpinyuan.cn/37964.html；

Python 字符串正则表达式

赞 (0)

0 0

关于作者

产品猿投稿

11.5K 文章

0 评论

5 粉丝

以上内容来自于网络，如有侵权联系即删除。微信：cstcshq

phpcms显示验证码出错怎么办？

上一篇 2023年2月27日下午4:18

实现从Redis中订阅消息转发到 WebSocket 客户端

下一篇 2023年2月27日下午4:19

技术文章

PHP处理字符中的emoji表情（判断/移除/存储）

utf-8 编码的 emoji 表情或者某些特殊字符占用 4 个字节。utf-8 编码的常用中文字符占用 3 个字节。判断字符串中是否含有 emoji 表情三个 PHP 内置函…

产品猿投稿
2023年4月3日
001050
帝国CMS多值字段for循环调用调用方法

帝国CMS多值字段for循环调用调用方法基础版 <?php$morefr=explode('||||||',$navinfor[字段名称]);$mfco…

产品猿投稿
技术文章 2023年1月31日
001010
阿里云服务器降配/升级配置操作教程

点我领取阿里云优惠券阿里云服务器是可以随时升级的，而且阿里云服务器不仅支持升级还支持降配，阿里云服务器配置包括ECS实例规格、CPU、内存大小的升级，在阿里云ECS云服务器控制台…

kilo小圈子
2022年11月4日 • 技术文章
001240
技术文章

如何解决thinkphp new self()报错问题

下面给大家介绍下如何解决thinkphp new self()报错问题，希望对需要的朋友有所帮助！具体问题描述： publicfunctiont2(){$receiver=new…

产品猿投稿
2023年4月19日
001180
技术文章

宝塔linux面板之一键安装ffmpeg命令

下面给大家介绍宝塔linux面板之一键安装ffmpeg命令，希望对需要的朋友有所帮助！一键安装ffmpeg命令一键安装命令 wgethttp://download.bt.cn/…

产品猿投稿
2023年5月7日
008250
JavaScript字符串常见基础方法精讲

本篇文章给大家带来了关于javascript的相关知识，其中主要介绍了关于字符串的相关知识，其中主要介绍了常用的基础方法以及特殊字符、emoji内部表示方式等内容，下面一起来看一下…

产品猿投稿
2022年11月27日 • 技术文章
001170
技术文章

判断是否为jquery对象使用什么运算符

判断一个对象是否为jquery对象使用“instanceof”运算符；instanceof运算符可以判断一个对象是否为某指定数据类型，语法为“if(对象变量 instanceof …

产品猿投稿
2023年1月15日
001490
技术文章

PHP数组去重的5种方法有哪些？

PHP数组去重的5种方法有哪些？方法一：双重for循环去重原理两两比较如果相等的话就删除第二个例如：1 1 1 3 2 1 2 4 先让第一个1 即arr[0]与后面的一…

产品猿投稿
2023年3月1日
001170
WordPress多站点不支持timthumb.php解决方法

在使用wordpress主题的时候，因为timthumb基于安全问题，除了支持指定的几个网站的外链图片外，不支持其它任何外链图片；另一方面则是因为对本机图片地址的处理导致。解决的方…

产品猿投稿
技术文章 2023年5月7日
001660
技术文章

带你搞懂uniapp跨域问题（实例详解）

本篇文章给大家带来了关于uniapp跨域的相关知识，其中介绍了为什么会有跨域问题，这是浏览器的一种安全保护机制，一起来看一下相关的问题吧，希望对大家有帮助。为什么会有跨域问题？ …

产品猿投稿
2023年1月21日
001050

发表回复

登录后才能评论

返回顶部