• <sub id="xcyjv"></sub><nav id="xcyjv"><code id="xcyjv"><meter id="xcyjv"></meter></code></nav>
      <nav id="xcyjv"></nav>
    1. <form id="xcyjv"><th id="xcyjv"></th></form><nav id="xcyjv"><mark id="xcyjv"></mark></nav>

        正則表達式之文本模式的匹配和查找

         更新時間:2019年08月23日 15:42:54   作者:IT派森   我要評論
        這篇文章主要介紹了正則表達式之文本模式的匹配和查找操作方法,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下

        1、需求

        我們想要按照特定的文本模式進行匹配或查找。

        2、解決方案

        如果想要匹配的只是簡單的文字,那么通常只需要用基本的字符串方法就可以了,比如str.find()、str.endswith()、str.startswith()或類似函數。

        示例:

        text='mark ,帥哥,18,183 帥,mark'
        print(text=='mark')
        print(text.startswith('mark'))
        print(text.startswith('mark'))
        print(text.find('帥哥'))

        結果:

        False
        True
        True
        6

        如果更為復雜的匹配則需要使用正則表達式以及re模塊。為了說明使用正則表達式的基本流程,假設我們想匹配以數字形式構成的日期,比如"11/27/2018"。示例如下:

        import re
        text1='11/27/2018'
        text2='Nov 27, 2018'
        if re.match(r'\d+/\d+/\d+',text1):
          print('符合模型:數字/數字/數字')
        else:
          print('不符合模型:數字/數字/數字')
        
        if re.match(r'\d+/\d+/\d+',text2):
          print('符合模型:數字/數字/數字')
        else:
          print('不符合模型:數字/數字/數字')

        運行結果:

        符合模型:數字/數字/數字
        不符合模型:數字/數字/數字

        如果打算針對同一模型做多次匹配,那么通常會先將正則表達式模式預編譯成一個模式對象。

        例如:

        import re
        text1='11/27/2018'
        text2='Nov 27, 2018'
        datepat=re.compile(r'\d+/\d+/\d+')
        if datepat.match(text1):
          print('符合模型:數字/數字/數字')
        else:
          print('不符合模型:數字/數字/數字')
        
        if datepat.match(text2):
          print('符合模型:數字/數字/數字')
        else:
          print('不符合模型:數字/數字/數字')

        結果:

        符合模型:數字/數字/數字
        不符合模型:數字/數字/數字

        match()方法總是嘗試在字符串的開頭找到匹配項。如果想針對整個文本搜索出所有的匹配項,那么就應該使用findall()方法,例如:

        import re
        text='今天是 11/27/2018,昨天是11/26/2018'
        datepat=re.compile(r'\d+/\d+/\d+')
        print(datepat.findall(text))

        運行結果:

        ['11/27/2018', '11/26/2018']

        當定義正則表達式時,我們常會將部分模式用括號包起來的方式引入捕獲組,捕獲組通常簡化后續對匹配文本的處理,因為每個組的內容都可以單獨提取出來。findall()方法搜索整個文本并找出所有的匹配項然后將它們以列表的形式返回。如果想以迭代的方式找出匹配項,可以使用finditer()方法。

        例如:

        import re
        #加入捕獲組
        datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
        m=datepat.match('11/27/2018')
        print(m.group(0))
        print(m.group(1))
        print(m.group(2))
        print(m.group(3))
        print(m.groups())
        month,day,year=m.groups()
        print(month)
        print(day)
        print(year)
        
        print('*'*20)
        
        text='今天是 11/27/2018,昨天是11/26/2018'
        for month,day,year in datepat.findall(text):
          print('{}-{}-{}'.format(year,month,day))
        
        print('*'*20)
        
        for m in datepat.finditer(text):
          print(m.groups())

        結果:

        11/27/2018
        11
        27
        2018
        ('11', '27', '2018')
        11
        27
        2018
        ********************
        2018-11-27
        2018-11-26
        ********************
        ('11', '27', '2018')
        ('11', '26', '2018')

        3、分析

        本節主要介紹了re模塊對文本匹配和搜索的基本功能,首先用re.compile()對模式進行編譯,然后使用想match()、findall()、finditer()這樣的方法做匹配和搜索。

        當指定模式時我們通常會使用原始字符串,例如:

        r'(\d+)/(\d+)/(\d+)'

        這樣的字符串不會對反斜字符轉義,這在正則表達式中非常有用。否則,我們需要用雙反斜杠線來標識一個單獨的'',例如:

        '(\\d+)/(\\d+)/(\\d+)'

        請注意match()方法只會檢查字符的開頭,有可能出現的匹配的結果并不是你想要的,例如:

        import re
        #加入捕獲組
        datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
        m=datepat.match('11/27/2018xxxx')
        print(m)

        結果:

        <re.Match object; span=(0, 10), match='11/27/2018'>

        如果想要精確匹配,可以加一個結束標記:$

        import re
        #加入捕獲組
        datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)$')
        m1=datepat.match('11/27/2018xxxx')
        m2=datepat.match('11/27/2018')
        print(m1)
        print(m2)

        結果:

        None
        <re.Match object; span=(0, 10), match='11/27/2018'>

        如果只是執行簡單的文本匹配和搜索操作,可以省略編譯步驟。
        如果打算執行很多匹配或查找操作的話,通常需要先將模式編譯然后重復使用。模塊級的函數會對最近編譯過的模式做緩存處理,并且比較省步驟。

        總結

        以上所述是小編給大家介紹的正則表達式之文本模式的匹配和查找,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
        如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

        相關文章

        最新評論

        01彩票网app
      1. <sub id="xcyjv"></sub><nav id="xcyjv"><code id="xcyjv"><meter id="xcyjv"></meter></code></nav>
          <nav id="xcyjv"></nav>
        1. <form id="xcyjv"><th id="xcyjv"></th></form><nav id="xcyjv"><mark id="xcyjv"></mark></nav>
            汉中 | 漯河 | 舟山 | 天长 | 株洲 | 咸阳 | 云南昆明 | 曹县 | 澳门澳门 | 山西太原 | 扬中 | 昌都 | 保定 | 寿光 | 阿里 | 锦州 | 三明 | 辽阳 | 德清 | 保亭 | 长葛 | 涿州 | 宝应县 | 威海 | 桓台 | 三明 | 济源 | 广汉 | 海南海口 | 长治 | 和田 | 曲靖 | 昆山 | 襄阳 | 博尔塔拉 | 林芝 | 大理 | 保亭 | 焦作 | 那曲 | 保亭 | 盘锦 | 阳泉 | 连云港 | 茂名 | 临海 | 池州 | 慈溪 | 涿州 | 东阳 | 大庆 | 韶关 | 马鞍山 | 图木舒克 | 通辽 | 怒江 | 章丘 | 庆阳 | 东营 | 澄迈 | 阿勒泰 | 海西 | 宿迁 | 昌都 | 广汉 | 桂林 | 钦州 | 遵义 | 吉安 | 青州 | 偃师 | 迁安市 | 任丘 | 白山 | 滨州 | 吐鲁番 | 甘南 | 姜堰 | 焦作 | 迁安市 | 甘南 | 仁寿 | 诸暨 | 南平 | 高密 | 图木舒克 | 南阳 | 仁寿 | 海南海口 | 广饶 | 溧阳 | 凉山 | 三明 | 东方 | 景德镇 | 晋城 | 仙桃 | 甘肃兰州 | 山东青岛 | 南阳 | 德阳 | 燕郊 | 舟山 | 乌海 | 公主岭 | 湖州 | 广安 | 绍兴 | 山南 | 平潭 | 桂林 | 黑河 | 安岳 | 佛山 | 改则 | 日土 | 红河 | 和田 | 新余 | 丽江 | 黄石 | 毕节 | 大连 | 象山 | 赵县 | 五家渠 | 昌吉 | 沧州 | 佛山 | 白城 | 广安 | 珠海 | 武安 | 高雄 | 南平 | 日照 | 平顶山 | 大庆 | 廊坊 | 汉中 | 普洱 | 九江 | 湘潭 | 雅安 | 阿里 | 九江 | 乌海 | 辽源 | 辽宁沈阳 | 岳阳 | 吐鲁番 | 湛江 | 平凉 | 南京 | 松原 | 简阳 | 吉林 | 海宁 | 泸州 | 泗洪 | 神木 | 汕尾 | 渭南 | 馆陶 | 海门 | 云浮 | 溧阳 | 阿里 | 九江 | 中卫 | 沧州 | 仁寿 | 汉中 | 鹤壁 | 单县 | 库尔勒 | 日喀则 | 广饶 | 濮阳 | 绵阳 | 保定 | 咸宁 | 齐齐哈尔 | 云南昆明 | 泰安 | 揭阳 | 滨州 | 偃师 | 凉山 | 海南海口 | 新疆乌鲁木齐 | 天门 | 单县 | 惠州 | 宁德 | 公主岭 | 燕郊 | 百色 | 衡阳 | 玉溪 | 平凉 | 柳州 | 洛阳 | 临汾 | 鹤岗 | 绥化 | 玉溪 | 锦州 | 普洱 | 大庆 | 洛阳 | 铜陵 | 衢州 | 宁国 | 枣阳 | 日喀则 | 潮州 | 扬州 | 洛阳 | 义乌 | 张家界 | 宁国 | 邹城 | 汉川 | 东莞 | 鄂州 | 日土 | 吉安 | 赣州 | 台北 | 泰州 | 临夏 | 南充 | 盘锦 | 湛江 | 苍南 | 宁国 | 景德镇 | 万宁 | 宁国 | 济源 | 辽阳 | 临夏 | 岳阳 | 阳江 | 金昌 | 惠东 | 黄南 | 株洲 | 德宏 | 西藏拉萨 | 咸阳 | 威海 | 章丘 | 灌南 | 巢湖 | 三河 | 莱芜 | 淮南 | 海拉尔 | 海西 | 双鸭山 | 广饶 | 广饶 | 佛山 | 铜川 | 邢台 | 乳山 | 台南 | 忻州 | 偃师 | 江门 | 永州 | 台山 | 改则 | 保定 | 东营 | 昌吉 | 贺州 | 天长 | 呼伦贝尔 | 咸阳 | 鄂尔多斯 | 眉山 | 鸡西 | 晋中 | 阳春 | 桓台 | 鹰潭 | 大连 | 武安 | 香港香港 | 铜川 | 东莞 | 伊犁 | 招远 | 宜昌 | 淄博 | 莱州 | 巢湖 | 儋州 | 无锡 | 舟山 | 鞍山 | 灵宝 | 崇左 | 松原 | 连云港 | 新乡 | 黑河 | 丹阳 | 四平 | 海拉尔 | 济源 | 克孜勒苏 | 无锡 | 临汾 | 海拉尔 | 遵义 | 巴音郭楞 | 永康 | 平顶山 | 金华 | 湘潭 | 台北 | 昌吉 | 临夏 | 灵宝 | 保山 | 鹤壁 | 咸阳 | 靖江 | 湖南长沙 | 营口 | 日喀则 | 九江 | 澄迈 | 海南 | 昭通 | 靖江 | 大丰 | 吴忠 | 大连 | 昭通 | 通化 | 海西 | 北海 | 毕节 | 宿迁 | 通辽 | 株洲 | 榆林 | 海南海口 | 滨州 | 庆阳 | 临夏 | 正定 | 自贡 | 株洲 | 商丘 | 河源 | 通化 | 晋中 | 正定 | 霍邱 | 吴忠 | 菏泽 | 三亚 | 秦皇岛 | 揭阳 | 桐乡 | 神农架 | 资阳 | 博尔塔拉 | 昭通 | 临猗 | 徐州 | 白山 | 中卫 | 云浮 | 牡丹江 | 顺德 | 唐山 | 榆林 | 张家口 | 宿州 | 楚雄 | 基隆 | 临沂 | 淄博 | 四平 | 溧阳 | 十堰 | 甘南 | 中山 | 广饶 | 玉溪 | 辽阳 | 吉林长春 | 池州 | 灌云 | 金华 | 汕头 | 庄河 | 肇庆 | 牡丹江 | 桐乡 | 枣庄 | 黑龙江哈尔滨 | 克拉玛依 | 大庆 | 临沂 | 朔州 | 曲靖 | 文山 | 萍乡 | 临夏 | 吉林 | 巴彦淖尔市 | 宜昌 | 临沂 | 珠海 | 抚州 | 湘西 | 宜春 | 红河 | 庄河 | 葫芦岛 | 延安 | 定安 | 菏泽 | 哈密 | 甘孜 | 潜江 | 果洛 | 周口 | 怒江 | 定安 | 襄阳 | 邳州 | 常州 | 洛阳 | 库尔勒 | 金华 | 资阳 | 昭通 | 七台河 | 吉安 | 景德镇 | 江西南昌 | 台南 | 晋中 | 涿州 | 琼中 | 乌兰察布 | 泸州 | 许昌 | 三明 | 广西南宁 | 十堰 | 伊春 | 承德 | 阿坝 | 百色 | 河南郑州 | 德清 | 阜新 | 喀什 | 娄底 | 德阳 | 广元 | 日喀则 | 天长 | 汕尾 | 咸阳 | 锦州 | 天门 | 高密 | 鹰潭 | 绵阳 | 吉林 | 忻州 | 忻州 | 邳州 | 惠东 | 眉山 | 图木舒克 | 枣阳 | 燕郊 | 松原 | 大兴安岭 | 江门 | 禹州 | 万宁 | 大同 | 无锡 | 丹东 | 嘉峪关 | 承德 | 芜湖 | 天长 | 垦利 | 池州 | 琼海 | 河北石家庄 | 资阳 | 延安 | 山南 | 钦州 | 海拉尔 | 林芝 | 江西南昌 | 临沧 | 巴音郭楞 | 济宁 | 昌都 | 咸阳 | 台北 | 承德 | 金坛 | 台中 | 果洛 | 桓台 | 白沙 | 新乡 | 张家界 | 嘉善 | 岳阳 | 鄂州 | 珠海 | 辽阳 | 安康 | 顺德 | 新余 | 临猗 | 厦门 | 丹东 | 铜陵 | 沭阳 | 辽源 | 海拉尔 | 鄂尔多斯 | 信阳 | 铜陵 | 鹤岗 | 克拉玛依 | 天门 | 曹县 | 汉川 | 漯河 | 寿光 | 葫芦岛 | 六安 | 乌海 | 贵港 | 三明 | 迪庆 | 桓台 | 眉山 | 日喀则 | 梧州 | 黔西南 | 仁怀 | 林芝 | 新乡 | 阿坝 | 三河 | 常州 | 南阳 | 河北石家庄 | 东台 | 禹州 | 忻州 | 大理 | 青州 | 梅州 | 百色 | 定安 | 酒泉 | 禹州 | 浙江杭州 | 吐鲁番 | 海丰 | 瓦房店 | 承德 | 喀什 | 苍南 | 陇南 | 延安 | 赣州 | 内江 | 吐鲁番 | 石狮 | 阿克苏 | 喀什 | 保定 | 博罗 | 赵县 | 海西 | 遂宁 | 黑河 | 开封 | 宜昌 | 阿拉尔 | 柳州 | 淮北 | 陇南 | 屯昌 | 嘉善 | 大连 | 克孜勒苏 | 楚雄 | 新余 | 临汾 | 清远 | 邳州 | 遂宁 | 贺州 | 淮南 | 赣州 | 曹县 | 寿光 | 眉山 | 燕郊 | 兴化 | 长治 | 厦门 | 慈溪 | 白沙 | 湖南长沙 | 柳州 | 酒泉 | 来宾 | 桐城 | 淮北 | 三亚 | 铜仁 | 乐平 | 玉溪 | 乐平 | 丹东 | 诸暨 | 桐城 | 清徐 | 庄河 | 湖北武汉 | 溧阳 | 贺州 | 岳阳 | 湘西 | 昌吉 | 金昌 | 山西太原 | 清远 | 梅州 | 海南海口 | 库尔勒 | 广元 | 淮北 | 邵阳 | 建湖 | 阿拉尔 | 海安 | 云浮 | 大同 | 昌吉 | 台湾台湾 | 保山 | 义乌 | 三亚 | 天水 | 焦作 | 海宁 | 平顶山 | 陇南 | 涿州 | 简阳 | 株洲 | 台中 | 自贡 | 徐州 | 怒江 | 阳江 | 防城港 | 昌吉 | 昌吉 | 中山 | 海宁 | 承德 | 襄阳 | 博尔塔拉 | 邹城 | 赵县 | 临夏 | 鹤岗 | 牡丹江 | 简阳 | 邵阳 | 日土 | 宜都 | 聊城 | 衡水 | 江西南昌 | 涿州 | 项城 | 湘潭 | 长治 | 唐山 | 大连 | 濮阳 | 湖北武汉 | 通化 | 铜陵 | 临汾 | 阿里 | 宜昌 | 东海 | 宝应县 | 正定 | 百色 | 瑞安 | 黔西南 | 赤峰 | 浙江杭州 | 安阳 | 靖江 | 兴安盟 | 安庆 | 株洲 | 克孜勒苏 | 文昌 | 济宁 | 泉州 | 桐乡 | 惠东 | 和田 | 正定 | 邯郸 | 改则 | 朔州 | 安吉 | 南京 | 吉林长春 | 普洱 | 泸州 | 禹州 | 贵港 | 长葛 | 松原 | 儋州 | 长垣 | 来宾 | 禹州 | 嘉峪关 | 曲靖 | 徐州 | 双鸭山 | 宁波 | 北海 | 潜江 | 涿州 | 朝阳 | 松原 | 泰兴 | 嘉兴 | 包头 | 揭阳 | 泉州 | 佳木斯 | 牡丹江 | 吉安 | 三门峡 | 儋州 | 白山 | 喀什 | 岳阳 | 三河 | 新疆乌鲁木齐 | 台湾台湾 | 葫芦岛 | 辽宁沈阳 | 桐乡 | 三亚 | 曹县 | 临夏 | 辽阳 | 余姚 | 潍坊 | 东海 | 黔南 | 广汉 | 汝州 | 三明 | 柳州 | 韶关 | 德州 | 钦州 | 琼中 | 东营 | 云浮 | 新沂 | 文昌 | 西藏拉萨 | 梅州 | 桐城 | 深圳 | 菏泽 | 三明 | 珠海 | 台北 | 庄河 | 燕郊 | 榆林 | 阜阳 | 吉林 | 娄底 | 通化 | 娄底 | 东海 | 宜春 | 三亚 | 云南昆明 | 福建福州 | 朔州 | 信阳 | 莒县 | 偃师 | 北海 | 靖江 | 海拉尔 | 镇江 | 济宁 | 营口 | 许昌 | 克孜勒苏 | 淮南 | 玉溪 | 信阳 | 阿勒泰 | 宣城 | 毕节 | 公主岭 | 瓦房店 | 乌海 | 南安 | 四川成都 | 福建福州 | 保定 | 日土 | 屯昌 | 惠州 | 铁岭 | 武夷山 | 双鸭山 | 邳州 | 昆山 | 和田 | 岳阳 | 黄南 | 芜湖 | 莒县 | 张北 | 绍兴 | 台北 | 北海 | 东方 | 雅安 | 永州 | 福建福州 | 宁国 | 赵县 | 新泰 | 天长 | 桐城 | 连云港 | 长垣 | 抚州 | 沧州 | 海拉尔 | 基隆 | 徐州 | 陕西西安 | 汉川 | 琼海 | 桐城 | 龙口 | 日照 | 乳山 | 岳阳 | 海南 | 儋州 | 孝感 | 三门峡 | 南安 | 宣城 | 晋中 | 贵州贵阳 | 鹤岗 | 浙江杭州 | 宁夏银川 | 大兴安岭 | 泰兴 | 海拉尔 | 鹤岗 | 四川成都 | 本溪 | 莱芜 | 塔城 | 台南 | 浙江杭州 | 宁波 | 河南郑州 | 五指山 | 白城 | 三亚 | 新泰 | 杞县 | 宜春 | 阿拉善盟 | 芜湖 | 玉林 | 临夏 | 江苏苏州 | 仙桃 | 陇南 | 玉溪 | 嘉兴 | 鄢陵 | 阜阳 | 淄博 | 阜阳 | 安康 | 随州 | 巴中 | 莆田 | 阿拉尔 | 温岭 | 七台河 | 开封 | 温岭 | 怒江 | 四平 | 阿拉尔 | 宝应县 | 迪庆 | 项城 | 淄博 | 阳江 | 南充 | 广西南宁 | 海门 | 西藏拉萨 | 河源 | 那曲 | 安阳 | 抚顺 | 荣成 | 德宏 | 江苏苏州 | 内江 | 四平 | 海东 | 阜阳 | 肇庆 | 宝应县 | 云浮 | 嘉善 | 辽源 | 福建福州 | 东营 | 灵宝 | 抚顺 | 灌南 | 肇庆 | 丽水 | 高密 | 湖北武汉 | 白城 | 黑龙江哈尔滨 | 偃师 | 揭阳 | 改则 | 上饶 | 汝州 | 临汾 | 宁国 | 包头 | 辽宁沈阳 | 甘南 | 景德镇 | 黑河 | 桓台 | 永州 | 莱芜 | 枣庄 | 山南 | 安康 | 红河 | 营口 | 乳山 | 南京 | 和田 | 鹤岗 | 贵州贵阳 | 绵阳 | 玉溪 | 伊春 | 蚌埠 | 醴陵 | 鄂州 | 保定 | 宜昌 | 武安 | 枣阳 | 徐州 | 吉林长春 | 香港香港 | 黄冈 | 沛县 | 崇左 | 无锡 | 徐州 | 深圳 | 潜江 | 濮阳 | 芜湖 | 钦州 | 忻州 | 武夷山 | 正定 | 烟台 | 杞县 | 天水 | 焦作 | 邹城 | 秦皇岛 | 濮阳 | 包头 | 深圳 | 红河 | 张北 | 瑞安 | 揭阳 | 无锡 | 三沙 | 陕西西安 | 五指山 | 平凉 | 陇南 | 改则 | 霍邱 | 枣庄 | 寿光 | 牡丹江 | 邹城 | 林芝 | 湖北武汉 | 南平 | 菏泽 | 乌海 | 靖江 | 玉溪 | 台北 | 荣成 | 慈溪 | 庆阳 | 安顺 | 广元 | 周口 | 遂宁 | 自贡 | 张北 | 中卫 | 惠东 | 琼海 | 临海 | 丹阳 | 茂名 | 沛县 | 珠海 |