Python正则表达式提取省市名称

2023-08-2209:58:55编程语言入门到精通Comments1,424 views字数 1186阅读模式

问题导入:考虑以下城市文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ymba/54310.html

浙江省舟山市
云南省西双版纳州
新疆维吾尔族自治区伊犁州
内蒙古自治区阿拉善盟

如何提取出省、市名称呢?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ymba/54310.html

提取省市全称

import re

pattern = r'^(.*?(?:省|自治区|维吾尔族自治区|壮族自治区|回族自治区))(.*?(?:市|州|盟))'
file_names = ["浙江省舟山市", "云南省西双版纳州", "新疆维吾尔族自治区伊犁州", "内蒙古自治区阿拉善盟","哈哈哈"]

for file_name in file_names:
    matches = re.findall(pattern, file_name)
    if matches:
        province, city = matches[0]
        print(province,city)
    else:
        print("未匹配到省份和市")

结果为:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ymba/54310.html

浙江省 舟山市
云南省 西双版纳州
新疆维吾尔族自治区 伊犁州
内蒙古自治区 阿拉善盟
未匹配到省份和市

提取省市简称

import re

pattern = r'^(.*?)(?:省|自治区|维吾尔族自治区|壮族自治区|回族自治区)(.*?)(?:市|州|盟)'
file_names = ["浙江省舟山市", "云南省西双版纳州", "新疆维吾尔族自治区伊犁州", "内蒙古自治区阿拉善盟","哈哈哈"]

for file_name in file_names:
    matches = re.findall(pattern, file_name)
    if matches:
        province, city = matches[0]
        print(province,city)
    else:
        print("未匹配到省份和市")

结果为:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ymba/54310.html

浙江 舟山
云南 西双版纳
新疆 伊犁
内蒙古 阿拉善
未匹配到省份和市

提取省简称,市全称

import re

pattern = r'^(.*?)(?:省|自治区|维吾尔族自治区|壮族自治区|回族自治区)(.*?(?:市|州|盟))'
file_names = ["浙江省舟山市", "云南省西双版纳州", "新疆维吾尔族自治区伊犁州", "内蒙古自治区阿拉善盟","哈哈哈"]

for file_name in file_names:
    matches = re.findall(pattern, file_name)
    if matches:
        province, city = matches[0]
        print(province,city)
    else:
        print("未匹配到省份和市")

结果为:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ymba/54310.html

浙江 舟山市
云南 西双版纳州
新疆 伊犁州
内蒙古 阿拉善盟
未匹配到省份和市
文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ymba/54310.html
  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/ymba/54310.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定