使用 python 从文本中删除 url
使用 re.sub()
方法从文本中删除 url,例如 result = re.sub(r'http\s ', '', my_string)
。 re.sub()
方法将删除字符串中的所有 url,方法是用空字符串替换它们。
import re
my_string = """
first https://example.com
https://www.jiyik.com second
third https://example.com
"""
result = re.sub(r'http\s ', '', my_string)
# first
# second
# third
print(result)
我们使用 re.sub()
方法从字符串中删除所有 url。
re.sub
方法返回一个新字符串,该字符串是通过用提供的替换替换模式的出现而获得的。
import re
my_str = '1apple, 2apple, 3banana'
result = re.sub(r'[0-9]', '_', my_str)
print(result) # 👉️ _apple, _apple, _banana
如果未找到该模式,则按原样返回字符串。
我们使用空字符串进行替换,因为我们想从字符串中删除所有 url。
import re
my_string = """
first https://example.com
https://www.jiyik.com second
third https://example.com
"""
result = re.sub(r'http\s ', '', my_string)
# first
# second
# third
print(result)
我们调用 re.sub()
方法的第一个参数是一个正则表达式。
正则表达式中的 http
字符与文字字符匹配。
\s
匹配任何不是空白字符的字符。 请注意,s 是大写的。
加号
匹配前面的字符(任何非空白字符)1 次或多次。
总的来说,正则表达式匹配以 http 开头的子字符串,后跟 1 个或多个非空白字符。
如果担心匹配 http-something 形式的字符串,请将正则表达式更新为 r'https?://\s '
。
import re
my_string = """
first https://example.com
https://www.jiyik.com second
third https://example.com
"""
result = re.sub(r'https?://\s ', '', my_string)
# first
# second
# third
print(result)
问号
?
使正则表达式匹配前面字符的 0 或 1 个重复。
例如,https?
将匹配 https 或 http。
然后我们用冒号和两个正斜杠 ://
来完成协议。
整个正则表达式匹配以 http://
或 https://
开头的子字符串,后跟 1 个或多个非空白字符。
如果在阅读或编写正则表达式时需要帮助,请参阅我们的正则表达式教程 。
转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处
本文地址:
相关文章
python pandas.pivot_table() 函数
发布时间:2024/04/24 浏览次数:82 分类:python
-
python pandas pivot_table()函数通过对数据进行汇总,避免了数据的重复。
在 python 中将 pandas 系列的日期时间转换为字符串
发布时间:2024/04/24 浏览次数:894 分类:python
-
了解如何在 python 中将 pandas 系列日期时间转换为字符串
在 python pandas 中使用 str.split 将字符串拆分为两个列表列
发布时间:2024/04/24 浏览次数:1124 分类:python
-
本教程介绍如何使用 pandas str.split() 函数将字符串拆分为两个列表列。
在 pandas 中将 timedelta 转换为 int
发布时间:2024/04/23 浏览次数:231 分类:python
-
可以使用 pandas 中的 dt 属性将 timedelta 转换为整数。
python 中的 pandas 插入方法
发布时间:2024/04/23 浏览次数:112 分类:python
-
本教程介绍了如何在 pandas dataframe 中使用 insert 方法在 dataframe 中插入一列。
使用 python 将 pandas dataframe 保存为 html
发布时间:2024/04/21 浏览次数:106 分类:python
-
本教程演示如何将 pandas dataframe 转换为 python 中的 html 表格。
如何将 python 字典转换为 pandas dataframe
发布时间:2024/04/20 浏览次数:73 分类:python
-
本教程演示如何将 python 字典转换为 pandas dataframe,例如使用 pandas dataframe 构造函数或 from_dict 方法。
如何在 pandas 中将 dataframe 列转换为日期时间
发布时间:2024/04/20 浏览次数:101 分类:python
-
本文介绍如何将 pandas dataframe 列转换为 python 日期时间。