被Python的这个“特性”给坑死了

 哈哈哈,被自己蠢死了,也被 python 的语法给坑死了。没想到还会遇到这种问题。

[[334034]]

事情是这样的。

项目中遇到一个字符串替换的问题。

我们知道字符串替换可以直接用replace方法,但这个方法只适合简单的字符替换,就是前提你要明确知道你要替换什么。

例如把“java”去掉

 

 
 
 
  1. s = "java python" 
  2. print(s.replace("java""")) # python 

遇到复杂场景就不得不用正则表达式的方法来替换了。

比如有一段html文本

 

 
 
 
  1. s = ""
  2. <script> 
  3. !function(e) 
  4. w3i9df 
  5. xxx 
  6. </script> 
  7. <div> 这是html文本</div> 
  8. ""

 

 

我想把script脚本去掉,只保留html文本。这时候可以正则表达式里面的 re.sub 方法来实现。

 

 
 
 
  1. import re 
  2.  
  3. s = ""
  4. <script> 
  5. !function(e) 
  6. w3i9df 
  7. xxx 
  8. </script> 
  9. <div> 这是html文本</div> 
  10. ""
  11.  
  12. result=re.sub(r"<script.*?</script>""", s) 
  13. print(result) 

 

 

 

THE END