我们螅岔出礤在进行中文的文本处理时,有的时候要把文本中的标点符号去除,便于后续的操作,今天小编就来教大家具体应该如何操作。
工具/原料
语言:python
代码编写工具:pycharm
方法/步骤
1、1.打开pycharm,新建一个文件。
2、2.导入re,正则表达式模块。
3、3.将需要添加处理的文本作为一个字符串,添加进来。
4、4.定义一个需要删除的标点符号字符串列表,‘[]’标点符号添加在这个里面。
5、5.利用re.sub来删除想要的标点符号。
6、6.打印删除后返回的字符串,运行代码,可以看到文本中的标点符号都被删除了。