一篇文章中有很多类型的字符,但如何提取出“数字、字母、下划线与汉字”是一种需要掌握的技能。
工具/原料
联想笔记本电脑U31
Windows10操作系统旗舰版
PyCharm和Python3.6
方法/步骤
1、打开PyCharm软件,创建一个Python文件。
2、第一步:采用集合的方式获取数字、字母与下划线。
3、第二步:针对第一步中发现的不能匹配汉字的问题,Python提供了“\w”解决工具。
4、第三步:解决第二步中还是不能匹配出英文单词的问题,采用之前学过的匹配符“+”。
5、第四步:可以进一步思考,是否可以获取数字、字母、下划线与汉字之外的字符呢?