大数据分析Python正则表达式有哪些
2020-09-22
点击量:次 学习大数据分析的难点在于记住所有语法。在AAA教育时,我们提倡习惯于查阅Python文档,有时可以得到方便的PDF参考,这很好,因此我们整理了此Python正则表达式(regex)备忘单,为您提供帮助!
此正则表达式备忘单基于Python 3的正则表达式文档。
如果您对学习Python感兴趣,我们可以免费提供交互式的初学者和中级 Python编程课程。
大数据分析的正则表达式(PDF)
特殊的角色
^| 在字符串的开头匹配表达式右侧。它匹配\n字符串中每个这样的实例。
$| 将表达式匹配到字符串末尾的左侧。它匹配\n字符串中每个这样的实例。
.| 匹配除行终止符(如)以外的任何字符\n。
\| 转义特殊字符或表示字符类。
A|B| 匹配表达式A或B。如果A先匹配,B则不试。
+| 贪婪地匹配表达式左侧1次或多次。
*| 贪婪地将表达式左对齐0次或多次。
?| 贪婪地将表达式左对齐0或1次。但是,如果?将其添加到限定词(+,*和?本身)中,它将以非贪婪的方式执行匹配。
{m}| 将表达式匹配到其剩余m时间,且不少于该时间。
{m,n}| 将表达式的左边m与n时间匹配,而不是更少。
{m,n}?| 将表达式匹配到其剩余m时间,并忽略n。见?上文。
字符类(又名特殊序列)
\w| 匹配字母数字字符,该装置a-z,A-Z和0-9。它还与下划线匹配_。
\d| 匹配数字,表示0-9。
\D| 匹配任何非数字。
\s| 匹配空白字符,其中包括\t,\n,\r,和空格字符。
\S| 匹配非空格字符。
\b| 在单词的开头和结尾(即\w和之间)匹配边界(或空字符串)\W。
\B| 匹配\b不匹配的地方,即\w字符的边界。
\A| 无论是单行还是多行模式,都在字符串的绝对开头处将表达式与右侧匹配。
\Z| 无论是单行还是多行模式,都将表达式与字符串的绝对结尾处的左侧匹配。
套装
[ ]| 包含一组要匹配的字符。
[amk]| 匹配要么a,m或k。不匹配amk。
[a-z]| 匹配从a到的任何字母z。
[a\-z]| 匹配a,-或z。-之所以匹配是因为\逃脱了它。
[a-]| 与a或匹配-,因为-未用于表示一系列字符。
[-a]| 如上所述,匹配a或-。
[a-z0-9]| 从匹配的字符a来z,也从0到9。
[(+*)]| 特殊字符集内成为常量,因此本场比赛(,+,*,和)。
[^ab5]| 添加^不包括集合中的任何字符。在这里,它匹配不在字符a,b或5。
团体
( )| 匹配括号内的表达式并将其分组。
(? )| 这样的括号内,?作为扩展符号。其含义取决于其右边的字符。
(?PAB)| 匹配表达式AB,并且可以使用组名进行访问。
(?aiLmsux)| 这里a,i,L,m,s,u,和x一些标志:
1)a —仅匹配ASCII
2)i —忽略大小写
3)L —取决于语言环境
4)m —多线
5)s —全部匹配
6)u —匹配unicode
7)x —详细
(?:A)| 匹配由表示的表达式A,但与不同的是(?PAB),以后无法检索它。
(?#...)| 一条评论。内容供我们阅读,而不是匹配。
A(?=B)| 前瞻性断言。A仅当其后跟时,此表达式才匹配B。
A(?!B)| 否定超前断言。A仅当表达式不后跟时,此表达式才匹配B。
(?<=B)A| 断言肯定。A仅当表达式B紧靠其左侧时,它才与表达式匹配。这只能匹配固定长度的表达式。
(?
(?P=name)| 匹配与名为“ name”的早期组匹配的表达式。
(...)\1| 该数字1对应于要匹配的第一个组。如果我们要匹配同一表达式的更多实例,只需使用其数字而不是再次写出整个表达式。我们可以从使用1多达99这些群体及其相应的编号。
流行的Python re模块功能
re.findall(A, B)| 匹配A字符串中表达式的所有实例,B并在列表中返回它们。
re.search(A, B)| 匹配A字符串中表达式的第一个实例B,并将其作为重新匹配对象返回。
re.split(A, B)| 使用定界符将字符串B拆分为列表A。
re.sub(A, B, C)| 替换A用B的字符串C。
- ↓ ↓ ↓ 继续阅读与本文标签相同的文章
- 大数据分析Python正则表达式有哪些
- 大数据分析