大数据分析Python正则表达式有哪些

2020-09-22

点击量：次

　　学习大数据分析的难点在于记住所有语法。在AAA教育时，我们提倡习惯于查阅Python文档，有时可以得到方便的PDF参考，这很好，因此我们整理了此Python正则表达式(regex)备忘单，为您提供帮助!

　　此正则表达式备忘单基于Python 3的正则表达式文档。

　　如果您对学习Python感兴趣，我们可以免费提供交互式的初学者和中级 Python编程课程。

　　大数据分析的正则表达式(PDF)

大数据分析Python正则表达式有哪些

　　特殊的角色

　　^| 在字符串的开头匹配表达式右侧。它匹配\n字符串中每个这样的实例。

　　$| 将表达式匹配到字符串末尾的左侧。它匹配\n字符串中每个这样的实例。

　　.| 匹配除行终止符(如)以外的任何字符\n。

　　\| 转义特殊字符或表示字符类。

　　A|B| 匹配表达式A或B。如果A先匹配，B则不试。

　　+| 贪婪地匹配表达式左侧1次或多次。

　　*| 贪婪地将表达式左对齐0次或多次。

　　?| 贪婪地将表达式左对齐0或1次。但是，如果?将其添加到限定词(+，*和?本身)中，它将以非贪婪的方式执行匹配。

　　{m}| 将表达式匹配到其剩余m时间，且不少于该时间。

　　{m,n}| 将表达式的左边m与n时间匹配，而不是更少。

　　{m,n}?| 将表达式匹配到其剩余m时间，并忽略n。见?上文。

　　字符类(又名特殊序列)

　　\w| 匹配字母数字字符，该装置a-z，A-Z和0-9。它还与下划线匹配_。

　　\d| 匹配数字，表示0-9。

　　\D| 匹配任何非数字。

　　\s| 匹配空白字符，其中包括\t，\n，\r，和空格字符。

　　\S| 匹配非空格字符。

　　\b| 在单词的开头和结尾(即\w和之间)匹配边界(或空字符串)\W。

　　\B| 匹配\b不匹配的地方，即\w字符的边界。

　　\A| 无论是单行还是多行模式，都在字符串的绝对开头处将表达式与右侧匹配。

　　\Z| 无论是单行还是多行模式，都将表达式与字符串的绝对结尾处的左侧匹配。

　　套装

　　[ ]| 包含一组要匹配的字符。

　　[amk]| 匹配要么a，m或k。不匹配amk。

　　[a-z]| 匹配从a到的任何字母z。

　　[a\-z]| 匹配a，-或z。-之所以匹配是因为\逃脱了它。

　　[a-]| 与a或匹配-，因为-未用于表示一系列字符。

　　[-a]| 如上所述，匹配a或-。

　　[a-z0-9]| 从匹配的字符a来z，也从0到9。

　　[(+*)]| 特殊字符集内成为常量，因此本场比赛(，+，*，和)。

　　[^ab5]| 添加^不包括集合中的任何字符。在这里，它匹配不在字符a，b或5。

　　团体

　　( )| 匹配括号内的表达式并将其分组。

　　(? )| 这样的括号内，?作为扩展符号。其含义取决于其右边的字符。

　　(?PAB)| 匹配表达式AB，并且可以使用组名进行访问。

　　(?aiLmsux)| 这里a，i，L，m，s，u，和x一些标志：

　　1)a —仅匹配ASCII

　　2)i —忽略大小写

　　3)L —取决于语言环境

　　4)m —多线

　　5)s —全部匹配

　　6)u —匹配unicode

　　7)x —详细

　　(?:A)| 匹配由表示的表达式A，但与不同的是(?PAB)，以后无法检索它。

　　(?#...)| 一条评论。内容供我们阅读，而不是匹配。

　　A(?=B)| 前瞻性断言。A仅当其后跟时，此表达式才匹配B。

　　A(?!B)| 否定超前断言。A仅当表达式不后跟时，此表达式才匹配B。

　　(?<=B)A| 断言肯定。A仅当表达式B紧靠其左侧时，它才与表达式匹配。这只能匹配固定长度的表达式。

　　(?P=name)| 匹配与名为“ name”的早期组匹配的表达式。

　　(...)\1| 该数字1对应于要匹配的第一个组。如果我们要匹配同一表达式的更多实例，只需使用其数字而不是再次写出整个表达式。我们可以从使用1多达99这些群体及其相应的编号。

　　流行的Python re模块功能

　　re.findall(A, B)| 匹配A字符串中表达式的所有实例，B并在列表中返回它们。

　　re.search(A, B)| 匹配A字符串中表达式的第一个实例B，并将其作为重新匹配对象返回。

　　re.split(A, B)| 使用定界符将字符串B拆分为列表A。

　　re.sub(A, B, C)| 替换A用B的字符串C。

长按识别二维码,加关注

↓ ↓ ↓ 继续阅读与本文标签相同的文章
大数据分析Python正则表达式有哪些
大数据分析