regular expression มีไว้สำหรับ ช่วยให้เราค้นหาข้อความตาม pattern
ใน python จะต้องโหลดโมดูล re เพื่อใช้งานความสามารถทางด้าน regular expression
ของ python ซึ่งโมดูลนี้ความสามารถเหมือนกับ ของ ภาษา Perl
ฟังก์ชั่น ในการค้นหา ข้อความตามรูปแบบที่ต้องการ
The match Function
re.match(pattern, string, flags=0)
re.search(pattern, string, flags=0)

pattern สำหรับใช้ค้นหาข้อความตามรูปแบบใน python ต้องขึ้นด้วย
 r'expression'
pattern คือ รูปแบบต้องที่เรากำหนดเพื่อหาความเหมือนในข้อความ
string คือข้อความที่ต้องการค้นหา
flags คือรูปแบบในการค้นหาดูได้ตามตาราง

ทั้งสองฟังก์ชั่นจะคือค่า object ที่เหมือนออกมา และ None ถ้าไม่เจอ เราสามารถใช้  group(num) or groups()

Regular-expression Modifiers - Option Flags

กำหนดรูปแบบในการค้นหา ถ้าต้องการใช้มากกว่า 1 กฏของการค้นหา เราสามารถใช้ or (|)

Modifier Description
re.I สนใจตัวพิมพ์เล็กพิมพ์ใหญ่
re.L Interprets words according to the current locale. This interpretation affects the alphabetic group (\w and \W), as well as word boundary behavior (\b and \B).
re.M

กำหนด $ ตรงตามจบบันทัด
กำหนด ^ ขึ้นต้นด้วยบันทัด

Makes $ match the end of a line (not just the end of the string) and makes ^ match the start of any line (not just the start of the string).

re.S

ใช้เครื่องหมาย . (dot) ตรงตามตัวอักษรใดๆ รวมถึงขึ้นบรรทัดใหม่ด้วย

Makes a period (dot) match any character, including a newline.

re.U

ตรงตามข้อความ unicode

Interprets letters according to the Unicode character set. This flag affects the behavior of \w, \W, \b, \B.

re.X

ไม่สนใจ ช่องว่าง

Permits "cuter" regular expression syntax. It ignores whitespace (except inside a set [] or when escaped by a backslash) and treats unescaped # as a comment marker.

Regular-expression patterns:

 Except for control characters, (+ ? . * ^ $ ( ) [ ] { } | \), all characters match themselves. You can escape a control character by preceding it with a backslash.

 ตางรางรุปบบ regular expression ที่สามารถใช้เป็นเงื่อนไขในการค้นหาได้ ใน python

Pattern Description
^ ตรง เริ่มต้นบรรทัด
$ ตรง สุดท้ายของบรรทัด
. ตรงตัวอักษรใดๆ ยกเว้นการขึ้นบรรทัดใหม่ ถ้าให้ตรงตามขึ้นบรรทัดใหม่ด้วย ให้ใช้ option m
[...] ตรงตัวอักษรใดๆ ในเครื่องหมาย []
[^...] Matches any single character not in brackets
re* Matches 0 or more occurrences of preceding expression.
re+ Matches 1 or more occurrence of preceding expression.
re? Matches 0 or 1 occurrence of preceding expression.
re{ n} Matches exactly n number of occurrences of preceding expression.
re{ n,} Matches n or more occurrences of preceding expression.
re{ n, m} Matches at least n and at most m occurrences of preceding expression.
a| b Matches either a or b.
(re) Groups regular expressions and remembers matched text.
(?imx) Temporarily toggles on i, m, or x options within a regular expression. If in parentheses, only that area is affected.
(?-imx) Temporarily toggles off i, m, or x options within a regular expression. If in parentheses, only that area is affected.
(?: re) Groups regular expressions without remembering matched text.
(?imx: re) Temporarily toggles on i, m, or x options within parentheses.
(?-imx: re) Temporarily toggles off i, m, or x options within parentheses.
(?#...) Comment.
(?= re) Specifies position using a pattern. Doesn't have a range.
(?! re) Specifies position using pattern negation. Doesn't have a range.
(?> re) Matches independent pattern without backtracking.
\w Matches word characters.
\W Matches nonword characters.
\s Matches whitespace. Equivalent to [\t\n\r\f].
\S Matches nonwhitespace.
\d Matches digits. Equivalent to [0-9].
\D Matches nondigits.
\A Matches beginning of string.
\Z Matches end of string. If a newline exists, it matches just before newline.
\z Matches end of string.
\G Matches point where last match finished.
\b Matches word boundaries when outside brackets. Matches backspace (0x08) when inside brackets.
\B Matches nonword boundaries.
\n, \t, etc. Matches newlines, carriage returns, tabs, etc.
\1...\9 Matches nth grouped subexpression.
\10 Matches nth grouped subexpression if it matched already. Otherwise refers to the octal representation of a character code.

 

Regular-expression Examples

Literal characters:

Example Description
python Match "python".

Character classes:

Example Description
[Pp]ython Match "Python" or "python"
rub[ye] Match "ruby" or "rube"
[aeiou] Match any one lowercase vowel
[0-9] Match any digit; same as [0123456789]
[a-z] Match any lowercase ASCII letter
[A-Z] Match any uppercase ASCII letter
[a-zA-Z0-9] Match any of the above
[^aeiou] Match anything other than a lowercase vowel
[^0-9] Match anything other than a digit

Special Character Classes:

Example Description
. Match any character except newline
\d Match a digit: [0-9]
\D Match a nondigit: [^0-9]
\s Match a whitespace character: [ \t\r\n\f]
\S Match nonwhitespace: [^ \t\r\n\f]
\w Match a single word character: [A-Za-z0-9_]
\W Match a nonword character: [^A-Za-z0-9_]

Repetition Cases:

Example Description
ruby? Match "rub" or "ruby": the y is optional
ruby* Match "rub" plus 0 or more ys
ruby+ Match "rub" plus 1 or more ys
\d{3} Match exactly 3 digits
\d{3,} Match 3 or more digits
\d{3,5} Match 3, 4, or 5 digits

Nongreedy repetition:

This matches the smallest number of repetitions:

Example Description
<.*> Greedy repetition: matches "<python>perl>"
<.*?> Nongreedy: matches "<python>" in "<python>perl>"

Grouping with parentheses:

Example Description
\D\d+ No group: + repeats \d
(\D\d)+ Grouped: + repeats \D\d pair
([Pp]ython(, )?)+ Match "Python", "Python, python, python", etc.

Backreferences:

This matches a previously matched group again:

Example Description
([Pp])ython&\1ails Match python&pails or Python&Pails
(['"])[^\1]*\1 Single or double-quoted string. \1 matches whatever the 1st group matched . \2 matches whatever the 2nd group matched, etc.

Alternatives:

Example Description
python|perl Match "python" or "perl"
rub(y|le)) Match "ruby" or "ruble"
Python(!+|\?) "Python" followed by one or more ! or one ?

Anchors:

This needs to specify match position.

Example Description
^Python Match "Python" at the start of a string or internal line
Python$ Match "Python" at the end of a string or line
\APython Match "Python" at the start of a string
Python\Z Match "Python" at the end of a string
\bPython\b Match "Python" at a word boundary
\brub\B \B is nonword boundary: match "rub" in "rube" and "ruby" but not alone
Python(?=!) Match "Python", if followed by an exclamation point
Python(?!!) Match "Python", if not followed by an exclamation point

Special syntax with parentheses:

Example Description
R(?#comment) Matches "R". All the rest is a comment
R(?i)uby Case-insensitive while matching "uby"
R(?i:uby) Same as above
rub(?:y|le)) Group only without creating \1 backreference

กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
ล่าสุด
งานประจำวันที่ 18 กรกฎาคม 2561
โดย tatiya พ 18 ก.ค. 2018 9:59 am บอร์ด M065 - ตติยะ นาชัย
0
1
พ 18 ก.ค. 2018 9:59 am โดย tatiya
งานประจำวันที่ 18 กรกฏาคม 2561
โดย pprn พ 18 ก.ค. 2018 9:57 am บอร์ด MT25 - นางสาวปรียากมล รินนาศักดิ์
0
2
พ 18 ก.ค. 2018 9:57 am โดย pprn
งานประจำวันที่ 18 กรกฎาคม 2561
โดย prakon พ 18 ก.ค. 2018 9:27 am บอร์ด MT24 - นายปกรณ์ วิริยะธนวิโรจน์
0
3
พ 18 ก.ค. 2018 9:27 am โดย prakon
B - หน้า Sale Orders Lines Client Error
โดย mindphp พ 18 ก.ค. 2018 4:33 am บอร์ด M.D.Soft Co.,Ltd. - Tester
0
2
พ 18 ก.ค. 2018 4:33 am โดย mindphp
การเชื่อมต่อฐานข้อมูลแบบ odbc คืออะไร แล้วทำยังไงคะ
โดย pprn อ 17 ก.ค. 2018 5:02 pm บอร์ด ปัญหาการใช้ phpBB3, SMF, Joomla, Wordpress, CMS CRM
3
35
อ 17 ก.ค. 2018 5:42 pm โดย thatsawan
[ปัญหา] สอบถามเกี่ยวกับวิธีติดตั้ง selenium ครับ
โดย tatiya อ 17 ก.ค. 2018 11:36 am บอร์ด Programming - C/C++ & java & Python
8
76
พ 18 ก.ค. 2018 10:46 am โดย P'Eak
งานประจำวันที่ 17 กรกฎาคม 2561
โดย tatiya อ 17 ก.ค. 2018 10:26 am บอร์ด M065 - ตติยะ นาชัย
1
9
อ 17 ก.ค. 2018 7:11 pm โดย tatiya
งานประจำวันที่ 17 กรกฏาคม 2561
โดย pprn อ 17 ก.ค. 2018 10:17 am บอร์ด MT25 - นางสาวปรียากมล รินนาศักดิ์
1
17
อ 17 ก.ค. 2018 2:20 pm โดย pprn
งานประจำวันที่ 17 กรกฎาคม 2561
โดย prakon อ 17 ก.ค. 2018 10:13 am บอร์ด MT24 - นายปกรณ์ วิริยะธนวิโรจน์
1
6
อ 17 ก.ค. 2018 11:05 am โดย prakon
Q - รันโค้ดของโมดูล selenium เพื่อเปิดหน้าเว็บ แล้ว error
โดย prakon จ 16 ก.ค. 2018 7:42 pm บอร์ด Programming - C/C++ & java & Python
1
24
อ 17 ก.ค. 2018 10:29 am โดย nuattawoot
SMEs คืออะไร? กิจการของคุณเข่าข่ายไหมนะ?
โดย taemmynatchapon จ 16 ก.ค. 2018 7:20 pm บอร์ด Share Knowledge
0
8
จ 16 ก.ค. 2018 7:20 pm โดย taemmynatchapon
ภาวะเงินเฟ้อ น่ากลัวขนาดไหนนะ?
โดย taemmynatchapon จ 16 ก.ค. 2018 7:01 pm บอร์ด Share Knowledge
0
10
จ 16 ก.ค. 2018 7:01 pm โดย taemmynatchapon
GDP คืออะไร?
โดย taemmynatchapon จ 16 ก.ค. 2018 6:51 pm บอร์ด Share Knowledge
0
16
จ 16 ก.ค. 2018 6:51 pm โดย taemmynatchapon
ความหมายของอัตราส่วนทางการเงิน
โดย taemmynatchapon จ 16 ก.ค. 2018 6:39 pm บอร์ด Accounting software & ERP โปรแกรมบัญชี ระบบอีอาร์พี
0
8
จ 16 ก.ค. 2018 6:39 pm โดย taemmynatchapon
ธนาคารโลก (World Bank) คืออะไร?
โดย taemmynatchapon จ 16 ก.ค. 2018 6:04 pm บอร์ด Share Knowledge
0
13
จ 16 ก.ค. 2018 6:04 pm โดย taemmynatchapon
กองทุนการเงินระหว่างประเทศ (IMF) คืออะไร? และมีหน้าที่อะไร?
โดย taemmynatchapon จ 16 ก.ค. 2018 6:02 pm บอร์ด Share Knowledge
0
7
จ 16 ก.ค. 2018 6:02 pm โดย taemmynatchapon
[ปัญหา]ขอวิธีติดตั้ง selenium บน Ubuntu หน่อยครับ
โดย tatiya จ 16 ก.ค. 2018 5:26 pm บอร์ด Programming - C/C++ & java & Python
2
28
จ 16 ก.ค. 2018 5:57 pm โดย tatiya
B - mod_md_recent กำหนด position ในหน้าเว็บแล้วในหน้าเว็บขึ้นแจ้ง Error
โดย Parichat จ 16 ก.ค. 2018 4:53 pm บอร์ด Joomla Dev
0
6
จ 16 ก.ค. 2018 4:53 pm โดย Parichat
B - com_mcharts ไม่สามารถเข้าหน้าตั้งค่าได้ใน Joomla 3.x
โดย Parichat จ 16 ก.ค. 2018 4:05 pm บอร์ด Joomla Dev
2
9
จ 16 ก.ค. 2018 4:55 pm โดย Parichat
B - ไม่สามารถแก้ไขข้อมูลใน Customers ได้
โดย watcharin จ 16 ก.ค. 2018 3:39 pm บอร์ด M.D.Soft Co.,Ltd. - Tester
2
19
จ 16 ก.ค. 2018 9:00 pm โดย thatsawan