regular expression มีไว้สำหรับ ช่วยให้เราค้นหาข้อความตาม pattern
ใน python จะต้องโหลดโมดูล re เพื่อใช้งานความสามารถทางด้าน regular expression
ของ python ซึ่งโมดูลนี้ความสามารถเหมือนกับ ของ ภาษา Perl
ฟังก์ชั่น ในการค้นหา ข้อความตามรูปแบบที่ต้องการ
The match Function
re.match(pattern, string, flags=0)
re.search(pattern, string, flags=0)

pattern สำหรับใช้ค้นหาข้อความตามรูปแบบใน python ต้องขึ้นด้วย
 r'expression'
pattern คือ รูปแบบต้องที่เรากำหนดเพื่อหาความเหมือนในข้อความ
string คือข้อความที่ต้องการค้นหา
flags คือรูปแบบในการค้นหาดูได้ตามตาราง

ทั้งสองฟังก์ชั่นจะคือค่า object ที่เหมือนออกมา และ None ถ้าไม่เจอ เราสามารถใช้  group(num) or groups()

Regular-expression Modifiers - Option Flags

กำหนดรูปแบบในการค้นหา ถ้าต้องการใช้มากกว่า 1 กฏของการค้นหา เราสามารถใช้ or (|)

Modifier Description
re.I สนใจตัวพิมพ์เล็กพิมพ์ใหญ่
re.L Interprets words according to the current locale. This interpretation affects the alphabetic group (\w and \W), as well as word boundary behavior (\b and \B).
re.M

กำหนด $ ตรงตามจบบันทัด
กำหนด ^ ขึ้นต้นด้วยบันทัด

Makes $ match the end of a line (not just the end of the string) and makes ^ match the start of any line (not just the start of the string).

re.S

ใช้เครื่องหมาย . (dot) ตรงตามตัวอักษรใดๆ รวมถึงขึ้นบรรทัดใหม่ด้วย

Makes a period (dot) match any character, including a newline.

re.U

ตรงตามข้อความ unicode

Interprets letters according to the Unicode character set. This flag affects the behavior of \w, \W, \b, \B.

re.X

ไม่สนใจ ช่องว่าง

Permits "cuter" regular expression syntax. It ignores whitespace (except inside a set [] or when escaped by a backslash) and treats unescaped # as a comment marker.

Regular-expression patterns:

 Except for control characters, (+ ? . * ^ $ ( ) [ ] { } | \), all characters match themselves. You can escape a control character by preceding it with a backslash.

 ตางรางรุปบบ regular expression ที่สามารถใช้เป็นเงื่อนไขในการค้นหาได้ ใน python

Pattern Description
^ ตรง เริ่มต้นบรรทัด
$ ตรง สุดท้ายของบรรทัด
. ตรงตัวอักษรใดๆ ยกเว้นการขึ้นบรรทัดใหม่ ถ้าให้ตรงตามขึ้นบรรทัดใหม่ด้วย ให้ใช้ option m
[...] ตรงตัวอักษรใดๆ ในเครื่องหมาย []
[^...] Matches any single character not in brackets
re* Matches 0 or more occurrences of preceding expression.
re+ Matches 1 or more occurrence of preceding expression.
re? Matches 0 or 1 occurrence of preceding expression.
re{ n} Matches exactly n number of occurrences of preceding expression.
re{ n,} Matches n or more occurrences of preceding expression.
re{ n, m} Matches at least n and at most m occurrences of preceding expression.
a| b Matches either a or b.
(re) Groups regular expressions and remembers matched text.
(?imx) Temporarily toggles on i, m, or x options within a regular expression. If in parentheses, only that area is affected.
(?-imx) Temporarily toggles off i, m, or x options within a regular expression. If in parentheses, only that area is affected.
(?: re) Groups regular expressions without remembering matched text.
(?imx: re) Temporarily toggles on i, m, or x options within parentheses.
(?-imx: re) Temporarily toggles off i, m, or x options within parentheses.
(?#...) Comment.
(?= re) Specifies position using a pattern. Doesn't have a range.
(?! re) Specifies position using pattern negation. Doesn't have a range.
(?> re) Matches independent pattern without backtracking.
\w Matches word characters.
\W Matches nonword characters.
\s Matches whitespace. Equivalent to [\t\n\r\f].
\S Matches nonwhitespace.
\d Matches digits. Equivalent to [0-9].
\D Matches nondigits.
\A Matches beginning of string.
\Z Matches end of string. If a newline exists, it matches just before newline.
\z Matches end of string.
\G Matches point where last match finished.
\b Matches word boundaries when outside brackets. Matches backspace (0x08) when inside brackets.
\B Matches nonword boundaries.
\n, \t, etc. Matches newlines, carriage returns, tabs, etc.
\1...\9 Matches nth grouped subexpression.
\10 Matches nth grouped subexpression if it matched already. Otherwise refers to the octal representation of a character code.

 

Regular-expression Examples

Literal characters:

Example Description
python Match "python".

Character classes:

Example Description
[Pp]ython Match "Python" or "python"
rub[ye] Match "ruby" or "rube"
[aeiou] Match any one lowercase vowel
[0-9] Match any digit; same as [0123456789]
[a-z] Match any lowercase ASCII letter
[A-Z] Match any uppercase ASCII letter
[a-zA-Z0-9] Match any of the above
[^aeiou] Match anything other than a lowercase vowel
[^0-9] Match anything other than a digit

Special Character Classes:

Example Description
. Match any character except newline
\d Match a digit: [0-9]
\D Match a nondigit: [^0-9]
\s Match a whitespace character: [ \t\r\n\f]
\S Match nonwhitespace: [^ \t\r\n\f]
\w Match a single word character: [A-Za-z0-9_]
\W Match a nonword character: [^A-Za-z0-9_]

Repetition Cases:

Example Description
ruby? Match "rub" or "ruby": the y is optional
ruby* Match "rub" plus 0 or more ys
ruby+ Match "rub" plus 1 or more ys
\d{3} Match exactly 3 digits
\d{3,} Match 3 or more digits
\d{3,5} Match 3, 4, or 5 digits

Nongreedy repetition:

This matches the smallest number of repetitions:

Example Description
<.*> Greedy repetition: matches "<python>perl>"
<.*?> Nongreedy: matches "<python>" in "<python>perl>"

Grouping with parentheses:

Example Description
\D\d+ No group: + repeats \d
(\D\d)+ Grouped: + repeats \D\d pair
([Pp]ython(, )?)+ Match "Python", "Python, python, python", etc.

Backreferences:

This matches a previously matched group again:

Example Description
([Pp])ython&\1ails Match python&pails or Python&Pails
(['"])[^\1]*\1 Single or double-quoted string. \1 matches whatever the 1st group matched . \2 matches whatever the 2nd group matched, etc.

Alternatives:

Example Description
python|perl Match "python" or "perl"
rub(y|le)) Match "ruby" or "ruble"
Python(!+|\?) "Python" followed by one or more ! or one ?

Anchors:

This needs to specify match position.

Example Description
^Python Match "Python" at the start of a string or internal line
Python$ Match "Python" at the end of a string or line
\APython Match "Python" at the start of a string
Python\Z Match "Python" at the end of a string
\bPython\b Match "Python" at a word boundary
\brub\B \B is nonword boundary: match "rub" in "rube" and "ruby" but not alone
Python(?=!) Match "Python", if followed by an exclamation point
Python(?!!) Match "Python", if not followed by an exclamation point

Special syntax with parentheses:

Example Description
R(?#comment) Matches "R". All the rest is a comment
R(?i)uby Case-insensitive while matching "uby"
R(?i:uby) Same as above
rub(?:y|le)) Group only without creating \1 backreference

กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
MOD_MTB_NEWS_RECENT
สร้างพื้นหลังเป็นเมฆง่ายๆด้วย Photoshop
โดย Before Dong จ 26 มิ.ย. 2017 6:51 pm บอร์ด Graphic design
0
8
จ 26 มิ.ย. 2017 6:51 pm โดย Before Dong
ใช้ Pen Tool ตัดภาพด้วย Photoshop
โดย Before Dong จ 26 มิ.ย. 2017 5:54 pm บอร์ด Graphic design
0
9
จ 26 มิ.ย. 2017 5:54 pm โดย Before Dong
วิธีติดตั้งและใช้งาน Google Fonts บน WordPress
โดย Ik Kat จ 26 มิ.ย. 2017 5:44 pm บอร์ด Wordpress user Guide Knowledge
0
12
จ 26 มิ.ย. 2017 5:44 pm โดย Ik Kat
การใช้คำสั่ง SQL select from where like order by ที่จำเป็นต้องใช้และใช้บ่อย
โดย bellzeed จ 26 มิ.ย. 2017 5:07 pm บอร์ด SQL - Database
1
17
จ 26 มิ.ย. 2017 5:07 pm โดย mindphp
เปลี่ยนน้ำท่วมให้กลายเป็นทะเลมัลดีฟส์ด้วย Photoshop
โดย Before Dong จ 26 มิ.ย. 2017 4:45 pm บอร์ด Graphic design
0
19
จ 26 มิ.ย. 2017 4:45 pm โดย Before Dong
ทำความรู้จักกับ Laravel Framework
โดย บัวบุญ จันทะโคตร จ 26 มิ.ย. 2017 4:26 pm บอร์ด HTML CSS
0
9
จ 26 มิ.ย. 2017 4:26 pm โดย บัวบุญ จันทะโคตร
ขอวิธีการติดตั้ง โมดูล moviepy 0.2.3.2 ระบบปฏิบัติการ Ubuntu
โดย nuattawoot จ 26 มิ.ย. 2017 4:21 pm บอร์ด Programming - C/C++ & java & Python
1
11
จ 26 มิ.ย. 2017 4:21 pm โดย nuattawoot
ทำความรู้จักไวรัส Trojan และวิธีป้องกัน
โดย บัวบุญ จันทะโคตร จ 26 มิ.ย. 2017 3:45 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
13
จ 26 มิ.ย. 2017 3:45 pm โดย บัวบุญ จันทะโคตร
งานประจำวันที่ 26 มิถุนายน 2560
โดย Ik Kat จ 26 มิ.ย. 2017 2:46 pm บอร์ด MT19 - ปวีณา จันดี
1
10
จ 26 มิ.ย. 2017 2:46 pm โดย Ik Kat
การตัดต่อ VIdeo python ใช้ module ตัวไหนกันมั้งคับ
โดย nuattawoot จ 26 มิ.ย. 2017 2:31 pm บอร์ด Programming - C/C++ & java & Python
3
20
จ 26 มิ.ย. 2017 2:31 pm โดย nuattawoot
เข้าเฟสเก่าไม่ได้
โดย อั่งเปา จ 26 มิ.ย. 2017 12:56 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
12
จ 26 มิ.ย. 2017 12:56 pm โดย อั่งเปา
รวมงานประจำปี 2560
โดย bellzeed จ 26 มิ.ย. 2017 11:37 am บอร์ด M047 - วิศรุต เรืองอุไร
0
2
จ 26 มิ.ย. 2017 11:37 am โดย bellzeed
note
โดย บัวบุญ จันทะโคตร จ 26 มิ.ย. 2017 11:36 am บอร์ด M048 - บัวบัญ จันทะโครต
0
5
จ 26 มิ.ย. 2017 11:36 am โดย บัวบุญ จันทะโคตร
รวมงานประจำปี 2560
โดย Before Dong จ 26 มิ.ย. 2017 11:36 am บอร์ด M046 - อนวัช พริบไหว
0
2
จ 26 มิ.ย. 2017 11:36 am โดย Before Dong
รวมบทความ ปี 2560
โดย Before Dong จ 26 มิ.ย. 2017 11:36 am บอร์ด M046 - อนวัช พริบไหว
0
2
จ 26 มิ.ย. 2017 11:36 am โดย Before Dong
Work's on Hand วิศรุต เรืองอุไร M047
โดย bellzeed จ 26 มิ.ย. 2017 11:35 am บอร์ด M047 - วิศรุต เรืองอุไร
0
5
จ 26 มิ.ย. 2017 11:35 am โดย bellzeed
Note
โดย Before Dong จ 26 มิ.ย. 2017 11:35 am บอร์ด M046 - อนวัช พริบไหว
0
1
จ 26 มิ.ย. 2017 11:35 am โดย Before Dong
Work's on Hand บัวบุญ จันทะโคตร M048
โดย บัวบุญ จันทะโคตร จ 26 มิ.ย. 2017 11:35 am บอร์ด M048 - บัวบัญ จันทะโครต
0
4
จ 26 มิ.ย. 2017 11:35 am โดย บัวบุญ จันทะโคตร
Work's on Hand อนวัช พริบไหว md046
โดย Before Dong จ 26 มิ.ย. 2017 11:28 am บอร์ด M046 - อนวัช พริบไหว
0
4
จ 26 มิ.ย. 2017 11:28 am โดย Before Dong
งานประจำวันที่ 26 June 17
โดย bellzeed จ 26 มิ.ย. 2017 11:27 am บอร์ด M047 - วิศรุต เรืองอุไร
2
22
จ 26 มิ.ย. 2017 11:27 am โดย bellzeed