การค้นหาคำหรือ ตัวอักษร ในไฟล์ ที่ต้องการ สามารถนำมาประยุกต์ใช้งานได้ดังต่อไปนี้

ตัวอย่างการใช้งาน : เป็นการค้นหา อักษรภาษาไทย ที่อยู่ในไฟล์ เมื่อเจอแล้วให้ แสดงผล ชื่อไฟล์และบรรทัดที่มีอักษรนั้นอยู่

ขั้นตอนการทำงาน


1. การค้นหา Path ของไฟล์ทั้งหมด

 

def get_file paths(directory):
    file_paths = [] 
    for root, directories, files in os.walk(directory):
        for filename in files:           
            filepath = os.path.join(root, filename)
            file_paths.append(filepath) 
    return file_paths 


ตัวอย่างการเรียกใช้งาน
ให้โฟลเดอร์ชื่อ python path: /home/mylaptop/work/python
ภายในมีไฟล์ python_file.py, text_file.text, xml_file.xml
ต้องส่งค่า Directory
full_file_paths = get_filepaths("home/mylaptop/work/python")

"/home/mylaptop/work/python" : คือ path ของ directory ที่ต้องการค้นหาคำ หรืออักษร

ผลลัพธ์ :


[/home/mylaptop/work/python/python_file.py, /home/mylaptop/work/python/text_file.text, /home/mylaptop/work/python/xml_file.xml]



2. การกรองประเภทของไฟล์

 

def get_file paths(directory):
  for f in full_file_paths:
    if f.endswith(".py"):
        print f


ต่อเนื่องจาก ข้อ 1. เมื่อได้ path ของแต่ละไฟล์มาแล้ว ก็นำมากรองประเภทของไฟล์ที่ต้องการ จากตัวอย่างต้องการหาจากไฟล์ .py

3. การเปิด และอ่านไฟล์
เมื่อได้ path ของไฟล์มาแล้ว ต้องทำการเปิดและอ่านข้อมูลออกมาทีละบรรทัด


open_file = open(f)
open_file.read
for line in open_file:
        print line
open_file.close




ต่อเนื่องจาก ข้อ 2. ต้องทำการเปิดไฟล์ โดยส่ง path ของไฟล์ลงไป(จากตัวอย่าง path คือ f)
เมื่อเปิดไฟล์แล้ว ก็อ่านไฟล์ และ for ออกมา เพื่อให้อ่านไฟล์ทีละบรรทัด
line ก็คือ ค่าของแต่ละบรรทัด



4. การนำข้อมูลในไฟล์ไปค้นหา อักษร หรือคำที่ต้องการ

def is_ascii(data):
    for i in range(0,len(data)):
        conv = ord(data[i])
        if 161 <= conv <= 251:    
            return False



ต่อ เนื่องจากข้อ 3. เมื่อได้ค่าแต่ละบรรทัดออกมาแล้ว ก็ต้องการนำค่าที่ได้ไปเช็ค โดยส่งค่าแต่ละบรรทัดไปยังฟังก์ชัน โดยสั่งวน for เพื่ออ่านค่าทีละตัว โดยนำค่าแต่ละตัวไปแปลงเป็นค่าของตัวเลขเพื่อ นำไปเช็คกับ รหัส ascii โดยตัวอย่างเช็คภาษาไทย รหัส ascii จะอยู่ในช่วง 161 - 251 ถ้าเจออักษรภาษา ให้ return False



การทำงานก็จะนำทั้ง 4 มารวมกัน เป็นไฟล์ .py สั่งรัน ก็จะสามารถค้นหาค่าที่ต้องการได้

 

 

ชื่อ
Search Thai language in flie with Python
หมวดหมู่
Python, Python
ฮิต
12400
ผู้สร้างเอกสาร
คะนึงรัตน์ ลิ่มตระกูล
วันที่สร้างเอกสาร
2015-02-11 18:52:04

search_thai_lang.zip

ประเภทไฟล์ zip

ขนาดไฟล์ 659 bytes

ผู้อัพโหลดไฟล์ คะนึงรัตน์ ลิ่มตระกูล

วันที่อัพโหลด 2015-02-10 18:43:18


 

 

 

กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
ล่าสุด
ติดตั้งJoomla ไม่ได้ค่ะ
โดย Anonymous อ 23 ก.ย. 2018 5:21 pm บอร์ด Joomla Development
1
7
อ 23 ก.ย. 2018 5:30 pm โดย mindphp
Q - ถามเรื่องการ UPDATE INSERT ข้อมูล sql server ครับ ว่าแบบ Function กับ แบบทั่วไป แบบไหนปลอดภัยกว่า
โดย nuattawoot อ 23 ก.ย. 2018 3:48 pm บอร์ด SQL - Database
0
13
อ 23 ก.ย. 2018 3:48 pm โดย nuattawoot
อยากได้คนช่วยทำ app mobile ด่วน
โดย Pongpat Rakdej อ 23 ก.ย. 2018 10:05 am บอร์ด Mobile Programming - Android, iOS, Window Phone
1
12
อ 23 ก.ย. 2018 4:29 pm โดย mindphp
การเชื่อม Pgadmin III กับ SSL Certificate ให้กับ Website ผ่าน DirectAdmin อย่างไร
โดย kkeinezung ส 22 ก.ย. 2018 6:54 pm บอร์ด SQL - Database
3
28
อ 23 ก.ย. 2018 5:32 pm โดย mindphp
R - phpBB
โดย Ittichai_chupol ส 22 ก.ย. 2018 6:51 pm บอร์ด M070 - อิทธิชัย ชูผล
0
4
ส 22 ก.ย. 2018 6:51 pm โดย Ittichai_chupol
เขาวัง สิ่งคู่บ้านเพชรบุรี
โดย Ittichai_chupol ส 22 ก.ย. 2018 3:52 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
13
ส 22 ก.ย. 2018 3:52 pm โดย Ittichai_chupol
งานประจำวันที่ 22 กันยายน 2561
โดย muneela ส 22 ก.ย. 2018 10:38 am บอร์ด M068 - มุนีลา หมัดบาซา
2
9
จ 24 ก.ย. 2018 9:30 am โดย thatsawan
งานประจำวันที่ 22 กันยายน 2561
โดย tatiya ส 22 ก.ย. 2018 10:02 am บอร์ด M065 - ตติยะ นาชัย
1
4
ส 22 ก.ย. 2018 7:45 pm โดย tatiya
งานประจำวันที่ 22 มิถุนายน 2561
โดย Ittichai_chupol ส 22 ก.ย. 2018 9:50 am บอร์ด M070 - อิทธิชัย ชูผล
1
9
ส 22 ก.ย. 2018 7:16 pm โดย Ittichai_chupol
R-mdsoft_purchases_order_print
โดย tatiya ศ 21 ก.ย. 2018 7:02 pm บอร์ด M065 - ตติยะ นาชัย
1
9
ส 22 ก.ย. 2018 7:05 pm โดย tatiya
Logo ThailandHotel
โดย tai14 ศ 21 ก.ย. 2018 3:53 pm บอร์ด MT26 - นางสาวอัครยุภา ยงยุทธ
0
6
ศ 21 ก.ย. 2018 3:53 pm โดย tai14
Thaivi Web Upgrade List
โดย mindphp ศ 21 ก.ย. 2018 1:55 pm บอร์ด phpBB3 Project
2
5
ส 22 ก.ย. 2018 5:10 pm โดย thatsawan
R - mdsoft_ziri_invoice_print - ใบอินวอยซ์ (MT24)
โดย prakon ศ 21 ก.ย. 2018 10:15 am บอร์ด MT24 - นายปกรณ์ วิริยะธนวิโรจน์
1
11
ศ 21 ก.ย. 2018 7:05 pm โดย prakon
งานประจำวันที่ 21 กันยายน 2561
โดย prakon ศ 21 ก.ย. 2018 9:44 am บอร์ด MT24 - นายปกรณ์ วิริยะธนวิโรจน์
1
17
ศ 21 ก.ย. 2018 9:46 am โดย prakon
งานประจำวันที่ 21 กันยายน 2561
โดย Ittichai_chupol ศ 21 ก.ย. 2018 9:44 am บอร์ด M070 - อิทธิชัย ชูผล
1
13
ศ 21 ก.ย. 2018 6:29 pm โดย Ittichai_chupol
งานประจำวันที่ 21 กันยายน 2561
โดย muneela ศ 21 ก.ย. 2018 9:37 am บอร์ด M068 - มุนีลา หมัดบาซา
1
14
ศ 21 ก.ย. 2018 6:26 pm โดย muneela
งานประจำวันที่ 21 กันยายน 2561
โดย tatiya ศ 21 ก.ย. 2018 9:35 am บอร์ด M065 - ตติยะ นาชัย
1
8
ส 22 ก.ย. 2018 7:17 pm โดย tatiya
งานประจำวันที่ 21 กันยายน 2561
โดย pprn ศ 21 ก.ย. 2018 9:17 am บอร์ด MT25 - นางสาวปรียากมล รินนาศักดิ์
1
8
ศ 21 ก.ย. 2018 6:12 pm โดย pprn
งานประจำวันที่ 21 กันยายน 2561
โดย tai14 ศ 21 ก.ย. 2018 9:11 am บอร์ด MT26 - นางสาวอัครยุภา ยงยุทธ
1
6
ศ 21 ก.ย. 2018 6:18 pm โดย tai14
R - mod_jshopping_products_reviews โมดูลการรีวิวสินค้า
โดย pprn พฤ 20 ก.ย. 2018 6:58 pm บอร์ด MT25 - นางสาวปรียากมล รินนาศักดิ์
2
9
ศ 21 ก.ย. 2018 6:12 pm โดย pprn