การค้นหาคำหรือ ตัวอักษร ในไฟล์ ที่ต้องการ สามารถนำมาประยุกต์ใช้งานได้ดังต่อไปนี้

ตัวอย่างการใช้งาน : เป็นการค้นหา อักษรภาษาไทย ที่อยู่ในไฟล์ เมื่อเจอแล้วให้ แสดงผล ชื่อไฟล์และบรรทัดที่มีอักษรนั้นอยู่

ขั้นตอนการทำงาน


1. การค้นหา Path ของไฟล์ทั้งหมด

 

def get_file paths(directory):
    file_paths = [] 
    for root, directories, files in os.walk(directory):
        for filename in files:           
            filepath = os.path.join(root, filename)
            file_paths.append(filepath) 
    return file_paths 


ตัวอย่างการเรียกใช้งาน
ให้โฟลเดอร์ชื่อ python path: /home/mylaptop/work/python
ภายในมีไฟล์ python_file.py, text_file.text, xml_file.xml
ต้องส่งค่า Directory
full_file_paths = get_filepaths("home/mylaptop/work/python")

"/home/mylaptop/work/python" : คือ path ของ directory ที่ต้องการค้นหาคำ หรืออักษร

ผลลัพธ์ :


[/home/mylaptop/work/python/python_file.py, /home/mylaptop/work/python/text_file.text, /home/mylaptop/work/python/xml_file.xml]



2. การกรองประเภทของไฟล์

 

def get_file paths(directory):
  for f in full_file_paths:
    if f.endswith(".py"):
        print f


ต่อเนื่องจาก ข้อ 1. เมื่อได้ path ของแต่ละไฟล์มาแล้ว ก็นำมากรองประเภทของไฟล์ที่ต้องการ จากตัวอย่างต้องการหาจากไฟล์ .py

3. การเปิด และอ่านไฟล์
เมื่อได้ path ของไฟล์มาแล้ว ต้องทำการเปิดและอ่านข้อมูลออกมาทีละบรรทัด


open_file = open(f)
open_file.read
for line in open_file:
        print line
open_file.close




ต่อเนื่องจาก ข้อ 2. ต้องทำการเปิดไฟล์ โดยส่ง path ของไฟล์ลงไป(จากตัวอย่าง path คือ f)
เมื่อเปิดไฟล์แล้ว ก็อ่านไฟล์ และ for ออกมา เพื่อให้อ่านไฟล์ทีละบรรทัด
line ก็คือ ค่าของแต่ละบรรทัด



4. การนำข้อมูลในไฟล์ไปค้นหา อักษร หรือคำที่ต้องการ

def is_ascii(data):
    for i in range(0,len(data)):
        conv = ord(data[i])
        if 161 <= conv <= 251:    
            return False



ต่อ เนื่องจากข้อ 3. เมื่อได้ค่าแต่ละบรรทัดออกมาแล้ว ก็ต้องการนำค่าที่ได้ไปเช็ค โดยส่งค่าแต่ละบรรทัดไปยังฟังก์ชัน โดยสั่งวน for เพื่ออ่านค่าทีละตัว โดยนำค่าแต่ละตัวไปแปลงเป็นค่าของตัวเลขเพื่อ นำไปเช็คกับ รหัส ascii โดยตัวอย่างเช็คภาษาไทย รหัส ascii จะอยู่ในช่วง 161 - 251 ถ้าเจออักษรภาษา ให้ return False



การทำงานก็จะนำทั้ง 4 มารวมกัน เป็นไฟล์ .py สั่งรัน ก็จะสามารถค้นหาค่าที่ต้องการได้

 

 

ชื่อ
Search Thai language in flie with Python
หมวดหมู่
Python
ฮิต
2890
ผู้สร้างเอกสาร
6007
วันที่สร้างเอกสาร
2015-02-11 18:52:04

search_thai_lang.zip

ประเภทไฟล์ zip

ขนาดไฟล์ 659 bytes

ผู้อัพโหลดไฟล์ คะนึงรัตน์ ลิ่มตระกูล

วันที่อัพโหลด 2015-02-10 18:43:18



 

 

 

กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
MOD_MTB_NEWS_RECENT
ติดตั้ง Ubuntu จาก Linux
โดย bom_002 ศ 24 มี.ค. 2017 5:35 pm บอร์ด ถาม - ตอบ คอมพิวเตอร์
0
3
ศ 24 มี.ค. 2017 5:35 pm โดย bom_002
เข้า BIOS / BOOT MENU(ไอออส บูทเมนู) ใน PC & NB ยี่ห้อต่าง ๆ
โดย bom_002 ศ 24 มี.ค. 2017 3:19 pm บอร์ด Microsoft Office Knowledge & line & Etc
0
6
ศ 24 มี.ค. 2017 3:19 pm โดย bom_002
B - สมัครผ่านไลน์ไม่ได้
โดย M032 ศ 24 มี.ค. 2017 11:28 am บอร์ด Hachana - E-commerce
1
3
ศ 24 มี.ค. 2017 11:28 am โดย tsukasaz
ฺB - ใช้ user register facebook ซื้อสินค้าแล้ว order ไม่เข้า odoo
โดย M032 ศ 24 มี.ค. 2017 11:15 am บอร์ด Hachana - E-commerce
1
4
ศ 24 มี.ค. 2017 11:15 am โดย tsukasaz
B - หน้ายืนยันการสั่งซื้อ Warning: Invalid argument supplied for foreach()
โดย M032 ศ 24 มี.ค. 2017 11:14 am บอร์ด Hachana - E-commerce
1
5
ศ 24 มี.ค. 2017 11:14 am โดย tsukasaz
รายงานประจำวันที่ 24 มีนาคม 2560
โดย bom_002 ศ 24 มี.ค. 2017 10:09 am บอร์ด M043 - นพรัตน์ เกษเจริญคุณ
0
1
ศ 24 มี.ค. 2017 10:09 am โดย bom_002
โชว์หมายเลขบรรทัดตลอดใน Pycharm ยังไงครับ
โดย bom_002 พฤ 23 มี.ค. 2017 10:19 am บอร์ด Programming - C/C++ & java & Python
2
35
พฤ 23 มี.ค. 2017 10:19 am โดย bom_002
รายงานประจำวันที่ 23 มีนาคม 2560
โดย bom_002 พฤ 23 มี.ค. 2017 10:06 am บอร์ด M043 - นพรัตน์ เกษเจริญคุณ
1
2
พฤ 23 มี.ค. 2017 10:06 am โดย bom_002
การอินเตอร์รัพท์ และการออกแบบ Interrupt and Design(อินเตอร์รัพท์ แอน ดีไช)
โดย bom_002 พ 22 มี.ค. 2017 11:20 am บอร์ด Microsoft Office Knowledge & line & Etc
0
18
พ 22 มี.ค. 2017 11:20 am โดย bom_002
รายงานประจำวันที่ 22 มีนาคม 2560
โดย bom_002 พ 22 มี.ค. 2017 10:04 am บอร์ด M043 - นพรัตน์ เกษเจริญคุณ
2
13
พ 22 มี.ค. 2017 10:04 am โดย bom_002
อยากสร้างแอพเป็นสื่อการสอนคณิตศาสตร์
โดย บุคคลทั่วไป อ 21 มี.ค. 2017 10:20 pm บอร์ด Mobile Programming - Android, iOS, Window Phone
0
25
อ 21 มี.ค. 2017 10:20 pm โดย บุคคลทั่วไป
เครื่องพิมพ์บาร์โค้ด ราคาถูก Tsc ขายถูกเลือก เครื่องพิมพ์บาร์โค้ด ร้าน N Print
โดย lexlexjob อ 21 มี.ค. 2017 8:18 pm บอร์ด ถาม - ตอบ คอมพิวเตอร์
0
12
อ 21 มี.ค. 2017 8:18 pm โดย lexlexjob
การเพิ่ม User Admin เขาในระบบ Joomla
โดย moomai อ 21 มี.ค. 2017 7:05 pm บอร์ด Mindphp Videoman
0
15
อ 21 มี.ค. 2017 7:05 pm โดย moomai
ช่วยหน่อย ติดตั้งโปรแกรม Netbeans ไม่ได้
โดย moomai อ 21 มี.ค. 2017 6:21 pm บอร์ด ถาม - ตอบ คอมพิวเตอร์
1
17
อ 21 มี.ค. 2017 6:21 pm โดย tsukasaz
ERP นำไปประยุกต์ในการขนส่งได้อย่างไรบ้าง
โดย thanapat อ 21 มี.ค. 2017 5:36 pm บอร์ด Programming - PHP
0
19
อ 21 มี.ค. 2017 5:36 pm โดย thanapat
อยากถามว่า ระบบ ERP สามารถนำไปประยุกส์ในระบบ
โดย thanapat อ 21 มี.ค. 2017 5:33 pm บอร์ด Accounting software & ERP โปรแกรมบัญชี ระบบอีอาร์พี
0
18
อ 21 มี.ค. 2017 5:33 pm โดย thanapat
ถามวิธีการรวมจำนวนสินค้าค่ะ
โดย dawthana อ 21 มี.ค. 2017 3:32 pm บอร์ด OpenERP
1
6
อ 21 มี.ค. 2017 3:32 pm โดย mindphp
ทำปุ่ม export จากฐานข้อมูลเป็น excel ยังไงครับ
โดย บุคคลทั่วไป อ 21 มี.ค. 2017 12:43 pm บอร์ด Programming - PHP
3
37
อ 21 มี.ค. 2017 12:43 pm โดย บุคคลทั่วไป
Open Source License(โอเพน ชอร์ส ลายเส้น) เรื่องใกล้ตัวที่ไม่ควรมองข้าม
โดย bom_002 อ 21 มี.ค. 2017 11:15 am บอร์ด Microsoft Office Knowledge & line & Etc
0
26
อ 21 มี.ค. 2017 11:15 am โดย bom_002
รายงานประจำวันที่ 21 มีนาคม 2560
โดย bom_002 อ 21 มี.ค. 2017 10:07 am บอร์ด M043 - นพรัตน์ เกษเจริญคุณ
2
13
อ 21 มี.ค. 2017 10:07 am โดย mindphp