การค้นหาคำหรือ ตัวอักษร ในไฟล์ ที่ต้องการ สามารถนำมาประยุกต์ใช้งานได้ดังต่อไปนี้

ตัวอย่างการใช้งาน : เป็นการค้นหา อักษรภาษาไทย ที่อยู่ในไฟล์ เมื่อเจอแล้วให้ แสดงผล ชื่อไฟล์และบรรทัดที่มีอักษรนั้นอยู่

ขั้นตอนการทำงาน


1. การค้นหา Path ของไฟล์ทั้งหมด

 

def get_file paths(directory):
    file_paths = [] 
    for root, directories, files in os.walk(directory):
        for filename in files:           
            filepath = os.path.join(root, filename)
            file_paths.append(filepath) 
    return file_paths 


ตัวอย่างการเรียกใช้งาน
ให้โฟลเดอร์ชื่อ python path: /home/mylaptop/work/python
ภายในมีไฟล์ python_file.py, text_file.text, xml_file.xml
ต้องส่งค่า Directory
full_file_paths = get_filepaths("home/mylaptop/work/python")

"/home/mylaptop/work/python" : คือ path ของ directory ที่ต้องการค้นหาคำ หรืออักษร

ผลลัพธ์ :


[/home/mylaptop/work/python/python_file.py, /home/mylaptop/work/python/text_file.text, /home/mylaptop/work/python/xml_file.xml]



2. การกรองประเภทของไฟล์

 

def get_file paths(directory):
  for f in full_file_paths:
    if f.endswith(".py"):
        print f


ต่อเนื่องจาก ข้อ 1. เมื่อได้ path ของแต่ละไฟล์มาแล้ว ก็นำมากรองประเภทของไฟล์ที่ต้องการ จากตัวอย่างต้องการหาจากไฟล์ .py

3. การเปิด และอ่านไฟล์
เมื่อได้ path ของไฟล์มาแล้ว ต้องทำการเปิดและอ่านข้อมูลออกมาทีละบรรทัด


open_file = open(f)
open_file.read
for line in open_file:
        print line
open_file.close




ต่อเนื่องจาก ข้อ 2. ต้องทำการเปิดไฟล์ โดยส่ง path ของไฟล์ลงไป(จากตัวอย่าง path คือ f)
เมื่อเปิดไฟล์แล้ว ก็อ่านไฟล์ และ for ออกมา เพื่อให้อ่านไฟล์ทีละบรรทัด
line ก็คือ ค่าของแต่ละบรรทัด



4. การนำข้อมูลในไฟล์ไปค้นหา อักษร หรือคำที่ต้องการ

def is_ascii(data):
    for i in range(0,len(data)):
        conv = ord(data[i])
        if 161 <= conv <= 251:    
            return False



ต่อ เนื่องจากข้อ 3. เมื่อได้ค่าแต่ละบรรทัดออกมาแล้ว ก็ต้องการนำค่าที่ได้ไปเช็ค โดยส่งค่าแต่ละบรรทัดไปยังฟังก์ชัน โดยสั่งวน for เพื่ออ่านค่าทีละตัว โดยนำค่าแต่ละตัวไปแปลงเป็นค่าของตัวเลขเพื่อ นำไปเช็คกับ รหัส ascii โดยตัวอย่างเช็คภาษาไทย รหัส ascii จะอยู่ในช่วง 161 - 251 ถ้าเจออักษรภาษา ให้ return False



การทำงานก็จะนำทั้ง 4 มารวมกัน เป็นไฟล์ .py สั่งรัน ก็จะสามารถค้นหาค่าที่ต้องการได้

 

 

ชื่อ
Search Thai language in flie with Python
หมวดหมู่
Python, Python
ฮิต
6130
ผู้สร้างเอกสาร
คะนึงรัตน์ ลิ่มตระกูล
วันที่สร้างเอกสาร
2015-02-11 18:52:04

search_thai_lang.zip

ประเภทไฟล์ zip

ขนาดไฟล์ 659 bytes

ผู้อัพโหลดไฟล์ คะนึงรัตน์ ลิ่มตระกูล

วันที่อัพโหลด 2015-02-10 18:43:18


 

 

 

กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
ล่าสุด
Thin Client คืออะไร
โดย Jom07 อ 16 ม.ค. 2018 2:38 pm บอร์ด Software testing
0
9
อ 16 ม.ค. 2018 2:38 pm โดย Jom07
วิธีนอน 8 ชั่วโมง ใน 4 ชั่วโมง
โดย Before Dong อ 16 ม.ค. 2018 10:21 am บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
26
อ 16 ม.ค. 2018 10:21 am โดย Before Dong
งานประจำวันที่ 16 มกราคม 2561
โดย Four อ 16 ม.ค. 2018 9:46 am บอร์ด MT22 - อิษยา งามสอาด
2
27
อ 16 ม.ค. 2018 3:39 pm โดย Four
งานประจำวันที่ 16 มกราคม 2561
โดย Jom07 อ 16 ม.ค. 2018 9:44 am บอร์ด MT23 - สุพรรษา พูลตา
2
25
อ 16 ม.ค. 2018 2:21 pm โดย Jom07
งานประจำวันที่ 16 มกราคม 2561
โดย Parichat อ 16 ม.ค. 2018 9:40 am บอร์ด MT21 - ปาริชาติ รัตโณภาส
1
16
อ 16 ม.ค. 2018 10:05 am โดย AePongsak
เบอร์โทร ศูนย์บริการ ASUS ศูนย์บริการลูกค้าสัมพันธ์ (Call Center) ถามอะไหล่ ค่าบริการงานซ่อมได้
โดย mindphp อ 16 ม.ค. 2018 6:53 am บอร์ด ถาม - ตอบ คอมพิวเตอร์
1
11
อ 16 ม.ค. 2018 6:53 am โดย mindphp
ตามหา พัดลมโน๊ตบุ๊ค ASUS รุ่น Pro36S ของ dc brushless
โดย mindphp อ 16 ม.ค. 2018 6:29 am บอร์ด ถาม - ตอบ คอมพิวเตอร์
0
6
อ 16 ม.ค. 2018 6:29 am โดย mindphp
จะโหลด Android Studio กับ javaJDK ได้ที่ไหนค่ะ
โดย Anonymous จ 15 ม.ค. 2018 8:29 pm บอร์ด Mobile Programming - Android, iOS, Window Phone
1
20
จ 15 ม.ค. 2018 9:25 pm โดย thatsawan
การใช้งานคำสั่ง inner join ใน SQL(เอสคิวเเอล)
โดย Parichat จ 15 ม.ค. 2018 5:50 pm บอร์ด SQL Knowledge
0
17
จ 15 ม.ค. 2018 5:50 pm โดย Parichat
ประเภทของ Firewall (ไฟร์วอลล์)
โดย Jom07 จ 15 ม.ค. 2018 5:42 pm บอร์ด Software testing
0
16
จ 15 ม.ค. 2018 5:42 pm โดย Jom07
เทคนิคการโอนย้ายข้อมูล 2 คอมพิวเตอร์
โดย Jom07 จ 15 ม.ค. 2018 5:41 pm บอร์ด Software testing
0
16
จ 15 ม.ค. 2018 5:41 pm โดย Jom07
Android Studio ไม่อนุญาตให้กรอกข้อมูลใน EditText
โดย Four จ 15 ม.ค. 2018 4:53 pm บอร์ด Mobile Application Developing- Android, iOS
0
11
จ 15 ม.ค. 2018 4:53 pm โดย Four
Android Studio การกำหนดขนาดข้อความใน TextView
โดย Four จ 15 ม.ค. 2018 2:50 pm บอร์ด Mobile Application Developing- Android, iOS
0
11
จ 15 ม.ค. 2018 2:50 pm โดย Four
สวิตซ์ (Switch) คืออะไร
โดย Jom07 จ 15 ม.ค. 2018 1:35 pm บอร์ด IOT - Internet of things
0
16
จ 15 ม.ค. 2018 1:35 pm โดย Jom07
การใช้งาน Tabs(แท็บ) ใน Bootstrap 4(บูตสแตบ 4)
โดย Parichat จ 15 ม.ค. 2018 12:37 pm บอร์ด Booststap Knowledge
0
9
จ 15 ม.ค. 2018 12:37 pm โดย Parichat
ฮับ (HUB) คืออะไร
โดย Jom07 จ 15 ม.ค. 2018 12:33 pm บอร์ด IOT - Internet of things
0
20
จ 15 ม.ค. 2018 12:33 pm โดย Jom07
การใช้งาน Carousel(แครี่เซ้า) ใน Bootstrap 4(บูตสแตบ 4)
โดย Parichat จ 15 ม.ค. 2018 12:10 pm บอร์ด Booststap Knowledge
0
13
จ 15 ม.ค. 2018 12:10 pm โดย Parichat
Android Studio การนับจำนวนตัวอักษรใน TextView
โดย Four จ 15 ม.ค. 2018 11:50 am บอร์ด Mobile Application Developing- Android, iOS
0
12
จ 15 ม.ค. 2018 11:50 am โดย Four
การใช้งาน Popover(ป็อบโอเวอร์) ใน Bootstrap 4(บูตสแตบ 4)
โดย Parichat จ 15 ม.ค. 2018 11:43 am บอร์ด Booststap Knowledge
0
9
จ 15 ม.ค. 2018 11:43 am โดย Parichat
GAMEMAKER: STUDIO
โดย Jom07 จ 15 ม.ค. 2018 11:34 am บอร์ด Software testing
0
12
จ 15 ม.ค. 2018 11:34 am โดย Jom07