ให้เรตสมาชิก: 5 / 5

ดาวใช้งานดาวใช้งานดาวใช้งานดาวใช้งานดาวใช้งาน
 

การค้นหาคำหรือ ตัวอักษร ในไฟล์ ที่ต้องการ สามารถนำมาประยุกต์ใช้งานได้ดังต่อไปนี้

ตัวอย่างการใช้งาน : เป็นการค้นหา อักษรภาษาไทย ที่อยู่ในไฟล์ เมื่อเจอแล้วให้ แสดงผล ชื่อไฟล์และบรรทัดที่มีอักษรนั้นอยู่

ขั้นตอนการทำงาน


1. การค้นหา Path ของไฟล์ทั้งหมด

 

def get_file paths(directory):
    file_paths = [] 
    for root, directories, files in os.walk(directory):
        for filename in files:           
            filepath = os.path.join(root, filename)
            file_paths.append(filepath) 
    return file_paths 


ตัวอย่างการเรียกใช้งาน
ให้โฟลเดอร์ชื่อ python path: /home/mylaptop/work/python
ภายในมีไฟล์ python_file.py, text_file.text, xml_file.xml
ต้องส่งค่า Directory
full_file_paths = get_filepaths("home/mylaptop/work/python")

"/home/mylaptop/work/python" : คือ path ของ directory ที่ต้องการค้นหาคำ หรืออักษร

ผลลัพธ์ :


[/home/mylaptop/work/python/python_file.py, /home/mylaptop/work/python/text_file.text, /home/mylaptop/work/python/xml_file.xml]



2. การกรองประเภทของไฟล์

 

def get_file paths(directory):
  for f in full_file_paths:
    if f.endswith(".py"):
        print f


ต่อเนื่องจาก ข้อ 1. เมื่อได้ path ของแต่ละไฟล์มาแล้ว ก็นำมากรองประเภทของไฟล์ที่ต้องการ จากตัวอย่างต้องการหาจากไฟล์ .py

3. การเปิด และอ่านไฟล์
เมื่อได้ path ของไฟล์มาแล้ว ต้องทำการเปิดและอ่านข้อมูลออกมาทีละบรรทัด


open_file = open(f)
open_file.read
for line in open_file:
        print line
open_file.close




ต่อเนื่องจาก ข้อ 2. ต้องทำการเปิดไฟล์ โดยส่ง path ของไฟล์ลงไป(จากตัวอย่าง path คือ f)
เมื่อเปิดไฟล์แล้ว ก็อ่านไฟล์ และ for ออกมา เพื่อให้อ่านไฟล์ทีละบรรทัด
line ก็คือ ค่าของแต่ละบรรทัด



4. การนำข้อมูลในไฟล์ไปค้นหา อักษร หรือคำที่ต้องการ

def is_ascii(data):
    for i in range(0,len(data)):
        conv = ord(data[i])
        if 161 <= conv <= 251:    
            return False



ต่อ เนื่องจากข้อ 3. เมื่อได้ค่าแต่ละบรรทัดออกมาแล้ว ก็ต้องการนำค่าที่ได้ไปเช็ค โดยส่งค่าแต่ละบรรทัดไปยังฟังก์ชัน โดยสั่งวน for เพื่ออ่านค่าทีละตัว โดยนำค่าแต่ละตัวไปแปลงเป็นค่าของตัวเลขเพื่อ นำไปเช็คกับ รหัส ascii โดยตัวอย่างเช็คภาษาไทย รหัส ascii จะอยู่ในช่วง 161 - 251 ถ้าเจออักษรภาษา ให้ return False



การทำงานก็จะนำทั้ง 4 มารวมกัน เป็นไฟล์ .py สั่งรัน ก็จะสามารถค้นหาค่าที่ต้องการได้

 

 

หัวเรื่อง
Search Thai language in flie with Python
หมวดหมู่
Python, Python
ฮิต
21588
ผู้สร้างเอกสาร
คะนึงรัตน์ ลิ่มตระกูล
วันที่สร้างเอกสาร
2015-02-11 18:52:04

search_thai_lang.zip

ประเภทไฟล์ zip

ขนาดไฟล์ 659 bytes

ผู้อัพโหลดไฟล์ คะนึงรัตน์ ลิ่มตระกูล

วันที่อัพโหลด 2015-02-10 18:43:18


 

 

 

กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
ล่าสุด
วางแผนเงินออมได้ง่ายๆ ด้วยโปรแกรมคำนวณหามูลค่าเงินในอนาคต
โดย prmindphp จ 23 ธ.ค. 2019 7:28 pm บอร์ด MindPHP News & Feedback
0
54
จ 23 ธ.ค. 2019 7:28 pm โดย prmindphp
ปฏิทินประจําปี 2563 ธีมแคมป์ กางเต้นท์ เดินป่า สายลุยๆไม่ควรพลาด
โดย noppadonsk จ 23 ธ.ค. 2019 5:10 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
1
839
พ 01 ม.ค. 2020 3:24 pm โดย mindphp
วิธีการปรับเปลี่ยนค่าการแสดงผลในหน้าแสดงบอร์ด ใน phpbb
โดย Ittichai_chupol ส 21 ธ.ค. 2019 5:48 pm บอร์ด PHP Knowledge
0
61
ส 21 ธ.ค. 2019 5:48 pm โดย Ittichai_chupol
จะทำอย่างไรจะแสดงข้อมูลในจำนวนตารางที่คงที่ได้ครับ
โดย jamepiyawat ส 21 ธ.ค. 2019 1:51 pm บอร์ด Programming - PHP
1
95
ส 21 ธ.ค. 2019 2:07 pm โดย thatsawan
วิธีการส่งค่า จาก Event หนึ่งไปยัง Event หนึ่ง ใน phpbb
โดย Ittichai_chupol ศ 20 ธ.ค. 2019 6:59 pm บอร์ด PHP Knowledge
0
62
ศ 20 ธ.ค. 2019 6:59 pm โดย Ittichai_chupol
โปรแกรมคำนวณหาจำนวนเงินผ่อนชำระ ตัวช่วยในการคำนวณเงินผ่อนเพื่อใช้ประกอบการตัดสินใจ
โดย prmindphp ศ 20 ธ.ค. 2019 5:58 pm บอร์ด MindPHP News & Feedback
0
60
ศ 20 ธ.ค. 2019 5:58 pm โดย prmindphp
ปฏิทินประจำปี 2563 ดอกไม้มงคลพืชสวยงาม -โหลดมาใช้กันเลยฟรี
โดย noppadonsk ศ 20 ธ.ค. 2019 1:55 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
1
4400
อ 24 ธ.ค. 2019 8:17 pm โดย mindphp
excel แบบวันที่เวลา ลงdatabase
โดย Anonymous ศ 20 ธ.ค. 2019 1:54 pm บอร์ด Programming - PHP
1
78
ศ 20 ธ.ค. 2019 2:03 pm โดย mindphp
ขอcode แปลงหน่วยนิ้ว เป็นเซ็นติเมตร ภาษา Java
โดย Anonymous ศ 20 ธ.ค. 2019 9:39 am บอร์ด Programming - PHP
0
1715
ศ 20 ธ.ค. 2019 9:39 am โดย บุคคลทั่วไป
โปรแกรมคำนวณสินเชื่อบ้าน เครื่องมือที่จะช่วยให้คุณคำนวณสินเชื่อบ้านได้ง่ายและรวดเร็ว
โดย prmindphp พฤ 19 ธ.ค. 2019 6:59 pm บอร์ด MindPHP News & Feedback
0
1718
พฤ 19 ธ.ค. 2019 6:59 pm โดย prmindphp
วิธีการแการแก้ไขข้อมูลโพสต์ ในระหว่างขั้นตอนการกดโพสต์ ของ phpbb
โดย Ittichai_chupol พฤ 19 ธ.ค. 2019 5:11 pm บอร์ด PHP Knowledge
0
532
พฤ 19 ธ.ค. 2019 5:11 pm โดย Ittichai_chupol
วิธีการใช้งานปรับลบข้อมูลลายเซ็นของ phpbb โดยใช้ Event ใน phpbb
โดย Ittichai_chupol พฤ 19 ธ.ค. 2019 2:57 pm บอร์ด PHP Knowledge
0
972
พฤ 19 ธ.ค. 2019 2:57 pm โดย Ittichai_chupol
ปฏิทินประจําปี 2563 ภูติผีปีศาจ - แจกฟรี
โดย noppadonsk พฤ 19 ธ.ค. 2019 2:16 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
1
1191
ส 04 ม.ค. 2020 4:38 am โดย mindphp
วิธีการใช้ JQuery เก็บ cookie เพื่อลดขั้นตอนการเปลี่ยนภาษาของแต่ละ user ใน phpbb
โดย Ittichai_chupol พฤ 19 ธ.ค. 2019 11:24 am บอร์ด Jquery & Ajax Knowledge
0
983
พฤ 19 ธ.ค. 2019 11:24 am โดย Ittichai_chupol
ปฏิทินประจําปี 2563 คริสมาสเพิ่มความหวาน และ สดใส - โหลดเก็บไว้ได้เลย
โดย noppadonsk พ 18 ธ.ค. 2019 6:31 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
1
2281
พ 01 ม.ค. 2020 3:11 pm โดย mindphp
ปฏิทินวันหยุด 2563 วันหยุดราชการ วันหยุดใน ปฏิทิน 2563 / 2020 ปฏิทิน 2563 พร้อมวันหยุดราชการ
โดย noppadonsk พ 18 ธ.ค. 2019 6:20 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
16
398
อ 14 ม.ค. 2020 3:32 pm โดย LEG
วิธีการปรับเปลี่ยนตัวอักษรให้เป็น พิมพ์ใหญ่ - พิมพ์เล็ก ทั้งมด
โดย Ittichai_chupol พ 18 ธ.ค. 2019 5:27 pm บอร์ด CSS Knowledge
0
52
พ 18 ธ.ค. 2019 5:27 pm โดย Ittichai_chupol
วิธีการปรับแก้ไขส่วนการแสดงผลหน้าสมาชิก ใน phpbb
โดย Ittichai_chupol พ 18 ธ.ค. 2019 5:07 pm บอร์ด PHP Knowledge
0
40
พ 18 ธ.ค. 2019 5:07 pm โดย Ittichai_chupol
อยากทราบวิธีการที่จะทำให้ extension เข้าไปอ่านไฟล์ bookmark ได้ครับ
โดย Ittichai_chupol พ 18 ธ.ค. 2019 4:18 pm บอร์ด Programming - PHP
2
57
พ 18 ธ.ค. 2019 5:09 pm โดย Ittichai_chupol
Joomla เวอร์ชั่นใหม่มาแล้ว 3.9.14 มีปรับปรุงกว่า 36 รายการ
โดย tsukasaz พ 18 ธ.ค. 2019 11:07 am บอร์ด MindPHP News & Feedback
0
48
พ 18 ธ.ค. 2019 11:07 am โดย tsukasaz