ให้เรตสมาชิก: 5 / 5

ดาวใช้งานดาวใช้งานดาวใช้งานดาวใช้งานดาวใช้งาน
 

การค้นหาคำหรือ ตัวอักษร ในไฟล์ ที่ต้องการ สามารถนำมาประยุกต์ใช้งานได้ดังต่อไปนี้

ตัวอย่างการใช้งาน : เป็นการค้นหา อักษรภาษาไทย ที่อยู่ในไฟล์ เมื่อเจอแล้วให้ แสดงผล ชื่อไฟล์และบรรทัดที่มีอักษรนั้นอยู่

ขั้นตอนการทำงาน


1. การค้นหา Path ของไฟล์ทั้งหมด

 

def get_file paths(directory):
    file_paths = [] 
    for root, directories, files in os.walk(directory):
        for filename in files:           
            filepath = os.path.join(root, filename)
            file_paths.append(filepath) 
    return file_paths 


ตัวอย่างการเรียกใช้งาน
ให้โฟลเดอร์ชื่อ python path: /home/mylaptop/work/python
ภายในมีไฟล์ python_file.py, text_file.text, xml_file.xml
ต้องส่งค่า Directory
full_file_paths = get_filepaths("home/mylaptop/work/python")

"/home/mylaptop/work/python" : คือ path ของ directory ที่ต้องการค้นหาคำ หรืออักษร

ผลลัพธ์ :


[/home/mylaptop/work/python/python_file.py, /home/mylaptop/work/python/text_file.text, /home/mylaptop/work/python/xml_file.xml]



2. การกรองประเภทของไฟล์

 

def get_file paths(directory):
  for f in full_file_paths:
    if f.endswith(".py"):
        print f


ต่อเนื่องจาก ข้อ 1. เมื่อได้ path ของแต่ละไฟล์มาแล้ว ก็นำมากรองประเภทของไฟล์ที่ต้องการ จากตัวอย่างต้องการหาจากไฟล์ .py

3. การเปิด และอ่านไฟล์
เมื่อได้ path ของไฟล์มาแล้ว ต้องทำการเปิดและอ่านข้อมูลออกมาทีละบรรทัด


open_file = open(f)
open_file.read
for line in open_file:
        print line
open_file.close




ต่อเนื่องจาก ข้อ 2. ต้องทำการเปิดไฟล์ โดยส่ง path ของไฟล์ลงไป(จากตัวอย่าง path คือ f)
เมื่อเปิดไฟล์แล้ว ก็อ่านไฟล์ และ for ออกมา เพื่อให้อ่านไฟล์ทีละบรรทัด
line ก็คือ ค่าของแต่ละบรรทัด



4. การนำข้อมูลในไฟล์ไปค้นหา อักษร หรือคำที่ต้องการ

def is_ascii(data):
    for i in range(0,len(data)):
        conv = ord(data[i])
        if 161 <= conv <= 251:    
            return False



ต่อ เนื่องจากข้อ 3. เมื่อได้ค่าแต่ละบรรทัดออกมาแล้ว ก็ต้องการนำค่าที่ได้ไปเช็ค โดยส่งค่าแต่ละบรรทัดไปยังฟังก์ชัน โดยสั่งวน for เพื่ออ่านค่าทีละตัว โดยนำค่าแต่ละตัวไปแปลงเป็นค่าของตัวเลขเพื่อ นำไปเช็คกับ รหัส ascii โดยตัวอย่างเช็คภาษาไทย รหัส ascii จะอยู่ในช่วง 161 - 251 ถ้าเจออักษรภาษา ให้ return False



การทำงานก็จะนำทั้ง 4 มารวมกัน เป็นไฟล์ .py สั่งรัน ก็จะสามารถค้นหาค่าที่ต้องการได้

 

 

หัวเรื่อง
Search Thai language in flie with Python
หมวดหมู่
Python, Python
ฮิต
21588
ผู้สร้างเอกสาร
คะนึงรัตน์ ลิ่มตระกูล
วันที่สร้างเอกสาร
2015-02-11 18:52:04

search_thai_lang.zip

ประเภทไฟล์ zip

ขนาดไฟล์ 659 bytes

ผู้อัพโหลดไฟล์ คะนึงรัตน์ ลิ่มตระกูล

วันที่อัพโหลด 2015-02-10 18:43:18


 

 

 

กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
ล่าสุด
อยากทราบวิธีการสร้างปุ่มสำหรับดาวน์โหลดรูป
โดย Ittichai_chupol จ 06 ม.ค. 2020 3:05 pm บอร์ด Programming - PHP
1
41
อ 14 ม.ค. 2020 2:00 pm โดย mindphp
สอบถาม ubuntu เข้าไม่ได้เป็นเพราะอะไร
โดย jirawoot จ 06 ม.ค. 2020 3:04 pm บอร์ด ถาม - ตอบ คอมพิวเตอร์
3
74
จ 06 ม.ค. 2020 4:43 pm โดย mindphp
พาทัวร์พัทยา 1 วันในมุมมองของไกด์
โดย benzas00123 จ 06 ม.ค. 2020 2:36 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
52
จ 06 ม.ค. 2020 2:36 pm โดย benzas00123
วิธีการเขียนโคดเพื่ออัพโหลดไฟล์ เข้าไปในโฟลเดอร์ที่ต้องการพร้อมกับข้อมูลของไฟล์ลงฐานข้อมูล โดยใช้ phpbb
โดย Ittichai_chupol จ 06 ม.ค. 2020 2:20 pm บอร์ด PHP Knowledge
0
35
จ 06 ม.ค. 2020 2:20 pm โดย Ittichai_chupol
ต้องทำยังไงถึงจะให้แสดงภาพที่เป็นนามสกุล gif ได้ครับ
โดย jamepiyawat ส 04 ม.ค. 2020 3:26 pm บอร์ด HTML CSS
4
76
จ 06 ม.ค. 2020 5:28 pm โดย jamepiyawat
วิธีการสร้าง Extension ในส่วนของ User control panel
โดย Ittichai_chupol ศ 03 ม.ค. 2020 1:25 pm บอร์ด PHP Knowledge
0
40
ศ 03 ม.ค. 2020 1:25 pm โดย Ittichai_chupol
ปฏิทินประจําปี 2563 ธีมรูปแบบเงินดิจิตอล
โดย noppadonsk ศ 03 ม.ค. 2020 10:40 am บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
1
105
ส 04 ม.ค. 2020 4:37 am โดย mindphp
สวัสดิการที่คนวัยทำงานควรมีเพื่อสร้างความสมดุลชีวิต
โดย medalezga ศ 03 ม.ค. 2020 4:09 am บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
30
ศ 03 ม.ค. 2020 4:09 am โดย medalezga
B - เข้าเว็ป Leads CRM ไม่ได้
โดย thatsawan พฤ 02 ม.ค. 2020 9:30 pm บอร์ด MD-CRM - Tester
1
5
ศ 03 ม.ค. 2020 6:24 am โดย mindphp
มาแล้ว MDRental ตัวช่วยในการบริหารจัดการพื้นที่สำหรับธุรกิจให้เช่า
โดย prmindphp พฤ 02 ม.ค. 2020 7:33 pm บอร์ด MindPHP News & Feedback
0
73
พฤ 02 ม.ค. 2020 7:33 pm โดย prmindphp
วิธีก่ารแปลง ข้อมมูลจาก Excel เพื่อบันทึกลงในฐานข้อมูล
โดย Ittichai_chupol พฤ 02 ม.ค. 2020 4:58 pm บอร์ด PHP Knowledge
0
1206
พฤ 02 ม.ค. 2020 4:58 pm โดย Ittichai_chupol
อยากทราบวิธีการเรียกใช้งานไฟล์ javascript ได้ทั้งใน phpbb 3.1 กับ phpbb 3.2
โดย Ittichai_chupol พฤ 02 ม.ค. 2020 3:44 pm บอร์ด Programming - PHP
1
62
พฤ 02 ม.ค. 2020 4:09 pm โดย thatsawan
ท่องเที่ยวจังหวัดเชียงราย รู้ไหมจะต้องไป วัดพระแก้ว
โดย Meygrand พฤ 02 ม.ค. 2020 1:18 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
37
พฤ 02 ม.ค. 2020 1:18 pm โดย Meygrand
ปฏิทินประจําปี 2563 อาหารใครสายกิน สารหิวต้องโดน
โดย noppadonsk พฤ 02 ม.ค. 2020 12:31 pm บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
0
90
พฤ 02 ม.ค. 2020 12:31 pm โดย noppadonsk
ตำแหน่งไฟล์ ที่เก็บ my.cnf ไฟล์ ตั้งค่าระบบของ MySQL เวอร์ชั่นต่างๆ และ ติดตั้งบน OS ต่างๆ
โดย mindphp พ 01 ม.ค. 2020 1:24 pm บอร์ด Linux - Web Server
0
25
พ 01 ม.ค. 2020 1:24 pm โดย mindphp
เปิดใช้งาน log_slow_queries MySQL 5.7 บน Ubuntu
โดย mindphp อ 31 ธ.ค. 2019 5:55 pm บอร์ด Linux - Web Server
0
730
อ 31 ธ.ค. 2019 5:55 pm โดย mindphp
อยากทราบวิธีการแสดงที่มี id ซ้ำกันครับ
โดย jamepiyawat ส 28 ธ.ค. 2019 4:22 pm บอร์ด Programming - PHP
3
80
พฤ 02 ม.ค. 2020 8:47 am โดย tsukasaz
ปฏิทินประจําปี 2563 นักษัตย์ 12 ราศี ของจีนที่เรามักคุ้นเคยกัน
โดย noppadonsk ส 28 ธ.ค. 2019 10:40 am บอร์ด พูดคุยเรื่องทั่วไป จับฉ่าย
1
235
ส 04 ม.ค. 2020 4:38 am โดย mindphp
คำสั่งจาก LINE API บันทึกเรียบร้อยแล้ว แต่ไม่เข้าไปใน inbox e-mail : order@dapper.com [2019-12][002]
โดย thatsawan ศ 27 ธ.ค. 2019 5:56 pm บอร์ด MD-CRM - Tester
2
5
ศ 27 ธ.ค. 2019 9:25 pm โดย mindphp
อยากทราบวิธีการอัพโหลดรูปภาพลงใน9kik'ฐานข้อมูล ของ phpbb
โดย Ittichai_chupol ศ 27 ธ.ค. 2019 4:22 pm บอร์ด Programming - PHP
1
73
ศ 27 ธ.ค. 2019 4:38 pm โดย thatsawan