การค้นหาคำหรือ ตัวอักษร ในไฟล์ ที่ต้องการ สามารถนำมาประยุกต์ใช้งานได้ดังต่อไปนี้

ตัวอย่างการใช้งาน : เป็นการค้นหา อักษรภาษาไทย ที่อยู่ในไฟล์ เมื่อเจอแล้วให้ แสดงผล ชื่อไฟล์และบรรทัดที่มีอักษรนั้นอยู่

ขั้นตอนการทำงาน


1. การค้นหา Path ของไฟล์ทั้งหมด

 

def get_file paths(directory):
    file_paths = [] 
    for root, directories, files in os.walk(directory):
        for filename in files:           
            filepath = os.path.join(root, filename)
            file_paths.append(filepath) 
    return file_paths 


ตัวอย่างการเรียกใช้งาน
ให้โฟลเดอร์ชื่อ python path: /home/mylaptop/work/python
ภายในมีไฟล์ python_file.py, text_file.text, xml_file.xml
ต้องส่งค่า Directory
full_file_paths = get_filepaths("home/mylaptop/work/python")

"/home/mylaptop/work/python" : คือ path ของ directory ที่ต้องการค้นหาคำ หรืออักษร

ผลลัพธ์ :


[/home/mylaptop/work/python/python_file.py, /home/mylaptop/work/python/text_file.text, /home/mylaptop/work/python/xml_file.xml]



2. การกรองประเภทของไฟล์

 

def get_file paths(directory):
  for f in full_file_paths:
    if f.endswith(".py"):
        print f


ต่อเนื่องจาก ข้อ 1. เมื่อได้ path ของแต่ละไฟล์มาแล้ว ก็นำมากรองประเภทของไฟล์ที่ต้องการ จากตัวอย่างต้องการหาจากไฟล์ .py

3. การเปิด และอ่านไฟล์
เมื่อได้ path ของไฟล์มาแล้ว ต้องทำการเปิดและอ่านข้อมูลออกมาทีละบรรทัด


open_file = open(f)
open_file.read
for line in open_file:
        print line
open_file.close




ต่อเนื่องจาก ข้อ 2. ต้องทำการเปิดไฟล์ โดยส่ง path ของไฟล์ลงไป(จากตัวอย่าง path คือ f)
เมื่อเปิดไฟล์แล้ว ก็อ่านไฟล์ และ for ออกมา เพื่อให้อ่านไฟล์ทีละบรรทัด
line ก็คือ ค่าของแต่ละบรรทัด



4. การนำข้อมูลในไฟล์ไปค้นหา อักษร หรือคำที่ต้องการ

def is_ascii(data):
    for i in range(0,len(data)):
        conv = ord(data[i])
        if 161 <= conv <= 251:    
            return False



ต่อ เนื่องจากข้อ 3. เมื่อได้ค่าแต่ละบรรทัดออกมาแล้ว ก็ต้องการนำค่าที่ได้ไปเช็ค โดยส่งค่าแต่ละบรรทัดไปยังฟังก์ชัน โดยสั่งวน for เพื่ออ่านค่าทีละตัว โดยนำค่าแต่ละตัวไปแปลงเป็นค่าของตัวเลขเพื่อ นำไปเช็คกับ รหัส ascii โดยตัวอย่างเช็คภาษาไทย รหัส ascii จะอยู่ในช่วง 161 - 251 ถ้าเจออักษรภาษา ให้ return False



การทำงานก็จะนำทั้ง 4 มารวมกัน เป็นไฟล์ .py สั่งรัน ก็จะสามารถค้นหาค่าที่ต้องการได้

 

 

หัวเรื่อง
Search Thai language in flie with Python
หมวดหมู่
Python, Python
ฮิต
18892
ผู้สร้างเอกสาร
คะนึงรัตน์ ลิ่มตระกูล
วันที่สร้างเอกสาร
2015-02-11 18:52:04

search_thai_lang.zip

ประเภทไฟล์ zip

ขนาดไฟล์ 659 bytes

ผู้อัพโหลดไฟล์ คะนึงรัตน์ ลิ่มตระกูล

วันที่อัพโหลด 2015-02-10 18:43:18


 

 

 

กระทู้ล่าสุดจากเว็บบอร์ด
หัวข้อกระทู้
ตอบ
เปิดดู
ล่าสุด
การบันทึกส่วนต่างค่าธรรมเนียมที่ลูกค้าจ่ายต่ำไป บนระบบ OpenERP
โดย EyePornnipa ส 20 ก.ค. 2019 5:25 pm บอร์ด M089 - นางสาวพรนิภา ราชธานี
0
14
ส 20 ก.ค. 2019 5:25 pm โดย EyePornnipa
อยากทราบวิธีการนำ ค่าของชุดข้อมูล array ที่อยู่ใรตัวแปลเดียวกัน มาแทนค่าซึ่งกันและกัน ใน phpbb
โดย Ittichai_chupol ส 20 ก.ค. 2019 4:46 pm บอร์ด Programming - PHP
0
8
ส 20 ก.ค. 2019 4:46 pm โดย Ittichai_chupol
เล่นเกมตีเทนนิสด้วยการค้นหาคำว่า วิมเบิลดัน
โดย jamepiyawat ส 20 ก.ค. 2019 4:14 pm บอร์ด Share Knowledge
0
9
ส 20 ก.ค. 2019 4:14 pm โดย jamepiyawat
Module Menu Maximenu CK เมนูรูปแบบที่เรากำหนดเอง
โดย Patipat ส 20 ก.ค. 2019 4:13 pm บอร์ด Joomla Extension Review
0
5
ส 20 ก.ค. 2019 4:13 pm โดย Patipat
google Docs สามารถพิมพ์ข้อความได้ด้วยการพูด
โดย jamepiyawat ส 20 ก.ค. 2019 3:07 pm บอร์ด Share Knowledge
1
11
ส 20 ก.ค. 2019 3:10 pm โดย mindphp
การใช้งานของฟัังก์ชัน Output Buffer - เก็บข้อมูลไว้เพื่อมาเรียกใช้
โดย Patipat ส 20 ก.ค. 2019 2:24 pm บอร์ด PHP Knowledge
0
6
ส 20 ก.ค. 2019 2:24 pm โดย Patipat
ข้อดีของระบบ OpenERP
โดย EyePornnipa ส 20 ก.ค. 2019 1:47 pm บอร์ด M089 - นางสาวพรนิภา ราชธานี
0
10
ส 20 ก.ค. 2019 1:47 pm โดย EyePornnipa
ฟังก์ชัน metaphone () - สามารถใช้สำหรับการสะกดคำสร้างคีย์สำหรับการออกเสียง
โดย Patipat ส 20 ก.ค. 2019 1:46 pm บอร์ด PHP Knowledge
0
5
ส 20 ก.ค. 2019 1:46 pm โดย Patipat
Sigle Quote (') และ Double Quote (") ในภาษา php ใช้ต่างกันอย่างไร
โดย jamepiyawat ส 20 ก.ค. 2019 12:17 pm บอร์ด PHP Knowledge
0
20
ส 20 ก.ค. 2019 12:17 pm โดย jamepiyawat
วิธีการแปลงไฟล์ .html เป็น pdf ด้วย wkhtmltopdf ร่วมกับ flask
โดย jirawoot ส 20 ก.ค. 2019 11:48 am บอร์ด Python Knowledge
0
13
ส 20 ก.ค. 2019 11:48 am โดย jirawoot
เจอปัญหา Joomla Error Error: Failed to start application: Error starting the session.
โดย mindphp ส 20 ก.ค. 2019 11:22 am บอร์ด ปัญหาการใช้ phpBB3, SMF, Joomla, Wordpress, CMS CRM
1
12
ส 20 ก.ค. 2019 11:59 am โดย mindphp
งานประจำวันที่ 20 กรกฎาคม 2562
โดย Patipat ส 20 ก.ค. 2019 10:24 am บอร์ด M088 - ปฏิภัทร สารธรรม
1
9
ส 20 ก.ค. 2019 7:39 pm โดย Patipat
งานประจำวันที่ 20 กรกฎาคม 2562
โดย jamepiyawat ส 20 ก.ค. 2019 10:15 am บอร์ด M084 - นายปิยวัช เชาว์วิมล
2
10
ส 20 ก.ค. 2019 7:40 pm โดย jamepiyawat
งานประจำวันที่ 20 กรกฎาคม 2562
โดย EyePornnipa ส 20 ก.ค. 2019 10:02 am บอร์ด M089 - นางสาวพรนิภา ราชธานี
4
30
ส 20 ก.ค. 2019 7:08 pm โดย EyePornnipa
งานประจำวันที่ 20 กรกฎาคม 2562
โดย jirawoot ส 20 ก.ค. 2019 10:00 am บอร์ด M090 - นายจิระวุฒิ อัครลิขิตกุล
1
8
ส 20 ก.ค. 2019 5:02 pm โดย jirawoot
สรุปการเขียน Module Openerp
โดย chatee supasand ศ 19 ก.ค. 2019 7:39 pm บอร์ด MT33 - นายชาตรี สุภาแสน
1
5
ส 20 ก.ค. 2019 10:27 am โดย tatiya
ปัญหา Error GROUP BY clause; this is incompatible with sql_mode=only_full_group_by [1055]
โดย mindphp ศ 19 ก.ค. 2019 7:30 pm บอร์ด SQL - Database
0
9
ศ 19 ก.ค. 2019 7:30 pm โดย mindphp
วิธีการเขียน Select ข้อมูล ที่มีซ่ำกัน ไม่ให้ซ่ำกัน ใน phpbb
โดย Ittichai_chupol ศ 19 ก.ค. 2019 6:25 pm บอร์ด PHP Knowledge
0
8
ศ 19 ก.ค. 2019 6:25 pm โดย Ittichai_chupol
ข้อแตกต่างระหว่างสินค้าคงเหลือ กับ สินทรัพย์ถาวร
โดย EyePornnipa ศ 19 ก.ค. 2019 5:42 pm บอร์ด Accounting software & ERP โปรแกรมบัญชี ระบบอีอาร์พี
0
15
ศ 19 ก.ค. 2019 5:42 pm โดย EyePornnipa
บันทึกไฟล์แบบ CSV โดยใช้ฟังก์ชัน fputcsv
โดย Patipat ศ 19 ก.ค. 2019 5:01 pm บอร์ด PHP Knowledge
0
5
ศ 19 ก.ค. 2019 5:01 pm โดย Patipat