ปกติแล้วการเขียนโปรแกรมที่ยุ่งยากและซับซ้อนย่อมใช้เวลานานมากเราต้องคำนึงถึงองค์ประกอบหลายๆอย่างเพื่อให้โปรแกรมนั้นใช้งานได้และรองรับจุดประสงค์การใช้งานซึ่งเป็นสิ่งทีเป็นไปได้ยากมากสำหรับโปรแกรมเมอร์หลายๆท่านที่มีเวลาน้อยหรือยังไม่เก่งเท่าที่ควร โมดูล pytahinlp ก็เป็นอีกโมดูลหนึ่งที่เรานั้นจำเป็นต้องใช้มากเพราะมันใช้ในการตัดคำได้ทั้งภาษาไทยและอังกฤษ ซึ่งมันจะแยกออกมาเป็นประโยคๆ ทำให้สามารถนำไปใช้ต่อได้ง่ายมาก ซึ่งเหมาะกับชาวโปรแกรมเมอรที่ต้องการความรวดเร็วไม่ต้องมานั่งเขียนโปรแกรมเอง โดยเจ้าดมดูลนี้รองรับ ไพธอน โดยสามารถศึกษาเรื่องการ ตั้งตั้งโมดูลได้ที่กระทู้ การติดตั้งโมดูล pythainlp สำหรับตัดคำไทย และ อังกฤษ ใน Pycharm (ไพชาร์ม) และตัวโมดูลนี้ยังรองรับหลายๆ os เช่น วินโดวส์และ ubuntu (อูบันตู)
เมธอดตัดคำใน PyThaiNLP (ไพไทยเอ็นแอลพี)
เมธอดตัดคำของ PyThaiNLP (ไพไทยเอ็นแอลพี) นั้นมีชื่อว่า word_tokennize เป็นเมธอดสำหรับตัดคำที่นอกจากจะตัดภาษาไทยได้แล้วยังสามารถตัดคำภาษาอังกฤษได้อีกด้วยแถมยังมีเครื่องมือการตัดคำหรือ engine (เอ้นจิ้น) หลาากหลายรูปแบบ ในบทความนี้จะมาแนะนำในรูปแบบการตัดคำของเครื่องมือที่ชื่อ newmm กัน
การใช้งานเมธอดตัดคำของโมดูล PyThaiNLP (ไพไทยเอ็นแอลพี) โดยใช้ engine newmm (เอ็นจิ้น นิวเอ็มเอ็ม)
โค้ดตัวอย่างการใช้งาน
from pythainlp import word_tokenize #เรียกใช้งานโมดูล word_tokenize
text = 'สอบถามเรื่อง ip address' # คำที่จะตัด
text = word_tokenize(text, engine='newmm') #สร้างออบเจคขึ้นมารองรับการใช้งาน โดยใช้ engine newmm
print(text) #แสดงผลของทีตัดเสร้จแล้ว
ผลการรัน:สังเกตุได้ว่าคำที่ตัดได้นั้นจะอยู่ในรูปแบบของตัวแปรลิสต์และคำที่ได้นั้นถือว่าค่อนข้างจะตรงตามความต้องการของผู้ใช้เลย
['สอบถาม', 'เรื่อง', ' ', 'ip', ' ', 'address']
อ้างอิงรูปาพ: github
สามารถศึกษาเพิ่มเติมได้จาก
- บทความเกี่ยวกับ ความรู้ทั้วไป(80)
- บทความเกี่ยวกับ Software License ใบอนุญาตซอฟต์แวร์(9)
- บทความเกี่ยวกับ phpBB เว็บบอร์ดฟรี(72)