หลังจากบทความ ตัวอย่างการใช้งานเมธอดตัดคำของโมดูล PyThaiNLP (ไพไทยเอ็นแอลพี) โดยใช้ engine newmm (เอ็นจิ้น นิวเอ็มเอ็ม) ทำให้เรานั้นได้ศึกษาเกี่ยวกับการตัดคำในภาษาไพธอน ซึงเจ้าโมดูล Pythainlp นี้ยังมีฟังก์ชั่นตัดคำที่หลากหลายในบทความนี้เราจะมาเสนอหารตัดคำในรูปแบบอื่นๆอีก
เมธอดตัดคำใน PyThaiNLP (ไพไทยเอ็นแอลพี)
เมธอดตัดคำของ PyThaiNLP (ไพไทยเอ็นแอลพี) นั้นมีชื่อว่า word_tokennize เป็นเมธอดสำหรับตัดคำที่นอกจากจะตัดภาษาไทยได้แล้วยังสามารถตัดคำภาษาอังกฤษได้อีกด้วยแถมยังมีเครื่องมือการตัดคำหรือ engine (เอ้นจิ้น) หลาากหลายรูปแบบ ในบทความนี้จะมาแนะนำในรูปแบบการตัดคำของเครื่องมือที่ชื่อ dict โดยเจ้าตัว dict เป็นการตัดคำโดยใช้พจานุกรมจาก thaiword.txt ใน corpus (ความแม่นยำปานกลาง) จะคืนค่า False หากข้อความนั้นไม่สามารถตัดคำได้
การใช้งานเมธอดตัดคำของโมดูล PyThaiNLP (ไพไทยเอ็นแอลพี) โดยใช้ engine dict (เอ็นจิ้น นิวเอ็มเอ็ม)
โค้ดตัวอย่าง
from pythainlp import word_tokenize #เรียกใช้งานโมดูล word_tokenize
text = 'สอบถามเรื่องการใช้งานโทรศัพท์' # คำที่จะตัด
text = word_tokenize(text, engine='dict') #สร้างออบเจคขึ้นมารองรับการใช้งาน โดยใช้ engine newmm
print(text) #แสดงผลของทีตัดเสร้จแล้ว
ผลการรัน:ถือว่าค่อนข้างใช้งานได้ดีเลยทีเดียวแต่ถ้าหากคำนั้นมีภาษาอังกฤษผสมอยู่ด้วยแล้วเจ้าตัวเมธอดนี้จะคืนค่า False ออกมา
['สอบถาม', 'เรื่อง', 'การใช้งาน', 'โทรศัพท์']
อ้างอิงรุปภาพ:github
สามารถศึกษาข้อมูลเพิ่มเติมได้ที่
- บทความเกี่ยวกับ ความรู้ทั้วไป(80)
- บทความเกี่ยวกับ Software License ใบอนุญาตซอฟต์แวร์(9)
- บทความเกี่ยวกับ phpBB เว็บบอร์ดฟรี(72)
- หัวเรื่อง
- การใช้งานเมธอดตัดคำของโมดูล PyThaiNLP (ไพไทยเอ็นแอลพี) โดยใช้ engine dict (เอ็นจิ้น dict)
- หมวดหมู่
- Python Framework Flask, Python Framework Flask
- ฮิต
- 2916
- ผู้สร้างเอกสาร
- anawatj
- วันที่สร้างเอกสาร
- 2023-09-30 22:53:17
- รายละเอียด
เมธอดตัดคำของ PyThaiNLP (ไพไทยเอ็นแอลพี) นั้นมีชื่อว่า word_tokennize เป็นเมธอดสำหรับตัดคำที่นอกจากจะตัดภาษาไทยได้แล้วยังสามารถตัดคำภาษาอังกฤษได้อีกด้วยแถมยังมีเครื่องมือการตัดคำหรือ engine (เอ้นจิ้น) หลาากหลายรูปแบบ ในบทความนี้จะมาแนะนำในรูปแบบการตัดคำของเครื่องมือที่ชื่อ dict โดยเจ้าตัว dict เป็นการตัดคำโดยใช้พจานุกรมจาก thaiword.txt ใน corpus (ความแม่นยำปานกลาง) จะคืนค่า False หากข้อความนั้นไม่สามารถตัดคำได้