แนะนำตัวช่วยในการ หาคำที่มีจำนวนการใช้งานมากที่สุด

ตอบกระทู้

รูปแสดงอารมณ์
:icon_plusone: :like: :plusone: :gfb: :-D :) :( :-o 8O :? 8) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen: :angry: :baa: :biggrin:
รูปแสดงอารมณ์อื่นๆ

BBCode เปิด
[img] เปิด
[url] เปิด
[Smile icon] เปิด

กระทู้แนะนำ
   

มุมมองที่ขยายได้ กระทู้แนะนำ: แนะนำตัวช่วยในการ หาคำที่มีจำนวนการใช้งานมากที่สุด

แนะนำตัวช่วยในการ หาคำที่มีจำนวนการใช้งานมากที่สุด

โดย tatiya » 20/08/2018 4:54 pm

วันนี้ผมจะมาแนะนำ Module ที่ใช้สำหรับการจัดอับคำ ในภาษา Python ครับ โดยการใช้คำสั่ง Rank ใน module Pythainlp ครับ อีกอย่างนะครับ แนะนำในใช้ editer Pycharm นะครับ (บนระบบปฎิบัติการ Ubuntu แต่ผมว่าใน Windows ก้ไม่น่าจะต่างกันนะครับ)

อันดับแรก คุณต้องทำการติดตั้ง module Pythinlp ก่อนนะครับ วิธีการติดตั้งก็คือ เปิดโปรแกรม Pycharm แล้วเปิดตัว terminal ของ Pycharm แล้วพิมพ์

โค้ด: เลือกทั้งหมด

pip install pythainlp
ถ้าติดตั้งไม่ได้ให้ลอง อัฟเดต pip ดูนะครับ
เมื่อทำการติดตั้งเสร็จแล้ว ให้เรา สร้างไฟล์ .py มาลองกันเลยครับ

โค้ด: เลือกทั้งหมด

from pythainlp.rank import rank

text = "ใน แมวกินปลาอร่อยฉันชอบแมวเพราะแมวน่ารักและแมวเป็นเจ้านายเราเรากลายเป็นทาสแมวไปแล้วแมว below ตั้งแต่ i can do it am know how"
new_text = word_tokenize(text, engine="mm")
new_text = rank(new_text,stopwords)
print(new_text)
ผลลัพท์
Counter({'แมว': 6, 'กลายเป็น': 1, 'ทาส': 1, 'ปลา': 1, 'อร่อย': 1, 'know': 1, 'กิน': 1, 'ชอบ': 1, 'น่ารัก': 1, 'เจ้านาย': 1})


--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
การเก็บข้อมูลหลังจากที่เราทำการ นับครับแล้วจะเก็บข้อมูลในรูปแบบ dict นะครับ

อธิบาย code
1. ทำการ import pythainlp.rank import rank เพื่อในการเรียกใช้ module มาจัดอันดับ
2." "
3. สร้างตัวแปร text มารับข้อมูลในรูปแบบ text
4. ทำการตัดคำ ให้เป็นคำๆ ในส่วนนี้เวลาเราตัดคำเสร็จ ตัวคำสั่งจะเก็บ ข้อมูลออกมาในรูปแบบ list
5.ทำการจัดอันดับคำ
6.สั่งให้โชว์ผลลัพท์

ข้างบน