มาทำความรู้จักกับ Word Cloud
โพสต์แล้ว: 03/08/2018 5:55 pm
Word Cloud หรือกลุ่มคำ คือ การจับกลุ่มคำโดยเรียงจากคำที่มีมากที่สุดไปน้อยที่สุด เป็นประโยชน์ในการทำรายงานข้อความ เพื่อให้มองเห็นคำที่ถูกใช้มากที่สุดได้ง่ายขึ้น จะอธิบายให้เข้าใจง่ายๆก็คือ Module word cloud จะทำงานโดยการนับ คำทีซ้ำกันแล้วมาแสดง เช่น กากากากากา มามา หาหาหา ลาลา มันก็จะแสดงคำว่า กาออกมาเป็นตัวหนังสือที่ใหญ่สุด เดี๋ยวจะยกตัวอย่างให้ดูนะครับ
วิธีติดตั้ง
เปิด terminal หรือ cmd ขึ้นมา
ป้อนคำสั่ง
อ่ะห๊าา ลืมไปเราควรติดตั้ง pythainlp ด้วยครับ เพื่อใช้ตัดคำภาษาไทย
ทดลองใช้งานครับ เข้าไปในตัว editer ที่ท่านใช้ แล้วลองโค้ดตามนี้เลย
ผลลัพท์
วิธีติดตั้ง
เปิด terminal หรือ cmd ขึ้นมา
ป้อนคำสั่ง
โค้ด: เลือกทั้งหมด
pip install wordcloud
โค้ด: เลือกทั้งหมด
pip install pythainlp
โค้ด: เลือกทั้งหมด
import matplotlib.pyplot as plt
from pythainlp.tokenize import word_tokenize
from wordcloud import WordCloud
from pythainlp.corpus import stopwords
text = "facebook facebook facebook facebook facebook twiter twiter twiter" \
" instargram instargram instargram mac mac go to mindphp mindphp " \
"mindphp mindphp mindphp mindphp mindphp mindphp mindphp "
wordcloud = WordCloud(stopwords = ' '.join(stopwords.words('thai')),collocations=False,background_color="white",width=800,
height=400,).generate(' '.join(word_tokenize(text,'mm')))
#print(wordcloud)
plt.imshow(wordcloud, cmap=plt.cm.gray, interpolation='bilinear')
plt.axis("off")
plt.show()