การทำนายข้อมูลแบบ Dicision Tree ด้วยโปรแกรม Weka
โพสต์แล้ว: 06/12/2019 5:16 pm
โปรแกรม Weka เป็นโปรแกรมที่ใช้ในการวิเคราะห์ข้อมูลด้วยเทคนิคเหมืองข้อมูล คือกระบวนการวิเคราะห์ข้อมูลจากข้อมูลจำนวนมากเพื่อหาความสัมพันธ์ รูปแบบและแยกประเภทของข้อมูล และ weka นั้นยังได้รวบรวมเทคนิคในการวิเคราะห์ข้อมูลหลาย ๆ เทคนิคเข้าไว้ด้วยกัน แถมยังสามารถวิเคราะห์ข้อมูลเหล่านี้ได้ผ่านทางหน้าจอ GUI (Graphic User Interface) ของ Weka เอง
ในบทความนี้จะยกตัวอย่างการทำนายด้วยวิธี Dicision Tree
Dicision Tree ทำงานเหมือนเป็นการสร้างต้นไม้เพื่อประเมินตัวอย่างของข้อมูล โดยเริ่มจากรากและค่อย ๆ ย้ายไปยังใบไม้ จนกว่าจะสามารถทำนายได้ กระบวนการสร้างแผนผังการตัดสินใจทำงานโดยการเลือกจุดแยกที่ดีที่สุด และทำซ้ำกระบวนการจนกว่าต้นไม้จะมีความลึกที่แน่นอน สามารถรองรับปัญหาการจำแนก
เลือกอัลกอริทึม Dicision Tree:
- คลิกปุ่ม “Choose” และเลือก “REPTree” ด้านล่าง “Tree”
- คลิกที่ชื่อของอัลกอริทึมเพื่อตรวจสอบการกำหนดค่า
สามารถระบุความลึกของต้นไม้ได้ที่ maxDepth
สามารถเลือกที่จะเปลี่ยนการตั้งค่าพารามิเตอร์ noPruning เป็น True ได้ แต่อาจทำให้ประสิทธิภาพการทำนายลดลง
พารามิเตอร์ minNum จะกำหนดจำนวนขั้นต่ำของอินสแตนซ์
- คลิก “OK” เพื่อปิดการกำหนดค่า
- คลิกปุ่ม “Start” เพื่อเรียกใช้อัลกอริทึมบนชุดข้อมูล Ionosphere
จะเห็นว่ามีความแม่นยำถึง 89%
อัลกอริทึมการตัดสินใจขั้นสูงอีกอย่างที่สามารถใช้ได้คืออัลกอริทึม C4.5 หรือเรียกว่า J48 ใน Weka
เราจะสามารถตรวจสอบการสร้างภาพต้นไม้การตัดสินใจที่เตรียมไว้ในข้อมูลการฝึกอบรมทั้งหมดโดยคลิกขวาที่ "Result list" และคลิก "Visualize Tree"
อ้างอิง https://machinelearningmastery.com
บทความที่เกี่ยวข้อง
Machine Learning คืออะไร
Data Mining (ดาต้า ไมน์นิ่ง) เหมืองข้อมูล
การใช้ PHP เรียก WEKA
ในบทความนี้จะยกตัวอย่างการทำนายด้วยวิธี Dicision Tree
Dicision Tree ทำงานเหมือนเป็นการสร้างต้นไม้เพื่อประเมินตัวอย่างของข้อมูล โดยเริ่มจากรากและค่อย ๆ ย้ายไปยังใบไม้ จนกว่าจะสามารถทำนายได้ กระบวนการสร้างแผนผังการตัดสินใจทำงานโดยการเลือกจุดแยกที่ดีที่สุด และทำซ้ำกระบวนการจนกว่าต้นไม้จะมีความลึกที่แน่นอน สามารถรองรับปัญหาการจำแนก
เลือกอัลกอริทึม Dicision Tree:
- คลิกปุ่ม “Choose” และเลือก “REPTree” ด้านล่าง “Tree”
- คลิกที่ชื่อของอัลกอริทึมเพื่อตรวจสอบการกำหนดค่า
สามารถระบุความลึกของต้นไม้ได้ที่ maxDepth
สามารถเลือกที่จะเปลี่ยนการตั้งค่าพารามิเตอร์ noPruning เป็น True ได้ แต่อาจทำให้ประสิทธิภาพการทำนายลดลง
พารามิเตอร์ minNum จะกำหนดจำนวนขั้นต่ำของอินสแตนซ์
- คลิก “OK” เพื่อปิดการกำหนดค่า
- คลิกปุ่ม “Start” เพื่อเรียกใช้อัลกอริทึมบนชุดข้อมูล Ionosphere
จะเห็นว่ามีความแม่นยำถึง 89%
อัลกอริทึมการตัดสินใจขั้นสูงอีกอย่างที่สามารถใช้ได้คืออัลกอริทึม C4.5 หรือเรียกว่า J48 ใน Weka
เราจะสามารถตรวจสอบการสร้างภาพต้นไม้การตัดสินใจที่เตรียมไว้ในข้อมูลการฝึกอบรมทั้งหมดโดยคลิกขวาที่ "Result list" และคลิก "Visualize Tree"
อ้างอิง https://machinelearningmastery.com
บทความที่เกี่ยวข้อง
Machine Learning คืออะไร
Data Mining (ดาต้า ไมน์นิ่ง) เหมืองข้อมูล
การใช้ PHP เรียก WEKA