ชื่อโครงงาน | แบบจำลองผสมแบบแยกแยะสำหรับการแบ่งคำไทย |
ชื่อผู้ทำโครงงาน | ฆนาศัย กรึงไกร,ชุลีรัตน์ จรัสกุลชัย,Jun ichi kazama |
ระดับชั้น | อื่นๆ |
หมวดวิชา | คอมพิวเตอร์ |
วัน/เดือน/ปี ทำโครงงาน | ไม่ระบุ |
บทคัดย่อ |
การแบ่งคำเป็นงานพื้นฐานในการประมวลผลภาษาไทยด้วยคอมพิวเตอร์ ความกำกวมของขอบเขตคำและคำที่ระบบไม่รู้จัก(ไม่ปรากฏในพจนานุกรมของระบบ) เป็นสาเหตุหลักที่สำคัญทำให้การแบ่งคำยาก ในงานวิจัยนี้ เรานำเสนอแบบจำลองผสมแบบแยกแยะ ซึ่งแทน "เสิร์จเสปซ"ด้วย"แลททิส" ที่ประกอบไปด้วย "โหนด" ในระดับคำและระดับกลุ่มอักขระ และสามารถใช้ประโยชน์ของข้อมูลบนพื้นฐานของการเรียนรู้แบบ "ออนไลน์ลาร์จมาร์จิน"ที่เรียกว่า MIRA (Margin infused Relaxed Algorithm) เราได้นำเสนอการทดลองบนคลังข้อความของ Best(ชุดที่1-5) เพื่อแสดงความเป็นไปได้และประสิทธิภาพของ
วิธีที่นำเสนอ
|
สรุป
การแบ่งคำไทย หรือ การแยกแยะ การแบ่งคำ มีประโยชน์ มากในยุคสมัยนี้ เพราะ หลายๆคนอาจขี้เกียจ หรือ แยกแยะ คำ เพื่อให้มนุษย์ สะดวกสบายยิ่งขึ้น