ผศ.ดร.ปิยภัทร บุษบาบดินทร์

 

หลักการและเหตุผล

โปรแกรม R เป็นโปรแกรมที่ใช้กันอย่างแพร่หลาย เนื่องจากโปรแกรมที่เปิดให้ใช้ได้อย่างอิสระ (Open source software) จึงไม่มีค่าลิขสิทธิ์และสามารถประยุกต์ใช้ได้กับศาสตร์สาขาต่างๆ อีกทั้งยังมีผู้ร่วมพัฒนาโปรแกรมอยู่เป็นจำนวนมากทั่วโลก ทำให้มีโปรแกรมย่อยเสริมเป็นจำนวนมาก และในปัจจุบันนี้ได้มีการนำโปรแกรม R เข้ามาใช้วิเคราะห์ในงานสถิติและงานวิจัยอย่างกว้างขวาง เนื่องจากมีการจัดการข้อมูลที่สะดวก การคำนวณที่รวดเร็ว และการแสดงผลกราฟิกที่มีประสิทธิภาพ แต่ในขณะเดียวกันหากการวิเคราะห์นั้นพบข้อมูลที่ผิดปกติ นักวิจัยส่วนใหญ่ก็จะตัดข้อมูลนั้นทิ้งไปไม่นำมาพิจารณา เนื่องจากมีความซับซ้อนและความยุ่งยากในการวิเคราะห์ การนำทฤษฎีค่าสุดขีด (Extreme valve theory: EVT) มาประยุกต์ใช้กับข้อมูลก็จะสามารถจัดการกับปัญหาดังกล่าวได้ เพราะในความเป็นจริงค่าความน่าจะเป็นในการเกิดขึ้นของเหตุการณ์ที่มีค่าสูงสุดหรือต่ำสุดมีความสำคัญอย่างมากในการวางแผนเตรียมความพร้อมของทรัพยากรเพื่อป้องกัน และรับมือกับสถานการณ์วิกฤตได้อย่างมีประสิทธิภาพสูงสุด อาทิเช่น ปริมาณน้ำฝนสูงสุด-ต่ำสุดในแต่ละวัน จะสามารถนำมาใช้คาดการณ์การเกิดภัยพิบัติใหญ่ได้ ระดับความสูงของคลื่นในทะเลสามารถนำมาคำนวณหาแนวทางการก่อสร้างเพื่อช่วยป้องกันการเกิดน้ำท่วมของพื้นที่ชายฝั่ง หรือแม้แต่อัตราการป่วยด้วยโรคอุบัติซ้ำสูงสุดในแต่ละสัปดาห์ ก็สามารถนำมาใช้คาดการณ์การแพร่ระบาดของโรคอุบัติซ้ำในอนาคตได้เช่นเดียวกัน

ซึ่งทฤษฎีค่าสุดขีดนั้นได้มีการแบ่งการแจกแจงออกเป็น 2 ประเภท ตามลักษณะของการเลือกข้อมูลค่าสุดขีดที่นำมาวิเคราะห์ ได้แก่

  1. การแจกแจงค่าสุดขีดวางนัยทั่วไป (Generalized Extreme Value Distribution: GEV) จะเหมาะสำหรับการวิเคราะห์ค่าสุดขีดในช่วงคาบเวลาที่สนใจ เช่น รายปี รายเดือน รายไตรมาส หรือรายสัปดาห์ เป็นต้น และค่าสังเกตที่รวบรวมไว้ควรจะมีจำนวนมากกว่า 30 ปีขึ้นไป
  2. การแจกแจงพาเรโตวางนัยทั่วไป (Generalized Pareto Distribution: GPD) จะเหมาะสำหรับการวิเคราะห์ข้อมูลด้านอุตุวิทยาและอุทกวิทยา เพื่อวิเคราะห์ความเสียหายของเหตุการณ์รุนแรงที่มีโอกาสเกิดขึ้นได้ยาก เนื่องจาก GPD จะอธิบายลักษณะข้อมูลที่มีการแจกแจงแบบมีหางที่หนัก (Heavytailed Distribution) ได้ดีกว่า GEV เนื่องจากจำนวนค่าสุดขีดที่นำมาวิเคราะห์ด้วย GPD จะมีจำนวนมากกว่าข้อมูลที่นำมาวิเคราะห์ด้วย GEV ซึ่งจะสามารถลดความไม่แน่นอนที่เกิดขึ้นจากการสุ่มตัวอย่างได้

จากความสำคัญในข้างต้น โครงการบริการวิชาการได้เล็งเห็นถึงประโยชน์ของการใช้โปรแกรม R จึงได้จัดโครงการอบรมเชิงปฏิบัติการ การใช้โปรแกรม R ในงานสถิติและงานวิจัย รวมถึงการประยุกต์ใช้ทฤษฎีค่าสุดขีดกับข้อมูลในด้านต่างๆ เพื่อส่งเสริมให้ผู้เข้าร่วมอบรมมีความรู้ ความเข้าใจ เกี่ยวกับทฤษฎีค่าสุดขีด และการใช้ซอฟต์แวร์ที่มีประสิทธิภาพเพื่อนำไปประยุกต์ใช้กับข้อมูลจริงได้

 

วัตถุประสงค์

  1. เพื่อให้ผู้เข้ารับการอบรมมีความรู้ ความเข้าใจเกี่ยวกับทฤษฎีค่าสุดขีด
  2. เพื่อให้ผู้เข้ารับการอบรมสามารถวิเคราะห์ข้อมูลสุดขีดด้วยโปรแกรม R
  3. เพื่อให้ผู้เข้ารับการอบรมสามารถนำไปประยุกต์ใช้กับข้อมูลจริงได้

เนื้อหาในการอบรม

  1. แนะนำโปรแกรม R / RStudio
  2. พื้นฐานความรู้เกี่ยวกับทฤษฎีค่าสุดขีด
    1. วิธีกำหนดช่วงเวลา (Block time Methods)
    2. วิธีเกินเกณฑ์ (Threshold Methods)
  3. การวิเคราะห์ค่าสุดขีดเมื่อกระบวนการคงที่ ด้วยโปรแกรม R
  4. การวิเคราะห์ค่าสุดขีดเมื่อกระบวนการไม่คงที่ ด้วยโปรแกรม R
  5. การวิเคราะห์ค่าสุดขีดหลายตัวแปร ด้วยโปรแกรม R