ความนำ การวิเคราะห์ข้อมูลประเภทของโปรแกรมโปรแกรมสำเร็จรูปทางสถิติความหมายและประเภทของข้อมูล

 

1. 4 ความหมายและประเภทของข้อมูล

      ข้อมูล ( Data) คือ ข้อเท็จจริงที่เกิดขึ้น ข้อมูลอาจจะอยู่ในรูปของข้อความหรือตัวเลข ซึ่งข้อความหรือตัวเลขเหล่านี้อาจเป็นเรื่องที่เกี่ยวข้องกับ คน พืช สัตว์ และสิ่งของ เช่น ปริมาณข้าวที่ประเทศไทยผลิตได้ในในปี 2545 เป็นข้อมูลที่เป็นตัวเลข หรือความคิดเห็นของประชาชนเกี่ยวกับการเลือกตั้ง เป็นข้อมูลที่อยู่ในรูปข้อความ เป็นต้น

      ตัวแปร ( Variable) คือ ข้อมูลที่ได้จากสังเกต วัด สอบถามจากหน่วยที่ศึกษา โดยที่หน่วยที่ศึกษาอาจเป็นคน สัตว์ พืช และสิ่งของ เมื่อหน่วยศึกษาแตกต่างกัน ข้อมูลที่ได้จึงแตกต่างกัน จึงเรียกข้อมูลที่แตกต่างกันนั้นว่า ตัวแปร เช่น รายได้ของคนในจังหวัดสงขลา ในที่นี่หน่วยที่ศึกษา คือ คนในจังหวัดสงขลา แต่ละคนจะแตกต่างกันออกไป ดังนั้นตัวแปร คือ รายได้ของคนในจังหวัดสงขลา ซึ่งมีค่าที่แตกต่างกัน ค่าของตัวแปร คือ ข้อมูลนั่นเอง

 ประเภทของข้อมูล

การแบ่งประเภทของข้อมูล มีวิธีการแบ่งได้หลายวิธี ตามเกณฑ์ในการจำแนก เช่น

      1. จำแนกตามลักษณะการเก็บข้อมูล แบ่งได้เป็น 2 ประเภท คือ

               1.1 ข้อมูลที่ได้จากการนับ (Counting Data) เช่น จำนวนนักศึกษาที่สอบผ่าน จำนวนรถที่ผ่านเข้า - ออกมหาวิทยาลัยในช่วงเวลา
08.00 - 09.00 น . ซึ่งข้อมูลที่ได้จะเป็นเลขจำนวนเต็ม บางครั้งเรียกว่าเป็นข้อมูลที่ไม่ต่อเนื่อง

               1.2 ข้อมูลที่ได้จาการวัด (Measurement Data) เช่น น้ำหนักของนักศึกษาแต่ละคน ส่วนสูงของนักศึกษาแต่ละคน ระยะเวลาในการ เดินทางจากบ้านมายังที่ทำงานของพนักงาน แต่ละคน ปริมาณน้ำฝนที่วัดได้ ข้อมูลที่ได้จะมีลักษณะเป็นเศษส่วน หรือจุดทศนิยม บางครั้ง  เรียกว่าข้อมูลแบบต่อเนื่อง

               1.3 ข้อมูลที่ได้จากการสังเกต ( Ob servation Data) เป็นข้อมูลที่ได้จากการติดตามหรือเฝ้าสังเกตพฤติกรรม หรือปรากฏการณ์ต่างๆ เป็นต้น

               1.4 ข้อมูลที่ได้จากการสัมภาษณ์ ( Interview Data) เป็นข้อมูลที่ได้จากการถามตอบโดยตรง ระหว่างผู้สัมภาษณ์ และผู้ถูกสัมภาษณ์


      2. จำแนกตามลักษณะข้อมูล แบ่งได้เป็น 2 ประเภท คือ

               2.1 ข้อมูลเชิงปริมาณ (Quantitative Data) เป็นข้อมูลที่แสดงความแตกต่างในเรื่องปริมาณหรือขนาด ในลักษณะของตัวเลขโดยตรง เช่น อายุ ส่วนสูง น้ำหนัก ซึ่งแบ่งได้เป็น 2 ประเภท คือ

                     - ข้อมูลแบบไม่ต่อเนื่อง (Discrete Data) หมายถึง ข้อมูลที่มีค่าเป็นเลขจำนวนเต็มที่มีความหมาย เช่น จำนวนสิ่งของ จำนวนคน   เป็นต้น

                       - ข้อมูลแบบต่อเนื่อง ( Continuous Data) หมายถึง ข้อมูลที่อยู่ในรูปตัวเลขที่มีค่าได้ทุกค่าในช่วงที่กำหนด และมีความหมายด้วย เช่น รายได้ น้ำหนัก เป็นต้น

               2.2 ข้อมูลเชิงคุณภาพ (Qualitative Data) เป็นข้อมูลที่แสดงลักษณะที่แตกต่างกัน เช่น เพศชาย เพศหญิง จะเป็นข้อมูลที่ไม่ได้อยู่ในรูปของตัวเลขโดยตรง


     3. จำแนกตามการจัดการข้อมูล แบ่งได้เป็น 2 ประเภท คือ

               3.1 ข้อมูลดิบ (Raw Data) เป็นข้อมูลที่ได้จาการเก็บ ยังไม่ได้จัดรวบรวมเป็นหมู่เป็นกลุ่มหรือจัดเป็นพวก

               3.2 ข้อมูลที่จัดเป็นกลุ่ม (Group Data) เป็นข้อมูลที่เกิดจากการนำข้อมูลดิบมารวบรวมเป็นกลุ่มเป็นหมวดหมู่


     4. จำแนกตามแหล่งที่มาของข้อมูล แบ่งได้เป็น 2 ชนิด คือ

               4.1 ข้อมูลปฐมภูมิ (Primary Data) เป็นข้อมูลที่ได้มาจากการที่ผู้ใช้เป็นผู้เก็บข้อมูลโดยตรง ซึ่งอาจจะเก็บด้วยการสัมภาษณ์หรือสังเกตการณ์ เป็นข้อมูลที่มีความน่าเชื่อถือมากที่สุด เนื่องจากยังไม่มีการเปลี่ยนรูป และมีรายละเอียดตามที่ผู้ใช้ต้องการ แต่จะต้องเสียเวลาและค่าใช้จ่ายมาก เช่น ข้อมูลที่ได้จากการนับจำนวนรถที่เข้า - ออก มหาวิทยาลัยในช่วงเวลา 08.00 - 09.00 น . ข้อมูลจากการสัมภาษณ์นักศึกษา

               4.2 ข้อมูลทุติภูมิ (Secondary Data) เป็นข้อมูลที่ได้มาจากแหล่งข้อมูลที่มีผู้เก็บรวบรวมไว้แล้ว เป็นข้อมูลในอดีต และมักจะเป็นข้อมูลที่ได้ผ่านการวิเคราะห์เบื้องต้นมาแล้ว ผู้ใช้นำมาใช้ได้เลย จึงประหยัดทั้งเวลาและค่าใช้จ่าย บางครั้งข้อมูลทุติยภูมิจะไม่ตรงกับความต้องการหรือมีรายละเอียดไม่เพียงพอ นอกจากนั้นผู้ใช้จะไม่ทราบถึงข้อผิดพลาดของข้อมูล ซึ่งอาจจะทำให้ผู้ที่นำมาใช้ สรุปผลการวิจัยผิดพลาดไปด้วย เช่น สถิติการเกิดอุบัติเหตุโดยรถจักรยานยนต์ของนักศึกษาในปี 2540 - 2541 เป็นข้อมูลที่บางครั้งอาจถูกแปรรูปไปแล้ว แต่เนื่องจากบางครั้งเราไม่สามารถที่จะจัดเก็บข้อมูลปฐมภูมิได้เราจึงต้องศึกษาจากข้อมูลที่มีการเก็บรวบรวมไว้แล้ว

      5. แบ่งตามมาตรของการวัด จะแบ่งได้ 4 ชนิด

               5.1 มาตรวัดนามบัญญัติ (Nominal Scale) เป็นการวัดค่าที่ง่ายที่สุดหรือสะดวกต่อการใช้มากที่สุด เพราะเป็นการแบ่งกลุ่มของข้อมูล เพื่อสะดวกต่อการวิเคราะห์ โดยการแบ่งกลุ่มจะถือว่าแต่ละกลุ่มจะมีความเสมอภาคกันหรือเท่าเทียมกัน ค่าที่กำหนดให้แต่ละกลุ่มจะไม่มีความหมาย และไม่สามารถมาคำนวณได้ เช่น เพศ มี 2 ค่า คือ ชายและหญิง การจำแนกเพศอาจจะกำหนดค่าได้ 2 ค่า คือ ถ้า 0 หมายถึงเพศชาย ถ้า 1 หมายถึงเพศหญิง เป็นต้น

               5.2 มาตรวัดอันดับ (Ordinal Scale) เป็นการวัดที่แสดงว่าข้อมูลที่อยู่ในแต่ละกลุ่มจะมีความแตกต่างกัน โดยพิจารณาจากลำดับด้วย นั่นคือสามารถบอกได้ว่า กลุ่มใดดีกว่ากลุ่มอื่นๆ หรือ กลุ่มใดที่มากกว่าหรือน้อยกว่ากลุ่มอื่นๆ แต่ไม่สามารถบอกปริมาณความมากกว่าหรือน้อยกว่าเป็นเท่าใด และค่าที่กำหนดให้แต่ละกลุ่มไม่สามารถนำมาคำนวณได้ เช่น คำถามที่ว่า “ ท่านอยากทำอะไรเมื่อมีวันหยุดพิเศษ ” โดยให้เรียงลำดับตามที่ต้องการจะทำมากที่สุด 5 อันดับ

          - ไปเที่ยวห้างสรรพสินค้า        ลำดับที่  4                -  ดูทีวีที่บ้าน            ลำดับที่   1

          - ไปพักผ่อนที่ต่างจังหวัด               "     2               -  ไปเล่นกีฬา                  "       5

          - ไปดูภาพยนตร์                             "    3

จากข้างต้นจะพบว่า ท่านนี้ชอบดูทีวีที่บ้านมากกว่าไปพักผ่อนต่างจังหวัด แต่ไม่ทราบว่า ชอบมากกว่าเท่าใด

            5.3 มาตรวัดแบบช่วง (Interval Scale) เป็นการวัดที่แบ่งสิ่งที่ศึกษาออกเป็นระดับหรือเป็นช่วงๆ โดยแต่ละช่วงมีขนาดหรือระยะห่างเท่ากัน ทำให้สามารถบอกระยะห่างของช่วงได้ อีกทั้งบอกได้ว่ามากหรือน้อยกว่ากัน เท่าไร จึงทำให้มีความแตกต่างกันในเชิงปริมาณ เช่น อุณหภูมิ คะแนนสอบ ซึ่งตัวเลขเหล่านี้ บวก ลบ ได้ แต่ คูณ หาร ไม่ได้ แต่ศูนย์ของข้อมูลชนิดนี้เป็น ศูนย์สมมติ ไม่ใช่ศูนย์แท้ เช่น อุณหภูมิ 0 องศาเซลเซียส ไม่ได้หมายความว่า ณ จุดนั้นไม่มีความร้อนอยู่เลย หรือการที่นักศึกษาได้คะแนน 0 ก็ไม่ได้หมายความว่า นักศึกษาไม่มีความรู้เลย แต่เป็นเพียงตัวเลขที่บอกว่า นักศึกษาทำข้อสอบนั้นไม่ได้

                5.4  มาตรวัดอัตราส่วน (Ratio Scale) เป็นการวัดที่ละเอียดและสมบูรณ์ที่สุด ที่สามารถบอกความแตกต่างในเชิงปริมาณ โดยแบ่งสิ่งที่ศึกษาออกเป็นช่วงๆ เหมือนมาตรวัดอันตรภาค ที่แต่ละช่วงมีระยะห่างเท่ากัน และ ศูนย์ของข้อมูลชนิดนี้เป็นศูนย์แท้ ซึ่งหมายถึงไม่มีอะไรเลยหรือมีจุดที่เริ่มต้นที่แท้จริง และสามารถนำตัวเลขนี้มา บวก ลบ คูณ หารได้ เช่น ความยาว เวลา

     6. แบ่งตามเวลาของการเก็บรวบรวมข้อมูล จะแบ่งได้ 2 ชนิด

            6.1 ข้อมูลอนุกรมเวลา ( Time-series Data) เป็นข้อมูลที่ถูกเก็บรวบรวมตามลำดับเวลาที่เกิดขึ้นต่อเนื่องไปเรื่อยๆ เช่น จำนวนประชากรของประเทศไทยในแต่แต่ละปี จำนวนผู้ป่วยที่เข้ารับการรักษาพยาบาลในโรงพยาบาลต่างๆ ในแต่ละปี เป็นต้น ข้อมูลอนุกรมเวลาเป็นประโยชน์ในการวิจัยระยะเวลายาว ทำให้ผู้วิจัยมองเห็นแนวโน้มของเรื่องต่างๆนั้นได้

              6.2 ข้อมูลภาคตัดขวาง ( Cross-sectional Data ) เป็นข้อมูลที่เก็บรวบรวม ณ เวลาใดเวลาหนึ่งเท่านั้น เพื่อประโยชน์ในการศึกษาวิจัยอย่างไรก็ตามในการจัดประเภทของข้อมูลนี้ จะขึ้นอยู่กับวัตถุประสงค์ในการนำไปวิเคราะห์และใช้ประโยชน์ด้วย