การคำนวณการแจกแจงปกติโดยใช้ minitab

Anonim

วัตถุประสงค์: การใช้ minitab สำหรับการแจกแจงแบบปกติ การแจกแจงแบบปกติ

คำจำกัดความ: การแจกแจงแบบปกติเป็นการกระจายตัวตัวอย่างที่มีประโยชน์มันเกือบจะเหมาะกับการแจกแจงความถี่ที่เกิดขึ้นจริงในหลาย ๆ ปรากฏการณ์รวมถึงลักษณะของมนุษย์ (น้ำหนัก, ความสูง, IQ)

สถิติที่ใช้กับธุรกิจ

ผลลัพธ์ของกระบวนการทางกายภาพ (มิติและผลตอบแทน) และมาตรการอื่น ๆ ที่น่าสนใจสำหรับผู้ดูแลระบบทั้งในภาครัฐและเอกชน

การแจกแจงของตัวแปรสุ่มแบบต่อเนื่อง

มันถูกนำเสนอในกรณีที่ตัวแปรสามารถรับค่าใด ๆ ที่อยู่ในช่วงเวลาที่กำหนดของค่าและการแจกแจงความน่าจะเป็นนั้นต่อเนื่อง

มีเหตุผลพื้นฐานสองประการที่ทำให้การแจกแจงแบบปกติตรงกับสถานที่สำคัญในสถิติ:

1.- มีคุณสมบัติบางอย่างที่ทำให้สามารถใช้กับสถานการณ์จำนวนมากที่จำเป็นต้องทำการอนุมานโดยการเก็บตัวอย่าง

2.- การแจกแจงแบบปกติเกือบจะปรับการกระจายความถี่จริงที่สังเกตได้ในปรากฏการณ์หลายอย่างรวมถึงลักษณะของมนุษย์ (น้ำหนักความสูง) ผลของกระบวนการทางกายภาพ (มิติและประสิทธิภาพ) และมาตรการอื่น ๆ ที่น่าสนใจสำหรับผู้ดูแลระบบ

ลักษณะของการกระจายปกติ

มองไปที่ช่วงเวลาที่รูปที่ 1.1 เราสามารถสังเกตลักษณะสำคัญหลายประการของการแจกแจงแบบปกติ:

  1. เส้นโค้งนั้นมีจุดสูงสุดเพียงจุดเดียว ดังนั้นมันคือ uni modal ตัวชี้วัดของประชากรที่กระจายตัวตามปกติ มันอยู่ในจุดกึ่งกลางของเส้นโค้งปกติเนื่องจากความสมมาตรของการแจกแจงความน่าจะเป็นปกติค่ามัธยฐานและโหมดก็จะอยู่ที่กึ่งกลางเช่นกัน ดังนั้นค่าเฉลี่ยมัธยฐานและโหมดจะมีค่าเท่ากันปลายทั้งสองของการแจกแจงความน่าจะเป็นแบบปกติจะขยายไปเรื่อย ๆ และไม่แตะแกนแนวนอน

การแจกแจงแบบปกติ: ความสำคัญและลักษณะเฉพาะ

เป็นที่ทราบกันดีอยู่แล้วว่าการแจกแจงแบบปกติหรือระฆังแบบเกาส์เซียนความสำคัญของการแจกแจงแบบนี้คือพฤติกรรมของตัวแปรที่ปรากฎการณ์จำนวนมากสามารถอธิบายได้ด้วยวิธีการแจกแจง

แบบปกติ

ตัวแปรบางตัวของประเภทนี้คือตัวแปรที่แสดงถึง: เส้นผ่านศูนย์กลาง, ความหนา, ความเค้น, น้ำหนัก, ฯลฯ เช่นเดียวกับน้ำหนัก, ความสูง, ขนาดเส้นผ่าศูนย์กลางหัว ฯลฯ

ตัวอย่างทางทฤษฎี:

1. เรามีโปรแกรมการฝึกอบรมที่ออกแบบมาเพื่อพัฒนาคุณภาพของทักษะการกำกับดูแลของหัวหน้างานสายการผลิต เนื่องจากโปรแกรมเป็นแบบการดูแลตนเองหัวหน้างานจึงต้องใช้เวลาหลายชั่วโมงจึงจะเสร็จสมบูรณ์ จากการศึกษาของผู้เข้าร่วมดังกล่าวข้างต้นบ่งชี้ว่าเวลาเฉลี่ยที่ใช้ในการทำให้โปรแกรมเสร็จสมบูรณ์คือ 500 ชั่วโมงและตัวแปรสุ่มแบบกระจายปกตินี้มีค่าเบี่ยงเบนมาตรฐานเท่ากับ 100 ชั่วโมง

ความน่าจะเป็นที่ผู้เข้าร่วมที่ถูกเลือกแบบสุ่มนั้นต้องใช้เวลานานกว่า 500 ชั่วโมงเพื่อให้โปรแกรมสมบูรณ์หรือไม่

วิธีแก้ไข: ในรูปต่อไปนี้เราจะเห็นว่าครึ่งหนึ่งของพื้นที่ใต้เส้นโค้งตั้งอยู่ทั้งสองด้านของค่าเฉลี่ย 500 ชั่วโมง ดังนั้นเราสามารถอนุมานได้ว่าความน่าจะเป็นที่ตัวแปรสุ่มใช้ค่ามากกว่า 500 คือพื้นที่แรเงานั่นคือ 0.5

μ = 500 ชั่วโมง

σ = 100 ชั่วโมง

หมายเหตุ: การกระจายเวลาที่จำเป็นในการฝึกอบรมให้เสร็จสมบูรณ์โดยมีช่วงเวลามากกว่า 500 ชั่วโมงแสดงบนหน้าจอสีเทา

2. ความน่าจะเป็นที่ผู้สมัครที่ได้รับการสุ่มเลือกจะใช้เวลาระหว่าง 500 ถึง 650 ชั่วโมงในการฝึกอบรมให้เสร็จสมบูรณ์คืออะไร

วิธีแก้ปัญหา: เราได้แสดงสถานการณ์นี้อย่างชัดเจนในรูปต่อไปนี้ ความน่าจะเป็นที่จะตอบคำถามนี้แสดงโดยพื้นที่หน้าจอสีเทาระหว่างค่าเฉลี่ย (500 ชั่วโมง) และค่า x ซึ่งเราสนใจ (650 ชั่วโมง) ใช้สมการต่อไปนี้:

Z =

หากเรามองหา z = 1.5 ในตารางการแจกแจงแบบปกติมาตรฐานเราจะพบความน่าจะเป็นที่ 0.4332 ดังนั้นความน่าจะเป็นที่ผู้สมัครที่เลือกแบบสุ่มต้องอยู่ระหว่าง 500 ถึง 650 ชั่วโมงเพื่อให้โปรแกรมการฝึกอบรมมีค่ามากกว่า 0.4 เล็กน้อย

μ = 500 ชั่วโมง

σ = 100 ชั่วโมง

การกระจายเวลาที่ต้องใช้ในการฝึกอบรมให้เสร็จสมบูรณ์โดยมีช่วงเวลา 500 ถึง 650 ชั่วโมงปรากฏขึ้นบนหน้าจอสีเทา

หมายเหตุ: โปรแกรม minitab จะบอกให้เราทราบว่าการแจกแจงเป็นปกติหรือไม่ z ไม่คำนวณในโปรแกรมนี้

การออกกำลังกายใน minitab ตามแบบฝึกหัด # 1

คำแนะนำ:

ในการดำเนินการแจกแจงแบบปกติในโปรแกรม minitab ต้องทำตามขั้นตอนต่อไปนี้:

เปิด minitab (โปรแกรมนี้สามารถรับได้ฟรีทางอินเทอร์เน็ต)

หากคุณมีข้อมูลวางไว้ในตารางโดยคอลัมน์และ / หรือแถว (ดูรูปที่ 1)

2. หากคุณไม่มีข้อมูลสุ่มในแบบฝึกหัดที่เกี่ยวข้องให้สร้างดังต่อไปนี้

ใช้คำนวณ> ข้อมูลสุ่ม> ปกติ…

ใส่จำนวนบรรทัดในช่องที่ระบุด้านล่าง:

ใส่คอลัมน์ที่คุณต้องการใช้งานในกล่องที่เกี่ยวข้อง (ระบุไว้ด้านล่าง)

กรอกข้อมูลในกล่องของค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานที่ระบุด้านล่างด้วยข้อมูลการออกกำลังกายของคุณเพื่อดำเนินการและคลิกตกลง

การคลิกตกลงจะเป็นการแสดงข้อมูลแบบสุ่มที่จะใช้งาน

เมื่อได้รับข้อมูลแล้ว

เลือกสถิติ> สถิติพื้นฐาน> แสดงสถิติเชิงพรรณนา> ป้อน

ในกล่องที่ปรากฏขึ้นให้คลิกสองครั้งที่คอลัมน์เพื่อทำงาน (ตัวอย่าง c1) หรือพิมพ์ด้วยตัวคุณเองในกล่องตัวแปร

จากนั้นคลิกที่ Gr

เลือกฮิสโตแกรมของข้อมูลซึ่งมีส่วนโค้งปกติ> ตกลง> ตกลง

จากนั้นกล่องจะปรากฏขึ้นเพื่อแสดงเส้นโค้งการแจกแจงปกติที่สอดคล้องกับข้อมูลการออกกำลังกายของคุณ

กราฟทั่วไป

กราฟปกติใช้เพื่อตรวจสอบว่าข้อมูลไม่เบี่ยงเบนอย่างมีนัยสำคัญจากการแจกแจงแบบปกติหากคะแนนมาจากการแจกแจงแบบปกติจุดควรประมาณหรือติดตามการอ้างอิงของเส้นตรง หากข้อมูลไม่ได้มาจากการแจกแจงแบบปกติคะแนนจะไม่เป็นไปตามเส้น

ค่าความน่าจะเป็น (P-value) จะต้องมากกว่า 0.05 เพื่อให้มั่นใจว่า 95% มั่นใจว่าการแจกแจงเป็นเรื่องปกติ

เลือกสถิติ> สถิติพื้นฐาน> การทดสอบตามปกติ> ป้อน

ชี้คอลัมน์เพื่อทำงานในกล่องตัวแปร (ตัวอย่าง C1, C2…)> ตกลง

จากนั้นกราฟภาวะปกติจะปรากฏขึ้นซึ่งโดยการสังเกตเส้นประและ / หรือ ค่า P ด้วยวิธีนี้คุณสามารถมั่นใจได้ว่าการแจกแจงที่เชื่อถือได้เป็นเรื่องปกติ (ดูทฤษฎีและคำนิยามของกราฟภาวะปกติหน้า 13)

จากแบบฝึกหัดนี้จะเห็นได้อย่างชัดเจนว่าค่า p มากกว่า 0.05 ดังนั้นจึงมั่นใจได้ด้วยความน่าเชื่อถือ 95% ว่าการแจกแจงเป็นเรื่องปกติ

สรุปผลการวิจัย

โปรแกรม minitab เพื่อคำนวณการแจกแจงปกติมาตรฐานกำหนดด้วยข้อมูลที่มีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานที่กำหนดโดยการฝึก การคำนวณ z ใน minitab เป็นไปไม่ได้

ดาวน์โหลดไฟล์ต้นฉบับ

การคำนวณการแจกแจงปกติโดยใช้ minitab