ทฤษฎีเกม

สารบัญ:

Anonim

ทฤษฎีเกมได้รับการพัฒนาด้วยข้อเท็จจริงง่ายๆที่ว่าบุคคลนั้นเกี่ยวข้องกับคนอื่นหรือคนอื่น ๆ ทุกวันนี้มันเป็นเรื่องง่ายที่จะเผชิญหน้ากับทฤษฎีนี้ในชีวิตประจำวันเมื่อใดก็ได้ตัวอย่างเช่นเมื่อเราลงทะเบียนเรียนในภาคการศึกษาใหม่ที่มหาวิทยาลัยเมื่อคณะกรรมการตัดสินใจเกี่ยวกับจำนวนเงินที่จะเรียกเก็บคณะกรรมการกำลังทำการ ฉันเล่นกับลูกค้าของคุณในกรณีนี้คือนักเรียน สำหรับผู้ชายความสำคัญของทฤษฎีเกมนั้นชัดเจนเนื่องจากเขาต้องเผชิญกับสถานการณ์ต่างๆที่เป็นเกมเป็นประจำทุกวัน

ทฤษฎีเกมในปัจจุบันเกี่ยวข้องกับสิ่งที่เกิดขึ้นเป็นหลักเมื่อผู้ชายเกี่ยวข้องกันในลักษณะที่เป็นเหตุเป็นผลกล่าวคือเมื่อบุคคลมีปฏิสัมพันธ์โดยใช้เหตุผล

ทฤษฎีเกม

บทนำสู่ทฤษฎีของเกม

นักจิตวิทยาให้ความสำคัญกับความสำคัญของการเล่นในวัยเด็กว่าเป็นวิธีการสร้างบุคลิกภาพและการเรียนรู้ทดลองเพื่อสร้างความสัมพันธ์ในสังคมเพื่อแก้ปัญหาและสถานการณ์ความขัดแย้ง เกมทั้งหมดสำหรับเด็กและผู้ใหญ่เกมกระดานหรือเกมกีฬาเป็นแบบจำลองของสถานการณ์ที่ขัดแย้งและร่วมมือกันซึ่งเราสามารถรับรู้สถานการณ์และรูปแบบที่เกิดขึ้นซ้ำ ๆ บ่อยครั้งในโลกแห่งความเป็นจริง

การศึกษาเกมได้สร้างแรงบันดาลใจให้นักวิทยาศาสตร์พัฒนาทฤษฎีและแบบจำลองทางคณิตศาสตร์มาโดยตลอด สถิติเป็นสาขาหนึ่งของคณิตศาสตร์ที่เกิดขึ้นอย่างแม่นยำตั้งแต่การคำนวณไปจนถึงการออกแบบกลยุทธ์การชนะในเกมแห่งโอกาส แนวคิดเช่นความน่าจะเป็นค่าเฉลี่ยถ่วงน้ำหนักและการแจกแจงหรือส่วนเบี่ยงเบนมาตรฐานเป็นคำที่บัญญัติขึ้นโดยสถิติทางคณิตศาสตร์และมีการประยุกต์ใช้ในการวิเคราะห์เกมแห่งโอกาสหรือในสถานการณ์ทางสังคมและเศรษฐกิจที่เกิดขึ้นบ่อยครั้งซึ่งต้องมีการตัดสินใจและรับความเสี่ยง ส่วนประกอบแบบสุ่ม

แต่ทฤษฎีเกมมีความสัมพันธ์ที่ห่างไกลกับสถิติมาก วัตถุประสงค์ไม่ใช่การวิเคราะห์โอกาสหรือองค์ประกอบแบบสุ่ม แต่เป็นพฤติกรรมเชิงกลยุทธ์ของผู้เล่น ในโลกแห่งความเป็นจริงสถานการณ์ทั้งในด้านเศรษฐกิจและการเมืองหรือสังคมมักเกิดขึ้นบ่อยมากซึ่งเช่นเดียวกับในเกมผลลัพธ์ของมันขึ้นอยู่กับการตัดสินใจร่วมกันของตัวแทนหรือผู้เล่นที่แตกต่างกัน มีการกล่าวถึงพฤติกรรมที่เป็นกลยุทธ์เมื่อนำมาใช้โดยคำนึงถึงอิทธิพลร่วมที่มีต่อผลการตัดสินใจของตนเองและของผู้อื่น

เทคนิคในการวิเคราะห์สถานการณ์เหล่านี้ได้รับการพัฒนาโดยนักคณิตศาสตร์ John von Neumann ในช่วงต้นทศวรรษที่ 1940 เขาทำงานร่วมกับนักเศรษฐศาสตร์ Oskar Morgenstern เกี่ยวกับการประยุกต์ใช้ทฤษฎีนี้ทางเศรษฐศาสตร์ หนังสือที่ตีพิมพ์ในปี 2487 "Theory of Games and Economic Behavior" ได้เปิดสาขาการศึกษาที่กว้างอย่างคาดไม่ถึงซึ่งปัจจุบันมีผู้เชี่ยวชาญหลายพันคนจากทั่วโลกทำงานอยู่

ทฤษฎีเกมมีความซับซ้อนทางคณิตศาสตร์ในระดับสูงและแสดงให้เห็นถึงความเก่งกาจในการแก้ปัญหา เศรษฐศาสตร์หลายสาขา (ดุลยภาพทั่วไปการกระจายต้นทุน ฯลฯ) ได้รับประโยชน์จากการมีส่วนร่วมของวิธีการวิเคราะห์นี้ ในช่วงครึ่งศตวรรษนับตั้งแต่มีการคิดค้นสูตรครั้งแรกจำนวนนักวิทยาศาสตร์ที่ทุ่มเทให้กับการพัฒนาของมันไม่ได้หยุดที่จะเติบโต และพวกเขาไม่เพียง แต่เป็นนักเศรษฐศาสตร์และนักคณิตศาสตร์เท่านั้น แต่ยังรวมถึงนักสังคมวิทยานักรัฐศาสตร์นักชีววิทยาหรือนักจิตวิทยาด้วย นอกจากนี้ยังมีการใช้งานทางกฎหมายเช่นการมอบหมายความรับผิดชอบการนำการดำเนินคดีหรือการตัดสินใจประนีประนอมเป็นต้น

มีเกมสองประเภทที่ก่อให้เกิดปัญหาที่แตกต่างกันมากและต้องการรูปแบบการวิเคราะห์ที่แตกต่างกัน:

  1. หากผู้เล่นสามารถสื่อสารกันและต่อรองผลลัพธ์ได้เกมนั้นจะมีการโอนยูทิลิตี้ (เรียกอีกอย่างว่าเกมร่วมมือ) ซึ่งปัญหาจะอยู่ที่การวิเคราะห์พันธมิตรที่เป็นไปได้และความมั่นคงของพวกเขา ยูทิลิตี้ (เรียกอีกอย่างว่าเกมที่ไม่ร่วมมือกัน) ผู้เล่นไม่สามารถบรรลุข้อตกลงก่อนหน้านี้ได้ นี่คือกรณีของเกมที่เรียกว่า "สงครามของคนต่างเพศ" "สถานการณ์ที่กลืนไม่เข้าคายไม่ออก" หรือแบบจำลอง "เหยี่ยว - นกเขา"

โมเดลเกมที่ไม่มีการโอนยูทิลิตี้มักจะเป็นแบบสองคนนั่นคือมีผู้เล่นเพียงสองคน สามารถสมมาตรหรือไม่สมมาตรขึ้นอยู่กับว่าผลลัพธ์จะเหมือนกันจากมุมมองของผู้เล่นแต่ละคน พวกเขาสามารถเป็นผลรวมเป็นศูนย์ได้เมื่อการเพิ่มขึ้นของการชนะของผู้เล่นคนหนึ่งหมายถึงการลดลงเท่า ๆ กันของอีกฝ่ายหนึ่งหรือผลรวมที่ไม่ใช่ศูนย์นั่นคือเมื่อผลรวมของการชนะของผู้เล่นสามารถเพิ่มขึ้นหรือ ลดลงตามการตัดสินใจของคุณ ผู้เล่นแต่ละคนสามารถมีตัวเลือกเพียงสองกลยุทธ์ในเกมสองกลยุทธ์หรือหลาย ๆ กลยุทธ์สามารถบริสุทธิ์หรือผสม; สิ่งเหล่านี้ประกอบด้วยการกำหนดความน่าจะเป็นที่กำหนดให้กับแต่ละกลยุทธ์ที่แท้จริง ในกรณีของเกมที่เล่นซ้ำเกมที่เล่นหลาย ๆ ครั้งติดต่อกันโดยผู้เล่นคนเดียวกันกลยุทธ์ยังสามารถเรียบง่ายหรือตอบสนองได้หากการตัดสินใจขึ้นอยู่กับพฤติกรรมที่ฝ่ายตรงข้ามแสดงในละครก่อนหน้านี้

ORIGIN

ทฤษฎีเกมสร้างขึ้นโดย Von Neumann และ Morgenstern ในหนังสือคลาสสิก "The Theory of Games Behavior" ที่ตีพิมพ์ในปี 2487 คนอื่น ๆ คาดว่าจะมีแนวคิดบางอย่าง นักเศรษฐศาสตร์ Cournot และ Edgeworth เป็นนักสร้างสรรค์นวัตกรรมโดยเฉพาะในศตวรรษที่ 19 ผลงานอื่น ๆ ที่กล่าวถึงในภายหลังจัดทำโดยนักคณิตศาสตร์ Borel และ Zermelo ฟอนนอยมันน์เองได้วางรากฐานไว้แล้วในบทความที่ตีพิมพ์ในปี 2471 อย่างไรก็ตามหนังสือของฟอนนอยมันน์และมอร์เกนสเติร์นปรากฏว่าโลกเข้าใจว่าเครื่องมือที่ค้นพบเพื่อศึกษาความสัมพันธ์ของมนุษย์นั้นทรงพลังเพียงใด

ในช่วงสองทศวรรษหลังสงครามโลกครั้งที่สองพัฒนาการที่น่าสนใจที่สุดอย่างหนึ่งในทฤษฎีเศรษฐศาสตร์คือทฤษฎีเกมและพฤติกรรมทางเศรษฐกิจซึ่งตีพิมพ์ในหนังสือชื่อนี้ภายใต้อำนาจร่วมของ Jhon Von Neumann และ Oskar Morgenstern ปัจจุบันฉันทามติดูเหมือนว่าทฤษฎีเกมมีความเกี่ยวข้องกับการศึกษาปัญหาทางธุรกิจที่เฉพาะเจาะจงมากกว่าทฤษฎีเศรษฐศาสตร์ทั่วไปเนื่องจากเป็นแนวทางเฉพาะในการวิเคราะห์การตัดสินใจทางธุรกิจภายใต้เงื่อนไขของผลประโยชน์ที่แข่งขันกันและขัดแย้งกัน

ในช่วงไม่กี่ปีที่ผ่านมาผลกระทบของทฤษฎีเศรษฐศาสตร์สามารถอธิบายได้ว่าเป็นสิ่งที่น่าสนใจเท่านั้น อย่างไรก็ตามยังจำเป็นที่จะต้องรู้ประวัติสั้น ๆ ของเกมหากเพียงเพื่อให้เข้าใจว่าเหตุใดจึงใช้คำศัพท์บางคำ

ฟอนนอยมันน์และมอร์เกนสเติร์นได้ตรวจสอบสองแนวทางที่แตกต่างกันของทฤษฎีเกม ประการแรกคือแนวทางเชิงกลยุทธ์หรือไม่ร่วมมือกัน แนวทางนี้ต้องการการระบุรายละเอียดสิ่งที่ผู้เล่นทำได้และไม่สามารถทำได้ในระหว่างเกมจากนั้นผู้เล่นแต่ละคนจะหากลยุทธ์ที่เหมาะสมที่สุด สิ่งที่ดีที่สุดสำหรับผู้เล่นคนหนึ่งขึ้นอยู่กับสิ่งที่ผู้เล่นคนอื่นวางแผนที่จะทำและสิ่งนี้ก็ขึ้นอยู่กับสิ่งที่พวกเขาคิดว่าผู้เล่นคนแรกจะทำ ฟอนนอยมันน์และมอร์เกนสเติร์นแก้ไขปัญหานี้ในกรณีเฉพาะของเกมที่มีผู้เล่นสองคนที่มีผลประโยชน์ไม่เห็นด้วยกัน เกมเหล่านี้เรียกว่าการแข่งขันอย่างเคร่งครัดหรือเป็นศูนย์เนื่องจากการชนะของผู้เล่นคนใดคนหนึ่งจะสมดุลเสมอกันโดยการสูญเสียที่สอดคล้องกันสำหรับผู้เล่นคนอื่น หมากรุกแบ็คกามอนและโป๊กเกอร์เป็นเกมที่ถือว่าเป็นเกมที่ไม่มีผลรวม

ส่วนที่สองของหนังสือของ Von Neumann และ Morgenstern พัฒนาแนวร่วมหรือแนวทางความร่วมมือซึ่งพวกเขาพยายามอธิบายพฤติกรรมที่เหมาะสมที่สุดในเกมที่มีผู้เล่นหลายคน เนื่องจากปัญหานี้เป็นปัญหาที่ยากกว่ามากจึงไม่น่าแปลกใจที่ผลลัพธ์ของเขามีความแม่นยำน้อยกว่าที่ได้รับจากกรณีที่มีผู้เล่นสองคนเป็นศูนย์ โดยเฉพาะอย่างยิ่ง Von Neumann และ Morgenstern ละทิ้งความพยายามใด ๆ ที่จะระบุกลยุทธ์ที่เหมาะสมสำหรับผู้เล่นแต่ละคน แต่พวกเขามุ่งมั่นที่จะจำแนกรูปแบบการสร้างแนวร่วมที่สอดคล้องกับพฤติกรรมที่มีเหตุผล การเจรจาต่อรองจึงไม่มีบทบาทในทฤษฎีนี้ ในความเป็นจริงพวกเขารับรองมุมมองดังกล่าวซึ่งครอบงำนักเศรษฐศาสตร์อย่างน้อยตั้งแต่สมัยเอดจ์เวิร์ ธตามที่ปัญหาการเจรจาระหว่างคนสองคนเป็นสิ่งที่ไม่แน่นอนโดยเนื้อแท้

ในช่วงต้นทศวรรษ 1950 ในชุดของเอกสารที่มีชื่อเสียงมากนักคณิตศาสตร์จอห์นแนชได้ทำลายอุปสรรคสองประการที่ฟอนนอยมันน์และมอร์เกนสเติร์นตั้งไว้สำหรับตัวเอง ในด้านที่ไม่ร่วมมือกันพวกเขาดูเหมือนจะคิดว่าในกลยุทธ์ความคิดเรื่องดุลยภาพที่ Cournot นำมาใช้ในปีพ. ศ. 2375 นั้นไม่ได้มีแนวคิดเพียงพอที่จะสร้างทฤษฎีขึ้นมา (ดังนั้นพวกเขาจึงถูก จำกัด ให้อยู่ในเกมที่มีผลรวมเป็นศูนย์). อย่างไรก็ตามการกำหนดแนวคิดสมดุลทั่วไปของแนชทำให้ชัดเจนว่าข้อ จำกัด ดังกล่าวไม่จำเป็น วันนี้แนวคิดเรื่องดุลยภาพของแนชซึ่งไม่มีอะไรอื่นนอกจากเมื่อการเลือกเชิงกลยุทธ์ของผู้เล่นแต่ละคนเป็นการตอบสนองที่ดีที่สุดต่อตัวเลือกเชิงกลยุทธ์ของผู้เล่นคนอื่น ๆ Horace และ Maurice ได้รับคำแนะนำจากที่ปรึกษาผู้เชี่ยวชาญใน Game Theoryเพื่อใช้ดุลยภาพของแนช บางทีอาจเป็นเครื่องมือที่สำคัญที่สุดที่ผู้เชี่ยวชาญด้านทฤษฎีเกมมีให้เลือกใช้ แนชยังให้การสนับสนุนแนวทางความร่วมมือของฟอนนอยมันน์และมอร์เกนสเติร์น

แนชไม่ยอมรับความคิดที่ว่าทฤษฎีเกมควรพิจารณาปัญหาการเจรจาที่ไม่แน่นอนระหว่างคนสองคนและดำเนินการต่อเพื่อเสนอข้อโต้แย้งเพื่อตัดสินพวกเขา ความคิดของเขาในหัวข้อนี้มักถูกเข้าใจผิดและอาจเป็นผลให้ใช้เวลาหลายปีที่ Game Theory ใช้ใน Babia เป็นหลักในการพัฒนาแนวทางความร่วมมือของ Von Neumann และ Morgenstern ในทิศทางที่พิสูจน์แล้วว่าไม่ก่อให้เกิดประสิทธิผลในที่สุด

จอห์นฟอนนอยมันน์ 2446-2500

จอห์นฟอนนอยมันน์เป็นนักคณิตศาสตร์ชาวฮังกาเรียนที่หลายคนคิดว่าเป็นผู้มีจิตใจที่ยิ่งใหญ่ที่สุดในศตวรรษที่ 20 เทียบได้กับอัลเบิร์ตไอน์สไตน์เท่านั้น แม้จะไม่รู้จัก "ชายข้างถนน" อย่างสมบูรณ์ แต่ความสำคัญในทางปฏิบัติของกิจกรรมทางวิทยาศาสตร์ของเขาก็สามารถมองเห็นได้เมื่อพิจารณาว่าเขามีส่วนร่วมอย่างแข็งขันในโครงการแมนฮัตตันกลุ่มนักวิทยาศาสตร์ที่สร้างระเบิดปรมาณูลูกแรกเข้าร่วมและกำกับการ การผลิตและการพัฒนาคอมพิวเตอร์เครื่องแรกหรือใครในฐานะนักวิทยาศาสตร์ที่ปรึกษาของคณะมนตรีความมั่นคงแห่งสหรัฐอเมริกาในปี 1950 มีบทบาทที่โดดเด่นมาก (แม้ว่าจะเป็นความลับและไม่ค่อยเป็นที่รู้จัก) ในการออกแบบกลยุทธ์ของ สงครามเย็น. Nicholas Kaldor กล่าวถึงเขาว่า "เขาเป็นสิ่งที่ใกล้เคียงที่สุดกับอัจฉริยะที่ฉันเคยพบอย่างไม่ต้องสงสัย

เขาเกิดในบูดาเปสต์ฮังการีเป็นลูกชายของนายธนาคารชาวยิวที่ร่ำรวย เขามีการศึกษาอย่างรอบคอบ เขาได้รับปริญญาเอกด้านคณิตศาสตร์จากมหาวิทยาลัยบูดาเปสต์และสาขาเคมีจากมหาวิทยาลัยซูริก ในปีพ. ศ. 2470 เขาเริ่มทำงานที่มหาวิทยาลัยเบอร์ลิน ในปีพ. ศ. 2475 เขาย้ายไปอยู่ที่สหรัฐอเมริกาซึ่งเขาทำงานที่สถาบันเพื่อการศึกษาขั้นสูงที่พรินซ์ตัน

ผลงานของเขาในด้านวิทยาศาสตร์เศรษฐศาสตร์มุ่งเน้นไปที่สองสาขา:

  • เขาเป็นผู้สร้างสาขาทฤษฎีเกม ในปีพ. ศ. 2471 เขาได้ตีพิมพ์บทความเรื่องนี้เป็นครั้งแรก ในปีพ. ศ. 2487 ร่วมกับ Oskar Morgenstern เขาตีพิมพ์ Theory of Games and Economic Behavior ทฤษฎีเกมเป็นสาขาที่นักเศรษฐศาสตร์หลายพันคนทำงานอยู่และมีการเผยแพร่หลายร้อยหน้าทุกวัน แต่นอกจากนี้สูตรทางคณิตศาสตร์ที่อธิบายไว้ในหนังสือเล่มนี้มีอิทธิพลต่อเศรษฐศาสตร์สาขาอื่น ๆ อีกมากมาย ตัวอย่างเช่น Kenneth Arrow และ Gerard Debreu ใช้ทฤษฎีอรรถประโยชน์สัจพจน์ในการแก้ปัญหา General Equilibrium ในปี 1937 พวกเขาได้ตีพิมพ์ A Model of General Economic Equilibrium "ซึ่ง E. Roy Weintraub กล่าวในปี 1983 ว่า" มากที่สุด บทความสำคัญเกี่ยวกับเศรษฐศาสตร์คณิตศาสตร์ที่เคยเขียนในนั้นเขาเกี่ยวข้องกับอัตราดอกเบี้ยกับการเติบโตทางเศรษฐกิจบนพื้นฐานของการพัฒนา "การเติบโตที่ดีที่สุด" ที่ดำเนินการโดย Maurice Allais, Tjalling C. Koopmans และคนอื่น ๆ

Oskar Morgenstern, 1902-1976

เกิดที่ Gorlitz, Silesia เขาเรียนที่มหาวิทยาลัยเวียนนาฮาร์วาร์ดและนิวยอร์ก เขาเป็นสมาชิกของโรงเรียนออสเตรียและเป็นนักคณิตศาสตร์ที่มีประสบการณ์เขามีส่วนร่วมใน "Vienna Colloquia" ที่มีชื่อเสียงซึ่งจัดโดย Karl Menger (ลูกชายของ Carl Menger) ซึ่งนำนักวิทยาศาสตร์จากสาขาต่างๆเข้ามาติดต่อซึ่งเป็นที่ทราบกันดีว่าความคิดใหม่ ๆ มากมายและแม้กระทั่ง สาขาวิทยาศาสตร์ใหม่

เขาอพยพไปยังสหรัฐอเมริกาในช่วงสงครามโลกครั้งที่สองโดยสอนที่พรินซ์ตัน ในปีพ. ศ. 2487 ร่วมกับ John von Neuman เขาได้ตีพิมพ์ "Theory of Games and Economic Behavior"

การประยุกต์ใช้งาน

ทฤษฎีเกมในปัจจุบันมีแอปพลิเคชั่นมากมายอย่างไรก็ตามเศรษฐศาสตร์เป็นลูกค้าหลักสำหรับแนวคิดที่ผลิตโดยผู้เชี่ยวชาญทฤษฎีเกม ในบรรดาสาขาวิชาที่มีการประยุกต์ใช้ทฤษฎีเกมเรามี:

ในระบบเศรษฐกิจ:

ไม่น่าแปลกใจเลยที่ Game Theory ได้พบการใช้งานโดยตรงในเศรษฐศาสตร์ วิทยาศาสตร์ที่น่าเศร้านี้ควรจะจัดการกับการกระจายทรัพยากรที่หายาก หากทรัพยากรหายากนั่นเป็นเพราะมีคนจำนวนมากที่ต้องการพวกเขามากกว่าที่เคยมีมา ภาพรวมนี้แสดงส่วนผสมที่จำเป็นทั้งหมดสำหรับเกม นอกจากนี้นักเศรษฐศาสตร์นีโอคลาสสิกตั้งสมมติฐานว่าผู้คนจะทำอย่างมีเหตุผลในเกมนี้ ดังนั้นเศรษฐศาสตร์นีโอคลาสสิกจึงเป็นเพียงสาขาหนึ่งของทฤษฎีเกม

อย่างไรก็ตามแม้ว่านักเศรษฐศาสตร์อาจถูกลวงตาผู้เชี่ยวชาญในทฤษฎีเกมมาโดยตลอด แต่ก็ไม่สามารถก้าวหน้าได้เนื่องจากไม่สามารถเข้าถึงเครื่องมือที่ Von Neumann และ Morgenstern จัดเตรียมไว้ให้

ดังนั้นจึงสามารถวิเคราะห์เฉพาะเกมง่ายๆโดยเฉพาะ สิ่งนี้อธิบายได้ว่าเหตุใดการผูกขาดและการแข่งขันที่สมบูรณ์แบบจึงเป็นที่เข้าใจกันดีในขณะที่การแข่งขันที่ไม่สมบูรณ์แบบอื่น ๆ ทั้งหมดที่มีอยู่ระหว่างสองขั้วนี้เพิ่งเริ่มได้รับการปฏิบัติอย่างละเอียดที่พวกเขาสมควรได้รับ

เหตุผลที่การผูกขาดนั้นง่ายมากจากมุมมองของ Game Theory ก็คือสามารถถือว่าเป็นเกมที่มีผู้เล่นคนเดียว เหตุผลที่การแข่งขันที่สมบูรณ์แบบนั้นง่ายมากก็คือจำนวนผู้เล่นนั้นไม่มีที่สิ้นสุดดังนั้นตัวแทนแต่ละคนจึงไม่สามารถมีผลต่อการรวมตลาดได้หากเขาหรือเธอทำทีละคน

ในรัฐศาสตร์:

ทฤษฎีเกมไม่ได้มีผลกระทบต่อรัฐศาสตร์เช่นเดียวกับเศรษฐศาสตร์ บางทีอาจเป็นเพราะผู้คนมีพฤติกรรมไม่ค่อยมีเหตุผลเมื่อมีความคิดเป็นเดิมพันมากกว่าเมื่อมีเงินเป็นเดิมพัน อย่างไรก็ตามมันกลายเป็นเครื่องมือสำคัญในการชี้แจงตรรกะพื้นฐานของปัญหาเชิงกระบวนทัศน์จำนวนมากขึ้น

สาขาชีววิทยา:

ในทางชีววิทยาทฤษฎีเกมถูกนำมาใช้อย่างกว้างขวางเพื่อทำความเข้าใจและทำนายผลลัพธ์บางอย่างของวิวัฒนาการเช่นแนวคิดของกลยุทธ์การวิวัฒนาการที่มั่นคงซึ่งแนะนำโดย John Maynard Smith ในเรียงความ "Game Theory and the Evolution of Fighting" ดังนั้น เช่นเดียวกับในหนังสือ«วิวัฒนาการและทฤษฎีเกม»

ในปรัชญา:

ผู้เชี่ยวชาญด้านทฤษฎีเกมเชื่อว่าพวกเขาสามารถแสดงให้เห็นอย่างเป็นทางการว่าทำไมแม้แต่บุคคลที่เห็นแก่ตัวที่สุดก็อาจพบว่าการร่วมมือกับเพื่อนบ้านในความสัมพันธ์ระยะยาวมักจะเป็นไปเพื่อประโยชน์ของตนเองอย่างรู้แจ้ง

ด้วยเหตุนี้พวกเขาจึงศึกษาความสมดุลของเกมที่มีการเล่นซ้ำ (เกมที่ผู้เล่นคนเดิมเล่นซ้ำแล้วซ้ำเล่า) มีการค้นพบบางสิ่งในพื้นที่นี้จนถึงปัจจุบันที่ทำให้ David Hume ประหลาดใจซึ่งเมื่อประมาณสองร้อยปีก่อนได้อธิบายกลไกที่สำคัญ อย่างไรก็ตามแนวคิดเหล่านี้มีพื้นฐานมาจากรูปแบบที่เป็นทางการอย่างมั่นคงแล้ว เพื่อที่จะพัฒนาต่อไปเราจะต้องรอความคืบหน้าเกี่ยวกับปัญหาการเลือกดุลยภาพในเกมที่มีภาวะสมดุลหลายอย่าง เมื่อความก้าวหน้าเหล่านี้เกิดขึ้นฉันสงสัยว่าปรัชญาสังคมที่ไม่มี Game Theory จะเป็นสิ่งที่ไม่อาจคาดเดาได้และ David Hume จะได้รับการยกย่องในระดับสากลว่าเป็นผู้ก่อตั้งที่แท้จริง

คุณสมบัติสำหรับความรู้ทั่วไปของเกม

นักปราชญ์ฮอบส์กล่าวว่าผู้ชายคนหนึ่งมีความแข็งแกร่งทางร่างกายความสนใจประสบการณ์และเหตุผลของเขา

ความแข็งแรงทางกายภาพ: สิ่งนี้กำหนดว่าใครทำได้หรือไม่สามารถทำได้ นักกีฬาสามารถวางแผนที่จะวิ่งหนึ่งไมล์ภายในสี่นาที แต่ส่วนใหญ่จะเป็นไปไม่ได้ที่จะดำเนินการตามแผนนี้ ทฤษฎีเกมรวมเอาข้อควรพิจารณาเหล่านี้ไว้ในกฎของเกม พวกเขากำหนดสิ่งที่เป็นไปได้สำหรับผู้เล่น แม่นยำยิ่งขึ้นผู้เล่นถูก จำกัด ให้เลือกจากกลยุทธ์ทั้งหมดของเขาในเกม

ความหลงใหลและประสบการณ์: สิ่งเหล่านี้สอดคล้องกับความชอบและความเชื่อของผู้เล่น ในกรณีส่วนใหญ่ทั้งสองอย่างจะต้องเป็นความรู้ทั่วไปสำหรับการวิเคราะห์ในแง่ของ Game Theory จึงจะเป็นไปได้

เหตุผล: ในปัญหาการตัดสินใจคนเดียวนักเศรษฐศาสตร์เพียงแค่สันนิษฐานว่าผู้เล่นจะได้รับผลตอบแทนที่คาดหวังสูงสุดตามความเชื่อของพวกเขา สิ่งต่าง ๆ ในเกมมีความซับซ้อนมากขึ้นเนื่องจากแนวคิดเรื่องความสมดุลถือว่าผู้เล่นรู้บางอย่างเกี่ยวกับวิธีคิดของทุกคน

ความรู้ทั่วไปเกี่ยวกับกฎ:

ในหลาย ๆ ผลลัพธ์ของ Game Theory ยังไม่ปรากฏในทันทีว่าข้อสรุปนี้ขึ้นอยู่กับค่าของ "n" จะต้องเป็นความรู้ทั่วไป อย่างไรก็ตามหากค่า "n" ไม่ใช่ความรู้ทั่วไปแสดงว่ามีดุลยภาพของแนช

แนวคิดเรื่องดุลยภาพเป็นพื้นฐานของทฤษฎีเกม แต่ทำไมเราถึงคาดหวังว่าผู้เล่นจะใช้กลยุทธ์การสร้างสมดุล

มีการตอบสนองสองประเภทประการแรกประเภทการศึกษาสิ่งเหล่านี้ถือว่าผู้เล่นมีความสมดุลอันเป็นผลมาจากการใช้เหตุผลอย่างรอบคอบ

อย่างไรก็ตามคำตอบด้านการศึกษาไม่ใช่คำตอบเดียวที่เป็นไปได้ มีการตอบสนองทางวิวัฒนาการด้วย ด้วยเหตุนี้ความสมดุลจึงเกิดขึ้นได้ไม่ใช่เพราะผู้เล่นคิดทุกอย่างล่วงหน้า แต่เป็นผลมาจากการที่ผู้เล่นสายตาสั้นปรับพฤติกรรมโดยการให้คะแนนเมื่อเล่นและทำซ้ำ ๆ เป็นเวลานาน

ในเกมที่มีผู้เล่นสองคนที่ จำกัด ไม่มีผู้เล่นคนใดรู้แน่ชัดว่ากลยุทธ์ที่แท้จริงคืออะไรแม้ว่าคู่ต่อสู้จะผสมผสานกันผลสุดท้ายก็คือการเล่นกลยุทธ์ที่บริสุทธิ์ซึ่งคู่ต่อสู้จะจบลงด้วยการใช้ ดังนั้นผู้เล่นที่มีเหตุผลจึงกำหนดความน่าจะเป็นส่วนตัวให้กับทางเลือกที่เป็นไปได้แต่ละทาง จากนั้นผู้เล่นจะเลือกกลยุทธ์ที่เพิ่มผลตอบแทนที่คาดว่าจะได้รับให้สูงสุดตามความน่าจะเป็นส่วนตัวเหล่านี้ ดังนั้นเขาหรือเธอจะทำตัวราวกับว่าเขากำลังเลือกการตอบสนองที่เหมาะสมที่สุดต่อหนึ่งในกลยุทธ์ผสมของฝ่ายตรงข้ามหากเลือกกลยุทธ์แบบผสมที่มีการตอบสนองที่เหมาะสมที่สุด

ทฤษฎีเกมถือได้ว่าความเชื่อของผู้เล่นเกี่ยวกับสิ่งที่ฝ่ายตรงข้ามจะทำขึ้นอยู่กับสิ่งที่ผู้เล่นรู้เกี่ยวกับฝ่ายตรงข้าม อย่างไรก็ตามยังห่างไกลจากความชัดเจนที่จะสรุปเกี่ยวกับสิ่งที่ผู้เล่นรู้เกี่ยวกับคู่ต่อสู้ของตน ความคิดเรื่องความสมเหตุสมผลสร้างขึ้นจากสมมติฐานที่ว่าอย่างน้อยควรเป็นความรู้ทั่วไปว่าผู้เล่นทั้งสองมีเหตุผล

วัตถุประสงค์ของทฤษฎีเกม

วัตถุประสงค์หลักของทฤษฎีเกมคือการกำหนดบทบาทของพฤติกรรมที่มีเหตุผลในสถานการณ์ "เกม" ซึ่งผลลัพธ์เป็นเงื่อนไขในการกระทำของผู้เล่นที่พึ่งพาซึ่งกันและกัน

เกมคือสถานการณ์ใด ๆ ที่ผู้เล่นสองคนขึ้นไปแข่งขันกัน หมากรุกและโป๊กเกอร์เป็นตัวอย่างที่ดี แต่ก็มีการผูกขาดและผู้ขายน้อยรายในธุรกิจเช่นกัน ขอบเขตที่ผู้เล่นบรรลุเป้าหมายในเกมขึ้นอยู่กับโอกาสทรัพยากรทางร่างกายและจิตใจของเขาและของคู่แข่งกฎของเกมและแนวทางการดำเนินการที่ผู้เล่นแต่ละคนปฏิบัติตามนั่นคือ กลยุทธ์ กลยุทธ์คือข้อกำหนดของการกระทำที่ผู้เล่นต้องกระทำในแต่ละสถานการณ์ที่อาจเกิดขึ้นได้ของเกม

ผู้เล่นทุกคนในเกมควรมีเหตุผลฉลาดและมีข้อมูลที่ดี โดยเฉพาะอย่างยิ่งสันนิษฐานว่าผู้เล่นแต่ละคนรู้ชุดกลยุทธ์ที่มีอยู่ทั้งหมดไม่เพียง แต่สำหรับตัวเองเท่านั้น แต่ยังรวมถึงคู่แข่งของเขาด้วยและผู้เล่นแต่ละคนรู้ผลลัพธ์ของการผสมผสานกลยุทธ์ที่เป็นไปได้ทั้งหมด

ในทำนองเดียวกันในเกมที่หลากหลายผลลัพธ์คือตัวแปรสุ่มซึ่งต้องสร้างการแจกแจงความน่าจะเป็นเพื่อให้การแก้ปัญหาของเกมเป็นไปได้ ในเรื่องนี้ควรสังเกตว่าการตัดสินใจของผู้เล่นที่พึ่งพาซึ่งกันและกันไม่ได้เกิดขึ้นในสุญญากาศและผลตอบแทนที่ได้จากการตัดสินใจเหล่านี้ขึ้นอยู่กับการกระทำของผู้เล่นทุกคน การพึ่งพาซึ่งกันและกันนี้บ่งบอกเป็นนัยว่าอาจไม่เหมาะสมที่จะถือว่าการชำระเงินเกิดขึ้นจากกระบวนการความน่าจะเป็นที่ไม่แน่นอนซึ่งไม่ได้รับผลกระทบจากแนวทางการดำเนินการที่เราเลือก กล่าวอีกนัยหนึ่งการกระทำของผู้เล่นสามารถกำหนดการกระทำของผู้เล่นคนอื่นหรือมีอิทธิพลต่อความเป็นไปได้ที่พวกเขาจะประพฤติในลักษณะเฉพาะศักยภาพในการเกิดผลที่เป็นไปได้นี้คือสิ่งที่แยกแยะการตัดสินใจในความขัดแย้งและการตัดสินใจในสภาพแวดล้อมที่ไม่แน่นอน รูปแบบเกมฝ่ายตรงข้ามอย่างเข้มงวดที่ง่ายที่สุดซึ่งผู้เล่นจะได้คะแนนตามลำดับที่ตรงกันข้ามกัน

ในคลาสนี้สิ่งที่พบบ่อยที่สุดคือเกมผลรวมคงที่ซึ่งผลรวมของการชนะของผู้เล่นจะเท่ากันไม่ว่าพวกเขาจะแจกแจงอะไรในหมู่พวกเขา กรณีพิเศษและเกมเดียวที่เราจะพิจารณาคือเกมผลรวมคงที่เรียกว่าเกมรวมศูนย์สองคน

กลยุทธ์การตอบสนอง

เมื่อมีการเล่นเกมซ้ำหลาย ๆ ครั้งผู้เล่นแต่ละคนสามารถใช้กลยุทธ์ของตนได้ตามการตัดสินใจของฝ่ายตรงข้าม กลยุทธ์การตอบสนองคือกลยุทธ์ที่นำมาใช้ในเกมที่มีการเล่นซ้ำและกำหนดขึ้นจากการตัดสินใจก่อนหน้าของผู้เล่นคนอื่น ๆ

ตัวอย่างที่รู้จักกันดีคือกลยุทธ์ OJO POR OJO (TIT FOR TAT) สมมติว่าผู้เล่นสองคนทำซ้ำไปเรื่อย ๆ สถานการณ์การจ่ายผลตอบแทนจากรูปแบบ Dilemma ของนักโทษ:

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

เมทริกซ์การชำระเงิน

เครื่องเล่นคอลัมน์

ร่วมมือกัน ทรยศ
ร่วมมือกัน 2, 2 4, 1
ทรยศ 1, 4 3, 3 *

ผู้เล่นแถว

ในสถานการณ์เช่นนี้กลยุทธ์ EYE FOR EYE สามารถกำหนดได้ดังนี้: «ในการเล่นครั้งแรกฉันจะเลือกกลยุทธ์ COOPERATE ในท่าต่อไปนี้ฉันจะเลือกกลยุทธ์เดียวกับที่ฝ่ายตรงข้ามเลือกในท่าก่อนหน้า» กล่าวอีกนัยหนึ่งถ้าอีกฝ่ายร่วมมือฉันจะร่วมมือกับเขา ถ้าอีกฝ่ายเป็นคนทรยศฉันจะเป็นคนทรยศ

อีกกลยุทธ์การตอบสนองที่เป็นไปได้คือ TORITO (เรียกอีกอย่างว่า "BULLY") กลยุทธ์นี้ประกอบด้วยการทำตรงข้ามกับคู่ต่อสู้:“ ถ้าผู้เล่นคนอื่นภักดีต่อหนึ่งครั้งฉันจะทรยศเขาในครั้งต่อไป หากผู้เล่นคนอื่นหักหลังฉันฉันจะภักดีต่อเขาในครั้งต่อไป

ในสภาพแวดล้อมที่กลืนไม่เข้าคายไม่ออกของนักโทษกลยุทธ์ EYE FOR EYE ให้ผลลัพธ์ที่ดีมากในขณะที่กลยุทธ์ TORITO ให้การจ่ายเงินเฉลี่ยที่ต่ำมาก

ในทางกลับกันในสภาพแวดล้อมของเกม Hawk-Dove สิ่งที่ตรงกันข้ามจะเกิดขึ้นอย่างแน่นอน: TORITO ได้ผลลัพธ์ที่ดีในขณะที่ OJO POR OJO ให้การจ่ายเงินเฉลี่ยที่ต่ำกว่า

เหยี่ยว - นกพิราบ

เมทริกซ์การชำระเงิน

เครื่องเล่นคอลัมน์

ร่วมมือกัน ทรยศ
ร่วมมือกัน 2, 2 3, 1 *
ทรยศ วันที่ 1, 3 * 4, 4

ผู้เล่นแถว

ในชีวิตจริงมันเป็นเรื่องง่ายที่จะค้นพบสถานการณ์และผู้คน (รวมถึงตัวเราเอง) ซึ่งแสดงพฤติกรรมได้ง่ายด้วยกลยุทธ์ EYE FOR EYE หรือ TORITO

ในกรณีแรกเป็นพฤติกรรมที่อธิบายไว้ในกฎแห่งทาลิออน ในสำนักงานทนายความนักเจรจามืออาชีพมีป้ายเขียนว่า "For the good I very good, for the bad I got even better" ท้ายที่สุดแล้วมนุษย์ทุกคนในครั้งเดียวหรืออีกครั้งได้ให้คำมั่นสัญญากับตัวเองว่าจะรักษากลยุทธ์นี้ไว้ในสถานการณ์ที่ยากลำบากซึ่งคู่ต่อสู้สามารถเลือกระหว่างทำร้ายเราหรือเคารพเราและเราคาดว่าจะมีโอกาส "ตีเขากลับ"

กรณีที่สองเป็นบ่อยมากเช่นกัน เป็นเรื่องเกี่ยวกับประเภทของผู้คนหรือพฤติกรรมที่ในละตินอเมริกาเรียกว่า "เป็นวัว" และในสเปน "เป็นไก่"; กล่าวคือเป็นคนที่ก้าวร้าวมาก แต่ "หลุดจากอก" หากเขาถูกตอบโต้อย่างก้าวร้าวเช่นกัน

DUOPOLY ในทฤษฎีเกม

ในการขายน้อยรายผลที่ได้รับจากแต่ละ บริษัท ไม่เพียงขึ้นอยู่กับการตัดสินใจของ บริษัท เท่านั้น แต่ยังขึ้นอยู่กับการตัดสินใจของคู่แข่งด้วย ดังนั้นปัญหาสำหรับผู้ประกอบการจึงเกี่ยวข้องกับทางเลือกเชิงกลยุทธ์ที่สามารถวิเคราะห์ได้ด้วยเทคนิคของ Game Theory

สมมติว่า บริษัท สองแห่งคือ Hipermercados Xauen และ Almacenes Yuste ก่อตั้งกิจการร่วมค้าในท้องถิ่นในภาคห้างสรรพสินค้า เมื่อถึงช่วงเดือนมกราคมแบบดั้งเดิมทั้งสอง บริษัท มักจะลงทุนในการโฆษณาสูงมากจนมักเกี่ยวข้องกับการสูญเสียกำไรทั้งหมด ในปีนี้พวกเขาได้ตกลงและตัดสินใจที่จะไม่โฆษณาเพื่อให้แต่ละรายการหากเป็นไปตามข้อตกลงจะได้รับผลกำไรในฤดูกาลที่ 50 ล้าน อย่างไรก็ตามหนึ่งในนั้นสามารถเตรียมแคมเปญโฆษณาอย่างลับๆและเปิดตัวในนาทีสุดท้ายซึ่งจะดึงดูดผู้บริโภคทั้งหมด ผลกำไรในกรณีนั้นคือ 75 ล้านในขณะที่ บริษัท คู่แข่งจะสูญเสีย 25 ล้าน

ผลลัพธ์ที่เป็นไปได้สามารถจัดเรียงในเมทริกซ์การชำระเงิน แต่ละร้านต้องเลือกระหว่างสองกลยุทธ์: เคารพข้อตกลง - ร่วมมือ - หรือโฆษณา -Betray- ผลกำไรหรือขาดทุนที่แสดงทางด้านซ้ายของแต่ละกล่องคือผลกำไรที่ Xauen ได้รับเมื่อเขาเลือกกลยุทธ์ที่แสดงทางด้านซ้ายและ Yuste ตามที่แสดงไว้ด้านบน ผลลัพธ์ทางด้านขวาในกล่องคือผลลัพธ์ของ Yuste

การแข่งขันผ่านการโฆษณา

และคุณ

ร่วมมือกับ Betray
ร่วมมือกัน 50, 50-25, 75

75, -25 0, 0

ทรยศ

Chefchaouene

ความจริงที่ว่าค่าสูงสุดที่สามารถรับได้คือ 75 M. หรือ 85 M. ไม่มีอิทธิพลมากนักต่อการตัดสินใจรับเลี้ยงบุตรบุญธรรมสิ่งเดียวที่สำคัญจริงๆคือวิธีการเรียงลำดับผลลัพธ์ หากเราแทนที่มูลค่าเฉพาะของผลประโยชน์สำหรับลำดับที่พวกเขาครอบครองตามความต้องการของผู้เล่นเมทริกซ์จะยังคงอยู่ดังที่แสดงในตาราง สถานการณ์เช่นที่อธิบายไว้ในเมทริกซ์นี้พบได้บ่อยในชีวิตจริงและเรียกว่า Dilemma ของนักโทษ

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

และคุณ

ร่วมมือกัน ทรยศ
ร่วมมือกับ Betray 2, 2 4, 1
1, 4 3, 3 *

Chefchaouene

เรามาดูกันดีกว่าว่าร้านค้าเหล่านั้นควรตัดสินใจอย่างไร ผู้อำนวยการฝ่ายกลยุทธ์ของ Xauen จะคิดว่า: «หาก Yuste ไม่โฆษณาสิ่งที่ดีที่สุดสำหรับเราคือการทรยศต่อข้อตกลง แต่ถ้าพวกเขาเป็นคนแรกที่ทรยศเราก็จะสะดวกเช่นกัน ไม่ว่าคู่แข่งของเราจะใช้กลยุทธ์ใดก็ตามการทรยศต่อพวกเขาถือเป็นประโยชน์สูงสุดของเรา ผู้อำนวยการฝ่ายกลยุทธ์ของ Yuste จะให้เหตุผลที่คล้ายกัน

ผลที่ตามมาทั้งสองจะหักหลังกันและจะได้รับผลลัพธ์ที่เลวร้ายยิ่งกว่าถ้าพวกเขารักษาข้อตกลงไว้ กล่องในเมทริกซ์การจ่ายเงินที่มีเครื่องหมายดอกจันเป็นทางออกเดียวที่เสถียรนั่นคือจุดสมดุลของแนช ตรงกันข้ามกับข้อโต้แย้งของอดัมสมิ ธ ในสถานการณ์ที่มีลักษณะกลืนไม่เข้าคายไม่ออกของนักโทษหากเจ้าหน้าที่ดำเนินการอย่างมีเหตุผลเพื่อแสวงหาผลประโยชน์ของตนเอง "มือที่มองไม่เห็น" จะนำพวกเขาไปสู่ผลลัพธ์ที่ไม่พึงปรารถนาทางสังคม

ตอนนี้สมมติว่าสถานการณ์แตกต่างกันเล็กน้อย หากทั้งสอง บริษัท เข้าไปพัวพันกับสงครามราคาเริ่มใหญ่ขึ้นเรื่อย ๆ ทั้งคู่จะต้องประสบกับความสูญเสียครั้งใหญ่ บริษัท ละ 25 ล้านคน พวกเขาบรรลุข้อตกลงที่จะไม่ทำสิ่งที่แต่ละคนสามารถหาเงินได้ 50 ล้าน หากคนใดคนหนึ่งละเมิดข้อตกลงลดลงเล็กน้อยด้วยตัวเองก็จะสามารถได้รับกำไร 75 ล้านในขณะที่อีกคนหนึ่งจะสูญเสียลูกค้าจำนวนมากและไม่สูญเสียผลกำไรหรือขาดทุน

การแข่งขันด้านราคา

และคุณ

ร่วมมือกับ Betray
ร่วมมือกับBetray 50, 50 0, 75
75, 0-25, -25

Chefchaouene

ถ้าเป็นในกรณีก่อนหน้านี้เราใช้แทนค่าคอนกรีตสำหรับการสั่งซื้อของพวกเขาในระดับความชอบที่เราได้รับเมทริกซ์ที่เป็นที่รู้จักในทฤษฎีเกมเป็นไก่หรือเหยี่ยวนกเขา

เหยี่ยว - นกพิราบ:

และคุณ

ร่วมมือกัน ทรยศ
ร่วมมือกับ Betray 2, 2 3, 1 *
วันที่ 1, 3 * 4, 4

Chefchaouene

เหตุผลของนักกลยุทธ์ในตอนนี้จะแตกต่างออกไป: «หากคู่แข่งของเราร่วมมือกันสิ่งที่เราสนใจมากที่สุดคือการทรยศต่อพวกเขา แต่ถ้าพวกเขาทรยศเราจะดีกว่าที่เราจะร่วมมือกันแทนที่จะเข้าไปเกี่ยวข้องกับสงครามราคา ไม่ว่าพวกเขาจะทำอะไรเราจะสนใจที่จะทำสิ่งที่ตรงกันข้าม

ในเกม "ไก่" ลำดับที่ผู้เล่นกระทำมีความสำคัญมาก คนแรกที่เข้ามาแทรกแซงจะตัดสินใจทรยศบังคับให้อีกฝ่ายร่วมมือและได้รับผลลัพธ์ที่ดีที่สุด วิธีแก้ปัญหาสมดุลอาจเป็นอย่างใดอย่างหนึ่งในสองอย่างที่มีเครื่องหมายดอกจันในเมทริกซ์การจ่ายเงินขึ้นอยู่กับว่าผู้เล่นคนใดเป็นคนแรกที่ตัดสินใจ คำตอบทั้งสองคือจุดสมดุลของแนช

ในเกือบทุกรุ่นไม่ว่าเมทริกซ์จะมีรูปร่างอย่างไรโปรโตคอลหรือกฎของเกมจะมีอิทธิพลต่อการแก้ปัญหาอย่างมาก นอกเหนือจากคำสั่งของการแทรกแซงของผู้เล่นแล้วจำเป็นต้องคำนึงถึงว่าเกมเล่นเพียงครั้งเดียวหรือเล่นซ้ำหลายครั้งข้อมูลที่พวกเขามีในแต่ละช่วงเวลาจำนวนผู้เล่นที่เกี่ยวข้องและความเป็นไปได้ของ จัดตั้งรัฐบาล ฯลฯ

คลาสเกม

สถานการณ์ที่กลืนไม่เข้าคายไม่ออกของนักโทษ

อาชญากรสองคนถูกจับขังไว้ในห้องขังแยกเพื่อไม่ให้สื่อสารกันได้ ปลัดอำเภอสงสัยว่าพวกเขามีส่วนร่วมในการปล้นธนาคารซึ่งเป็นอาชญากรรมที่มีโทษจำคุกสิบปี แต่เขาไม่มีหลักฐาน เขามีเพียงหลักฐานและสามารถตำหนิพวกเขาในความผิดเล็กน้อยมีอาวุธในครอบครองโดยผิดกฎหมายซึ่งโทษจำคุกสองปี คุณสัญญากับพวกเขาแต่ละคนว่าคุณจะลดโทษลงครึ่งหนึ่งหากคุณแสดงหลักฐานที่จะกล่าวโทษอีกฝ่ายในข้อหาปล้นธนาคาร

ทางเลือกสำหรับนักโทษแต่ละคนสามารถแสดงในรูปแบบของเมทริกซ์ผลตอบแทน กลยุทธ์ "ความภักดี" คือการนิ่งเฉยและไม่แสดงหลักฐานเพื่อกล่าวหาคู่ของคุณ เราจะเรียกกลยุทธ์ทางเลือกว่า "ขายชาติ"

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

เมทริกซ์การชำระเงิน

(ปีติดคุก)

นักโทษและ

การทรยศต่อความภักดี
ความจงรักภักดี 2/ 10 กุมภาพันธ์ / 1
กบฏ 1/ 10 พฤษภาคม / 5

นักโทษ X

การจ่ายเงินทางด้านซ้ายหรือขวาของแท่งจะระบุจำนวนปีในคุกที่นักโทษ X หรือ Y ได้รับโทษตามลำดับตามกลยุทธ์ที่แต่ละคนเลือก

แทนที่จะแสดงออกถึงการจ่ายเงินในปีที่ถูกจำคุกเราสามารถระบุลำดับความต้องการของนักโทษแต่ละคนได้จากผลลัพธ์ที่สอดคล้องกันซึ่งรูปแบบดังกล่าวจะใช้งานได้ทั่วไปมากขึ้น

เมทริกซ์การชำระเงินที่กลืนไม่เข้าคายไม่ออกของนักโทษ

(ลำดับการตั้งค่า)

นักโทษและ

การทรยศต่อความภักดี
ความจงรักภักดี 2/ 2

1/ 4

4/1 มีนาคม3 *
กบฏ

นักโทษ X

การประยุกต์ใช้กลยุทธ์ maximin ในเกมนี้นำไปสู่ผลลัพธ์ที่ไม่เหมาะสม โดยไม่รู้การตัดสินใจของผู้ต้องขังคนอื่น ๆ กลยุทธ์ที่ปลอดภัยที่สุดคือการทรยศ หากทั้งสองทรยศผลลัพธ์ของทั้งคู่จะเลวร้ายยิ่งกว่าถ้าทั้งคู่เลือกความภักดี ผลลัพธ์นี้คือจุดสมดุลของแนชและมีเครื่องหมายดอกจันบนเมทริกซ์

The Prisoner's Dilemma ตามที่เราได้อธิบายไปแล้วนั้นเป็นเกมที่ไม่ใช่ศูนย์รวมสองคนสองกลยุทธ์และสมมาตร AW Tucker ได้รับการพัฒนาอย่างเป็นทางการและวิเคราะห์เป็นครั้งแรกในปี 1950 ซึ่งอาจเป็นเกมที่รู้จักกันดีและได้รับการศึกษามากที่สุดใน Game Theory จากนั้นจึงมีการพัฒนารูปแบบต่างๆมากมายหลายรูปแบบขึ้นอยู่กับการทำซ้ำของเกมและการออกแบบกลยุทธ์การตอบสนอง

รุ่น Falcon - Paloma

ในภาษาธรรมดาเราเข้าใจโดย "เหยี่ยว" นักการเมืองที่ชอบกลยุทธ์เชิงรุกมากกว่าในขณะที่เราระบุว่าคนที่สงบที่สุดคือ "นกพิราบ" แบบจำลอง Falcon-Paloma ใช้เพื่อวิเคราะห์สถานการณ์ความขัดแย้งระหว่างกลยุทธ์เชิงรุกและเชิงประนีประนอม แบบจำลองนี้เป็นที่รู้จักในวรรณคดีแองโกล - แซกซอนว่า«เหยี่ยว - นกพิราบ»หรือ«ไก่»และในภาษาสเปนเรียกอีกอย่างว่า«แกลลินา»

ในผลงานการถ่ายทำภาพยนตร์ของโฮลีวูดความท้าทายในการเผชิญหน้ากับยานพาหนะตามแบบจำลองนี้ได้ถูกนำเสนอหลายต่อหลายครั้ง ยานพาหนะทั้งสองคันกำลังมุ่งหน้าชนกันเป็นเส้นตรงเดียวกันและด้วยความเร็วสูง ใครเบรคหรือหักเลี้ยวก็แพ้ แต่ถ้าทั้งคู่ไม่ชะลอหรือหักเลี้ยว...

โมเดลนี้ยังถูกใช้อย่างกว้างขวางเพื่อแสดงถึงสงครามเย็นระหว่างสองมหาอำนาจ กลยุทธ์เหยี่ยวประกอบด้วยในกรณีนี้ในการดำเนินการอาวุธและการเพิ่มขึ้นของสงคราม หากผู้เล่นคนหนึ่งรักษากลยุทธ์เหยี่ยวและอีกคนเลือกกลยุทธ์นกพิราบเหยี่ยวชนะและนกพิราบจะแพ้ แต่สถานการณ์ที่เลวร้ายที่สุดสำหรับทั้งคู่คือเมื่อผู้เล่นทั้งสองยึดติดกับกลยุทธ์เหยี่ยว ผลลัพธ์สามารถจำลองได้ด้วยเมทริกซ์ผลตอบแทนต่อไปนี้

เหยี่ยว - นกพิราบ

เมทริกซ์การชำระเงิน

ผู้เล่น Y

เหยี่ยวนกเขา
นกพิราบ 2, 2, 3, 1 *
เหยี่ยว วันที่ 1, 3 * 4, 4

ผู้เล่น X

สังเกตความแตกต่างที่ละเอียดอ่อน แต่สำคัญระหว่างโมเดลนี้กับ Dilemma ของนักโทษ โดยหลักการแล้วเมทริกซ์มีความคล้ายคลึงกันมากตำแหน่งของการชำระเงินครั้งที่ 3 และ 4 มีการแลกเปลี่ยนกัน แต่การแก้ปัญหาและการวิเคราะห์ในขณะนี้แตกต่างกันมาก

มีสองผลลัพธ์ที่นี่คือสภาวะสมดุลของแนช: เมื่อกลยุทธ์ที่ผู้เล่นแต่ละคนเลือกแตกต่างกัน ในเมทริกซ์ที่แสดงที่นี่โซลูชันเหล่านี้จะมีเครื่องหมายดอกจันกำกับอยู่ ในทางตรงกันข้ามตรวจสอบว่าในสถานการณ์ที่กลืนไม่เข้าคายไม่ออกของนักโทษความสมดุลของแนชอยู่ที่จุดที่ผู้เล่นทั้งสองทรยศ

ความแตกต่างที่โดดเด่นอีกประการหนึ่งของเกมนี้กับเกมอื่น ๆ คือความสำคัญที่จะได้รับลำดับที่ผู้เล่นเลือกกลยุทธ์ของตน เช่นเดียวกับหลาย ๆ ครั้งในชีวิตจริงคนแรกที่เล่นจะชนะ คนแรกจะเลือกและแสดงกลยุทธ์เหยี่ยวดังนั้นคนที่สองที่ต้องเลือกจะถูกบังคับให้เลือกกลยุทธ์ Paloma ซึ่งเป็นสิ่งที่ไม่ดีน้อยที่สุด

สงครามของคนต่างเพศ

โมเดล "War of the Sexes" เป็นตัวอย่างง่ายๆในการใช้ทฤษฎีเกมเพื่อวิเคราะห์ปัญหาที่พบบ่อยในชีวิตประจำวัน มีผู้เล่นสองคน: "HE" และ "SHE" แต่ละคนสามารถเลือกระหว่างสองกลยุทธ์ที่เป็นไปได้ซึ่งเราจะเรียกว่า "ฟุตบอล" และ "ดิสโก้"

สมมติว่าลำดับความชอบของ HE เป็นดังนี้:

  1. (เป็นที่ต้องการมากที่สุด) HE และ SHE เลือก Soccer ส่วน HE และ SHE เลือก Nightclub เขาเลือก Soccer และ SHE เลือก Nightclub (ชอบน้อยที่สุด) เขาเลือก Nightclub และ SHE เลือก Soccer

สมมติว่าลำดับความชอบของ SHE เป็นดังนี้:

  1. (เป็นที่ต้องการมากที่สุด) HE และ SHE เลือก Nightclub HE และ SHE เลือก Soccer เขาเลือก Soccer และ SHE เลือก Nightclub (ต้องการน้อยที่สุด) เขาเลือก Nightclub และ SHE เลือก Soccer

เมทริกซ์ผลตอบแทนมีดังนี้:

สงครามเซ็กส์

เธอ

ฟุตบอลดิสโก้
ฟุตบอล วันที่ 1, 2, 3, 4

4, 4, 2, 1

นฤตยศาลา

เขา

การชำระเงินแสดงถึงลำดับความต้องการ ชำระเงินให้ EL ด้วยสีดำทางด้านซ้ายของแถบ

เกมนี้ตามที่เราได้อธิบายไปแล้วว่าเป็นเกมที่ไม่มีการเล่นซ้ำและไม่มีการถ่ายโอนยูทิลิตี้ ไม่มีการเล่นซ้ำหมายความว่าคุณเล่นเพียงครั้งเดียวดังนั้นจึงไม่สามารถตัดสินใจตามตัวเลือกที่ผู้เล่นคนอื่นเลือกไว้ในเกมก่อนหน้านี้ ไม่มีการโอนผลกำไรหมายความว่าไม่มีการติดต่อสื่อสารล่วงหน้าดังนั้นจึงไม่สามารถตกลงเจรจาหรือตกลงเรื่องการจ่ายเงินสำรองได้ ("ถ้าคุณมาแข่งฟุตบอลฉันจะจ่ายค่าตั๋วให้คุณ")

ปัญหาที่เกิดขึ้นเป็นเพียงการประสานงานอย่างหนึ่ง เป็นเรื่องการตกลงกันในการเลือกตั้ง ในกรณีที่ไม่มีการสื่อสารล่วงหน้าผลลัพธ์อาจไม่เหมาะสม หากผู้เล่นแต่ละคนเลือกกลยุทธ์สูงสุดการจ่ายเงินที่พวกเขาจะได้รับ (3 \ 3) นั้นต่ำกว่า วิธีแก้ปัญหานั้นซึ่งทำเครื่องหมายบนเมทริกซ์ด้วยเครื่องหมายดอกจันไม่ใช่จุดสมดุลของแนชเนื่องจากผู้เล่นถูกล่อลวงให้เปลี่ยนทางเลือก: เมื่อ SHE มาถึงดิสโก้และเห็นว่า HE ไปเล่นฟุตบอลแล้วเธอจะรู้สึกถึงความปรารถนาที่จะ เปลี่ยนกลยุทธ์เพื่อรับการจ่ายเงินที่สูงขึ้น

รูปแบบที่เราเห็นเป็นเกมที่สมมาตรเนื่องจากผู้เล่นหรือกลยุทธ์สามารถใช้แทนกันได้โดยที่ผลลัพธ์ไม่เปลี่ยนแปลง เราสามารถแนะนำการปรับเปลี่ยนที่น่าสนใจในเกมที่ทำให้มันไม่สมดุลในขณะที่เราเข้าใกล้โลกแห่งความจริงมากขึ้น สมมติว่าตำแหน่งที่ 2 และ 3 ในลำดับความชอบของ HE กลับกัน เขาชอบไปเล่นฟุตบอลคนเดียวมากกว่าไปดิสโก้กับเธอ เมทริกซ์การชำระเงินมีดังนี้:

สงครามเซ็กส์

เธอ

ฟุตบอลดิสโก้
ฟุตบอล วันที่ 1, 2, 2, 3
นฤตยศาลา 4, 4, 3, 1

เขา

ถ้า SHE รู้เมทริกซ์ผลตอบแทนนั่นคือค่ากำหนดของ HE ปัญหาการประสานงานจะหายไป เป็นที่ชัดเจนว่าเขาจะเลือกกลยุทธ์ฟุตบอลเสมอไม่ว่า SHE จะเลือกอะไร เมื่อรู้สิ่งนี้แล้ว SHE ก็มักจะเลือกกลยุทธ์ Soccer เช่นกันเนื่องจากเธอชอบที่จะอยู่กับ HIM แม้ว่าจะอยู่ใน Soccer มากกว่าที่จะอยู่คนเดียวแม้ในดิสโก้ก็ตาม กลยุทธ์สูงสุดของผู้เล่นทั้งสองตรงกัน ผลลัพธ์ที่มีเครื่องหมายดอกจันคือจุดที่เหมาะสมจุดอานทางออกที่มั่นคงจุดสมดุลของแนช โปรดทราบว่าการแก้ปัญหานี้นำไปสู่สถานการณ์ที่มั่นคงของการครอบงำทางสังคมของผู้เล่นซึ่งเราถือว่าเป็นผู้ที่เห็นแก่ตัวที่สุด

กลยุทธ์ MAXIMIN

ลองพิจารณา "เกมรวมศูนย์" ที่ผู้เล่นคนอื่นแพ้สิ่งที่ฉันชนะ ผู้เล่นแต่ละคนมีกลยุทธ์ที่เป็นไปได้สามแบบซึ่งเราจะกำหนดเป็น A, B และ C (สมมติว่ามีการ์ดสามใบที่พิมพ์ตัวอักษรเหล่านี้)

รางวัลหรือการจ่ายเงินประกอบด้วยการแจกแจงเหรียญสิบเหรียญที่จะแจกจ่ายตามกลยุทธ์ที่ผู้เล่นทั้งสองเลือกไว้และแสดงในตารางต่อไปนี้เรียกว่าเมทริกซ์การชำระเงิน รายได้ของฉันการชำระเงินที่ฉันสามารถรับได้จะแสดงบนพื้นหลังสีเขียว การจ่ายเงินให้กับผู้เล่นคนอื่นจะแสดงบนพื้นหลังสีชมพู สำหรับการผสมผสานของกลยุทธ์ใด ๆ การจ่ายเงินรางวัลของผู้เล่นทั้งสองจะรวมกันได้ถึงสิบ

เกณฑ์การชำระเงินของฉัน เกณฑ์การจ่ายเงินให้กับผู้เล่นคนอื่น ๆ
กลยุทธ์ของผู้เล่นคนอื่น ๆ กลยุทธ์ของผู้เล่นคนอื่น ๆ
กลยุทธ์ของฉัน
ถึง
B
ถึง
9
6
7
B
หนึ่ง
5
8
กลยุทธ์ของฉัน
ถึง
ถึง
หนึ่ง
4
3
B
9
5
สอง
สอง
8
4
B
6
3
7

ตัวอย่างเช่น. หากฉันเล่นไพ่ C และผู้เล่นคนอื่นเลือกไพ่ B ของเขาฉันจะได้รับแปดเหรียญและผู้เล่นอีกคนจะได้รับสอง

นี่จึงเป็นเกมที่มีผลรวมเป็นศูนย์ เกมรวมศูนย์เรียกว่าเกมที่ผู้เล่นคนใดคนหนึ่งชนะจะเท่ากับเกมที่อีกฝ่ายแพ้หรือหยุดชนะ

เพื่อค้นหาว่ากลยุทธ์ใดดีที่สุดสำหรับฉันเราจะวิเคราะห์เมทริกซ์ที่ระบุการชำระเงินของฉันซึ่งเป็นกลยุทธ์ที่มีพื้นหลังสีเขียว ฉันไม่รู้ว่าผู้เล่นคนอื่นจะเลือกกลยุทธ์อะไร (การ์ด) วิธีหนึ่งในการวิเคราะห์เกมเพื่อทำการตัดสินใจของฉันคือการดูผลลัพธ์ขั้นต่ำที่ฉันจะได้รับจากไพ่แต่ละใบของฉัน ในตารางต่อไปนี้มีการเพิ่มคอลัมน์เพื่อระบุผลลัพธ์ขั้นต่ำของฉัน

เกณฑ์การชำระเงินของฉัน

กลยุทธ์ของผู้เล่นคนอื่น ๆ
กลยุทธ์ของฉัน
ถึง
ถึง
9
6
B
หนึ่ง
5
น้อย
สอง
หนึ่ง
B
4 4
7 8 3 3

อันที่จริง

  • ถ้าฉันเลือกไพ่ A ฉันจะได้ 9, 1 หรือ 2 อย่างน้อยฉันจะได้ผลลัพธ์เป็น 1 ถ้าฉันเลือกไพ่ B ฉันจะได้ 6, 5 หรือ 4 อย่างน้อยฉันก็จะได้ 4 ถ้าฉันเลือกไพ่ C ฉันจะได้ 7, 8 หรือ 3 อย่างน้อยฉันจะได้ 3

ของทุกคนผลการต่ำสุดที่เป็นไปได้หนึ่งที่ฉันชอบคือ4เนื่องจากเป็นสูงสุดต่ำสุด

Maximinกลยุทธ์คือการเลือกบัตรBตั้งแต่กลยุทธ์ที่รับประกันว่าผมจะได้รับอย่างน้อย4

เราสามารถมองเห็นกลยุทธ์ของผู้เล่นคนอื่นได้หรือไม่? สมมติว่าผู้เล่นคนอื่นต้องการเลือกกลยุทธ์ MAXIMIN ของเขาด้วย ตอนนี้เราแสดงเฉพาะการจ่ายเงินรางวัลที่กำหนดให้กับผู้เล่นคนอื่นซึ่งเราเน้นการจ่ายเงินขั้นต่ำที่เขาจะได้รับสำหรับแต่ละกลยุทธ์ของเขา เราขีดเส้นใต้สูงสุดของขั้นต่ำและกลยุทธ์สูงสุด

เกณฑ์การจ่ายเงินให้กับผู้เล่นคนอื่น ๆ

กลยุทธ์ของผู้เล่นคนอื่น ๆ

กลยุทธ์ของฉัน
ถึง
B
ถึง
หนึ่ง
4
B
9
5
8
6
น้อย
3
หนึ่ง
สอง
สอง
7
6

อันที่จริง

  • ถ้าเขาเลือก A ผลลัพธ์ที่แย่ที่สุดของเขาคือถ้าฉันเลือก A ด้วยสิ่งที่ฉันจะได้ 9 และเขา 1. ถ้าเขาเลือก B ผลลัพธ์ที่แย่ที่สุดของเขาก็คือถ้าฉันเลือก C ด้วยสิ่งที่ฉันจะได้ 8 และเขา 2 ถ้าเขาเลือก C ผลลัพธ์ที่แย่ที่สุดของคุณคือถ้าฉันเลือก B ด้วยสิ่งที่ฉันจะได้รับ 4 และเขา 6

กลยุทธ์ Maximin ของคุณดังนั้นจึงเป็นเรื่องที่จะเล่นการ์ดCรับประกันว่าคุณจะได้รับอย่างน้อย6

นี้เป็นเกมที่มีวิธีการแก้ปัญหาที่มีเสถียรภาพผู้เล่นทั้งสองฝ่ายไม่อยากเปลี่ยนกลยุทธ์ สมมติว่าคุณเริ่มเล่นเกมซ้ำแล้วซ้ำอีก ฉันจะเล่นกลยุทธ์ maximin ของฉันเสมอ (B) และอีกคนจะเล่นกลยุทธ์ maximin ของเขา (C) เสมอ แต่ละคนรู้ว่าอีกฝ่ายจะเล่นอะไรในครั้งต่อไป จะไม่มีใครอยากเปลี่ยนกลยุทธ์เพราะใครก็ตามที่ตัดสินใจเปลี่ยนกลยุทธ์จะแพ้

ผลลัพธ์ที่กลยุทธ์สูงสุดของผู้เล่นทั้งสองตรงกันเรียกว่า "จุดอาน"

ไม่ใช่ทุกเกมที่มีจุดอานซึ่งเป็นวิธีแก้ปัญหาที่มั่นคง ความเสถียรของเกมก่อนหน้านี้จะหายไปเพียงแค่เปลี่ยนลำดับของกล่อง BB และ BC:

เกณฑ์การชำระเงินของฉัน เกณฑ์การจ่ายเงินให้กับผู้เล่นคนอื่น ๆ
กลยุทธ์ของผู้เล่นคนอื่น ๆ กลยุทธ์ของผู้เล่นคนอื่น ๆ
กลยุทธ์ของฉัน
ถึง
B
ถึง
9
6
7
B
หนึ่ง
4
8
กลยุทธ์ของฉัน
ถึง
ถึง
หนึ่ง
4
3
B
9
6
สอง
สอง
8
5
B
5
3
7

ในตารางใหม่นี้กลยุทธ์ maximin ของฉันยังคงเป็น B และกลยุทธ์ maximin ของผู้เล่นคนอื่นยังคงเป็น C แต่วิธีแก้ปัญหานั้นไม่เสถียรอีกต่อไป หากเราเล่นซ้ำแล้วซ้ำอีกและฉันใช้กลยุทธ์ maximin ซ้ำ B อีกฝ่ายจะถูกล่อลวงให้เปลี่ยนกลยุทธ์โดยเปลี่ยนจาก C ไป B ซึ่งเขาจะได้รับการจ่ายเงินที่สูงขึ้น 6 แทนที่จะเป็น 5

แน่นอนว่าถ้าอีกฝ่ายเริ่มเลือกกลยุทธ์ B อย่างเป็นระบบฉันจะชอบเปลี่ยนกลยุทธ์เป็น C เพื่อให้ได้ 8 จากนั้นเขาก็จะกลับไปใช้กลยุทธ์ C ไปเรื่อย ๆ

ทฤษฎีบทแม็กซิมินยืนยันว่าในเกมรวมศูนย์สองคนที่สามารถเล่นกลยุทธ์แบบผสมนอกเหนือจากเกมเพียว ๆ กลยุทธ์สูงสุดของผู้เล่นแต่ละคนจะตรงกันเสมอในการแก้ปัญหาที่มั่นคงจุดอาน ทฤษฎีบทนี้ได้รับการพิสูจน์ทางคณิตศาสตร์โดย John von Neumann ในบทความที่ตีพิมพ์ในปี 1928

การเล่นเกมพร้อมโอนกำไร (การเล่นเกมแบบร่วมมือ)

หากผู้เล่นสามารถสื่อสารกันและเจรจาข้อตกลงก่อนการชำระเงินปัญหาที่เกิดขึ้นจะแตกต่างกันอย่างสิ้นเชิง ตอนนี้เป็นคำถามในการวิเคราะห์ความเป็นไปได้ในการจัดตั้งรัฐบาลในส่วนของผู้เล่นว่าแนวร่วมนี้มีความมั่นคงและควรกระจายผลกำไรระหว่างสมาชิกของกลุ่มพันธมิตรอย่างไรเพื่อไม่ให้พวกเขาสนใจที่จะทำลายแนวร่วม

เกมที่ 1 - เริ่มจากตัวอย่างที่ง่ายที่สุด สมมติว่าผู้เล่นสามคนคือ Ana, Benito และ Carmen ต้องแจกจ่ายเงินหนึ่งร้อยยูโรกันเอง ระบบการจัดจำหน่ายต้องได้รับการรับรองตามระบอบประชาธิปไตยโดยเสียงข้างมากหนึ่งคนหนึ่งเสียง มีพันธมิตรที่ชนะได้สี่กลุ่ม ได้แก่ ABC, AB, BC และ AC แต่มีวิธีที่ไม่สิ้นสุดในการกระจายการจ่ายเงินระหว่างผู้เล่นสามคน

สมมติว่า Ana เสนอการแจกแจงของรูปแบบ A = 34, B = 33 และ C = 33

เบนิโตสามารถเสนอการแจกแจงทางเลือกในรูปแบบ A = 0, B = 50 และ C = 50 คาร์เมนจะสนใจข้อเสนอของเบนิโตมากกว่าของ Ana แต่เขาสามารถเสนอทางเลือกที่ดียิ่งขึ้นสำหรับเธอได้: A = 34, B = 0 และ C = 66

เบนิโตอาจเสนอข้อเสนอที่ดีกว่าเพื่อดึงดูดอนา

เกมสามารถดำเนินต่อไปได้อย่างไม่มีกำหนด มันไม่มีทางแก้ ไม่มีแนวร่วมที่มั่นคง ไม่ว่าจะทำข้อเสนออะไรก็ตามจะมีข้อเสนอทางเลือกที่ช่วยปรับปรุงการจ่ายเงินที่ผู้เล่นแต่ละคนได้รับจากส่วนใหญ่ใหม่เสมอ

คำจำกัดความ:ในเกมที่มีการโอนยูทิลิตี้วิธีแก้ปัญหานี้เรียกว่าข้อเสนอของกลุ่มพันธมิตรและการกระจายการชำระเงินที่รับประกันความมั่นคงนั่นคือไม่มีผู้เข้าร่วมของกลุ่มพันธมิตรที่ชนะคนใดสนใจที่จะทำลายข้อตกลง

เกมที่ 2 - ตอนนี้เรามาแก้ไขตัวอย่าง แทนที่จะเป็น "หนึ่งคนหนึ่งเสียง" ให้เราพิจารณาว่ามีการลงคะแนนแบบถ่วงน้ำหนัก อนามีสิทธิ์ในการโหวตหกเสียงเบนิโตถึงสามคนและ

คาร์เมนต่อหนึ่ง. วิชาเอกที่เป็นไปได้มีดังนี้: ABC, AB, AC, A.

ในสถานการณ์นี้ Ana จะเสนอการแจกแจงด้วยวิธีต่อไปนี้: A = 100, B = 0 และ C = 0 การกระจายนี้สอดคล้องกับแนวร่วมที่มั่นคงซึ่งหกคะแนนเสียงของ Ana จะเห็นด้วย มันเป็นทางออกที่ไม่เหมือนใคร Ana จะไม่ยอมรับการแจกจ่ายใด ๆ ที่เธอได้รับน้อยกว่า 100 ยูโรและหากไม่มีการมีส่วนร่วมของ Ana จะไม่มีกลุ่มพันธมิตรที่ชนะ

คำจำกัดความ: "มูลค่าเกม" คือการจ่ายเงินที่ผู้เล่นรับประกันว่าจะได้รับจากเกมหากเขาตัดสินใจอย่างมีเหตุผลโดยไม่ขึ้นอยู่กับการตัดสินใจของผู้เล่นคนอื่น ๆ ไม่มีผู้เล่นคนใดยอมเป็นส่วนหนึ่งของกลุ่มพันธมิตรหากเขาไม่ได้รับมูลค่าของเกมเป็นค่าตอบแทนอย่างน้อยที่สุด

ในเกมที่ 1 มูลค่าเกมเป็นศูนย์สำหรับผู้เล่นทั้งสามคน ในเกมที่ 2 มูลค่าของเกมสำหรับ Ana คือหนึ่งร้อยและสำหรับ Benito และ Carmen นั้นเป็นศูนย์

เกมที่ 3 - ลองดูตัวอย่างที่ค่อนข้างสมจริงและซับซ้อนกว่านี้เล็กน้อย สมมติว่าเทศบาลแห่งหนึ่งที่มีพรรคการเมือง 5 พรรคลงสมัครรับเลือกตั้ง: พรรคออสเตโร (PA), พรรคผู้บำเพ็ญประโยชน์ (PB), พรรคชุมชน (PC), พรรคประชาธิปไตย (PD) และพรรคความหวัง (วิชาพลศึกษา). ในการเลือกตั้งพวกเขาได้รับจำนวนที่ปรึกษาดังต่อไปนี้:

PA = 11

PB = 8

พีซี = 5

PD = 2

PE = 1

เนื่องจากไม่มีพรรคใดได้เสียงข้างมากจึงจำเป็นต้องจัดตั้งรัฐบาลร่วมกันเพื่อปกครองเทศบาล งบประมาณประจำปีของเทศบาลคือ 520 ล้านยูโร รัฐบาลผสมจะต้องมอบหมายสำนักงานและความรับผิดชอบของสภาเมืองให้กับพรรคต่างๆ ในการเจรจาจะต้องมีการตกลงการกระจายงบประมาณตำแหน่งและความรับผิดชอบระหว่างสองฝ่าย เราถือว่าไม่มีความเห็นอกเห็นใจหรือการต่อต้านอุดมการณ์ใด ๆ และตำแหน่งและความรับผิดชอบจะมีมูลค่าตามงบประมาณทางเศรษฐกิจที่พวกเขาควบคุมเท่านั้น เราจะถือว่าเพื่อความง่ายมีวินัยในการโหวตและการทรยศภายในเป็นไปไม่ได้

การวิเคราะห์เกม 3. เนื่องจากจำนวนสมาชิกทั้งหมด 27 คนกลุ่มพันธมิตรที่ชนะจะต้องมีคะแนนเสียงอย่างน้อย 14 เสียง แตกต่างจากเกม 2 ไม่มีผู้เล่นที่สำคัญที่จะชนะ หากเราใช้คำจำกัดความที่เราให้ไว้ข้างต้นมูลค่าของเกมสำหรับผู้เล่นทุกคนจะเป็นศูนย์เนื่องจากไม่มีใครรับประกันว่าจะเป็นของกลุ่มพันธมิตรที่ชนะ

คำจำกัดความ:การจัดสรรที่ผู้เล่นแต่ละคนได้รับในข้อเสนอดีลเรียกว่า "มูลค่า Shapley" ตามเกณฑ์อนุญาโตตุลาการที่ออกแบบโดย Lloyd S. Shapley เกณฑ์คือการกำหนดการจ่ายเงินให้กับผู้เล่นแต่ละคนตามสัดส่วนของจำนวนพันธมิตรที่อาจชนะซึ่งผู้เล่นมีส่วนร่วมในลักษณะที่ไม่ซ้ำซ้อน

ผู้เล่นมีความซ้ำซ้อนในแนวร่วมหากเขาไม่จำเป็นสำหรับกลุ่มพันธมิตรนั้นที่จะได้รับชัยชนะ

สัตว์ใกล้สูญพันธุ์และทรัพยากรธรรมชาติ

ปัจจุบันมีความกังวลทั่วไปเกี่ยวกับการหายไปของพื้นที่ป่าเขตร้อนขนาดใหญ่และความเป็นไปได้ที่สัตว์จะสูญพันธุ์เนื่องจากการใช้ประโยชน์มากเกินไป ปัญหานี้มีลักษณะคล้ายคลึงกับผลกระทบภายนอกและสินค้าสาธารณะและตลาดยังไม่ได้รับการแก้ไขอย่างน่าพอใจ ซึ่งแตกต่างจากสินค้าสาธารณะทรัพยากรธรรมชาติที่เป็นทรัพย์สินทั่วไปทำหรืออาจทำให้เกิดการแข่งขันกันในการบริโภค ต่างจากปัญหาผลกระทบภายนอกซึ่งเป็นผลกระทบทางเทคโนโลยีที่เกิดจากสินค้าส่วนตัวในสินค้าส่วนตัวการใช้ประโยชน์จากทรัพยากรธรรมชาติทั่วไปมากเกินไปรวมถึงผลกระทบทางเทคโนโลยีและผลประโยชน์ที่เกิดจากการแปรรูปทรัพย์สินส่วนกลาง

ในหลายประเทศในอเมริกาใต้เช่นบราซิลหรือคอสตาริกาป่าฝนกำลังถูกเผาเพื่อล้างดินแดนใหม่ที่อนุญาตให้ผู้ตั้งถิ่นฐานเข้ามาตั้งถิ่นฐาน ในป่าเขตร้อนของตะวันออกไกลโดยเฉพาะในอินโดนีเซียและฟิลิปปินส์อัตราการใช้ประโยชน์จากความมั่งคั่งจากไม้ของพวกเขาเพิ่มขึ้นเป็นสองเท่าของอัตราการแพร่พันธุ์ทำให้สถานการณ์เลวร้ายลงในไม้มีตระกูลซึ่งส่วนใหญ่เป็นที่ต้องการซึ่งบางชนิดตกอยู่ในอันตรายแล้ว การหายไป สัตว์เลี้ยงลูกด้วยนมในทะเลหลายชนิดมีชีวิตรอดที่ถูกคุกคามอย่างหนักจากการเก็บเกี่ยวมากเกินไป โรงเรียนสอนปลาหลายแห่งแม้ว่าจะไม่ตกอยู่ในอันตรายจากการสูญพันธุ์ แต่ก็เห็นว่าจำนวนประชากรของพวกเขาลดลงจนทำลายประชากรประมงจำนวนมากในเปรูเกาะอังกฤษและนอร์เวย์

เหตุผลก็คล้ายกันในทุกกรณี ป่าละเมาะป่าไม้ทุ่งหญ้าส่วนกลางพื้นที่ล่าสัตว์หรือการประมงไม่อยู่ภายใต้การปกครองของทรัพย์สินส่วนตัว

บุคคลหรือ บริษัท ใด ๆ สามารถเข้าถึงได้ดังนั้นแต่ละคนจะพยายามได้รับประสิทธิภาพสูงสุดโดยไม่ต้องกังวลเกี่ยวกับการเก็บรักษาไว้ในอนาคต วิทยาศาสตร์เศรษฐศาสตร์ศึกษาปัญหาในกรณีของการประมงเป็นครั้งแรกซึ่งกลายเป็นตัวอย่างดั้งเดิม

นักนิเวศวิทยาหัวรุนแรงบางคนให้ข้อมูลผิด ๆ เสนอให้เราพิจารณาพันธุ์สัตว์เป็น "ทุนที่สืบทอด" ซึ่งเราสามารถใช้ประโยชน์จากรายได้ของพวกมัน แต่เราต้องถ่ายทอด "เต็มจำนวน" ไปยังคนรุ่นหลัง ที่เป็นไปไม่ได้ในความเป็นจริง ปริมาณปลาที่โรงเรียนจับได้จะลดจำนวนประชากรลงอย่างหลีกเลี่ยงไม่ได้ โดยสำนวน "ทุนที่สืบทอด" นักนิเวศวิทยาเหล่านี้หมายถึงจุดสมดุลตามธรรมชาติของประชากรขนาดที่ประชากรปลาจะมีได้หากเราไม่มีมนุษย์ วิธีเดียวที่จะรักษาจำนวนปลา "ทั้งตัว" ไว้ได้คือไม่ต้องตกปลา

สมมติว่าเราเริ่มจากสถานการณ์ระดับกลางขนาดของประชากรปลาระหว่าง Pa กับ Pc ซึ่งอัตราการเติบโตเป็นบวกเช่น 3% ต่อปี หากเรา จำกัด การจับรายปีของเราไว้ที่อัตรานั้นอย่างแม่นยำถึง 3% ของประชากรทั้งหมดขนาดของธนาคารจะคงที่ไปเรื่อย ๆ ปัญหานี้สามารถระบุได้ในแง่ทางชีววิทยาอย่างเคร่งครัด: ปริมาณสูงสุดของการจับที่สามารถทำได้อย่างไม่มีกำหนดคือเท่าใดหรือกล่าวอีกนัยหนึ่งคือขนาดของประชากรที่มีอัตราการเติบโตสูงสุดคือเท่าใดจุด Pb ในกราฟิก

นักชีววิทยาสามารถแก้ปัญหานี้ได้อย่างสมบูรณ์แบบและประสบความสำเร็จด้วยความซับซ้อนระดับสูงโดยกำหนดอายุที่เหมาะสมของปลาที่จับได้และช่วงเวลาของปีที่ควรมีการรณรงค์ การจัดการหรือการจัดการการประมงเรียกว่าชุดของการศึกษาและเทคนิคที่ช่วยให้สามารถหาประโยชน์ได้ในระยะยาวอย่างเหมาะสม

แต่เมื่อเรามีวิธีแก้ปัญหาที่ดีที่สุดแล้วก็จะมีคำถามว่าเราสามารถนำไปใช้ได้หรือไม่ แต่ละคนแต่ละเรือประมงต้องเลือกระหว่างสองทางเลือกในสภาพแวดล้อมที่สามารถจำลองได้ตามสถานการณ์ที่กลืนไม่เข้าคายไม่ออกของนักโทษ เราจะเรียกว่า "ร่วมมือ" กลยุทธ์ซึ่งประกอบด้วยการเคารพโควตาและกฎระเบียบที่ตกลงกันโดยสหกรณ์หรือโดยหน่วยงานเหนือระดับและจัดตั้งขึ้นตามเกณฑ์เหตุผลสำหรับการจัดการประมง เราจะเรียกกลยุทธ์นี้ว่า "ทรยศ" ซึ่งประกอบด้วยการพยายามให้ได้มาซึ่งผลประโยชน์สูงสุดของแต่ละบุคคลในระยะสั้นแม้ว่าจะหมายถึงการเกินโควต้าหรือการใช้เครื่องมือประมงต้องห้ามก็ตาม

ชนิดและการสูญพันธุ์

เรืออื่น ๆ

ร่วมมือกับ Betray
ร่วมมือกัน 2, 2 4, 1
ทรยศ 1, 4 3, 3

เรือของฉัน

ดุลยภาพของแนชอยู่ในกรอบที่ทุกคนทรยศ ดังนั้นแนวโน้มที่ทรัพยากรจะถูกใช้ประโยชน์มากเกินไป

หากมี บริษัท ที่สามารถใช้อำนาจควบคุมการประมงแบบผูกขาดได้ก็จะไม่มีปัญหาในการจัดการอย่างมีประสิทธิภาพ นั่นคือเหตุผลที่วิธีแก้ปัญหาประการแรกคือให้รัฐผูกขาดทรัพยากรและใช้อำนาจบีบบังคับเพื่อป้องกันการใช้จ่ายมากเกินไป การขยายเขตอำนาจของประเทศที่อยู่ห่างจากไหล่ทวีปไปถึงสองร้อยไมล์เป็นขั้นตอนแรกในการควบคุมการผลิตประมงในปี 1970 ตั้งแต่นั้นมาระบบโควต้าได้รับการเปิดเผยโดยทั่วไปโดยกำหนดปริมาณการจับสูงสุด เพื่อแจกจ่ายให้กับทุก บริษัท ที่ได้รับอนุญาตให้จับปลา

สำหรับสิ่งมีชีวิตเช่นปลาวาฬและสัตว์เลี้ยงลูกด้วยนมในทะเลอื่น ๆ ซึ่งอาศัยอยู่ห่างจากชายฝั่งมากกว่าสองร้อยไมล์หรือบนชายฝั่งที่ไม่อยู่ภายใต้เขตอำนาจศาลใด ๆ การแก้ปัญหายังอยู่ห่างไกล ยังไม่มี - รัฐระดับโลกสถาบันที่มีความสามารถในการจัดการทรัพยากรทั้งหมดของดาวเคราะห์โลกและด้วยความชอบธรรมในการลงโทษผู้กระทำผิด

สรุป

บางทฤษฎีพยายามค้นหากลยุทธ์ที่มีเหตุผลซึ่งใช้ในสถานการณ์ที่ผลลัพธ์ไม่เพียงขึ้นอยู่กับกลยุทธ์และสภาพแวดล้อมของตนเองเท่านั้น แต่ยังรวมถึงกลยุทธ์ที่ผู้เล่นคนอื่นใช้ซึ่งอาจมีวัตถุประสงค์ที่แตกต่างกัน

ทฤษฎีเกมประกอบด้วยการให้เหตุผลแบบวงกลมซึ่งไม่สามารถหลีกเลี่ยงได้เมื่อพิจารณาคำถามเชิงกลยุทธ์ สัญชาตญาณที่ไม่ถูกแตะต้องไม่น่าเชื่อถือในสถานการณ์เชิงกลยุทธ์ซึ่งเป็นเหตุผลว่าทำไมจึงต้องได้รับการฝึกฝน ปัจจุบันทฤษฎีเกมมีแอปพลิเคชั่นมากมายในสาขาวิชาที่เรามี ได้แก่ เศรษฐศาสตร์รัฐศาสตร์ชีววิทยาและปรัชญา

มีการตอบสนองสองประเภทประเภทการศึกษาซึ่งผู้เล่นคิดว่าพวกเขามีความสมดุลอันเป็นผลมาจากการให้เหตุผลอย่างรอบคอบและการตอบสนองประเภทที่สองการตอบสนองแบบวิวัฒนาการตามที่กล่าวมานี้จะเกิดความสมดุลไม่ใช่เพราะผู้เล่น พวกเขาคิดทุกอย่างล่วงหน้า แต่เป็นผลมาจากการที่ผู้เล่นสายตาสั้นปรับพฤติกรรมด้วยการให้คะแนนเมื่อเล่นและทำซ้ำ ๆ เป็นเวลานาน

กลยุทธ์ maximin และ minimax ทำให้ผู้เล่นทั้งสองคนในเกมเข้าสู่สถานการณ์ที่ผู้เล่นไม่มีเหตุผลหรือแรงจูงใจในการเปลี่ยนตำแหน่ง ในทำนองเดียวกันผู้เล่นจะได้รับการกล่าวขานว่ามีกลยุทธ์ที่โดดเด่นหากกลยุทธ์ใดกลยุทธ์หนึ่งเป็นที่ต้องการของกลยุทธ์อื่น ๆ ที่มีให้กับเขา

บรรณานุกรม

  • Martínez Coll, Juan Carlos (2001): « Theory of Games » in The Market Economy คุณธรรมและข้อเสีย http://www.eumed.net/gestiopolis.commonografias.comhttp: //es.wikipedia.org/
ดาวน์โหลดไฟล์ต้นฉบับ

ทฤษฎีเกม