สำนักข่าว USA Today ได้ทำการทดสอบให้ปัญญาประดิษฐ์ (AI) คาดการณ์ผลการแข่งขันฟุตบอลโลก 2026 แต่ผลลัพธ์ที่ออกมากลับพลาดเป้าไปไกล สะท้อนให้เห็นว่ามนุษย์ยังคงมีความสามารถในการวิเคราะห์เกมกีฬาได้แม่นยำกว่าโมเดลภาษาขนาดใหญ่
AI กับฟุตบอลโลก 2026
เทคโนโลยีปัญญาประดิษฐ์ได้เข้ามามีบทบาทในแทบทุกมิติของการแข่งขันฟุตบอลโลก 2026 ไม่ว่าจะเป็นการช่วยออกแบบเสื้อแข่งขัน การประมวลผลข้อมูลสถิติในสนามมหาศาล หรือแม้แต่การใช้หุ่นยนต์สุนัขรักษาความปลอดภัยตามสนามแข่งต่างๆ อย่างไรก็ตาม ท่ามกลางความสามารถที่หลากหลาย AI กลับยังคงสอบตกอย่างสิ้นเชิงในตัวชี้วัดที่สำคัญที่สุด นั่นคือการคาดการณ์ผลแพ้ชนะ
ผลการทดสอบของ USA Today
สำนักข่าว USA Today ได้ทำการทดสอบโดยให้ Copilot ซึ่งเป็นผู้ช่วย AI จากไมโครซอฟท์ (Microsoft) ประเมินผลการแข่งขันฟุตบอลโลกจำนวน 4 คู่ ได้แก่ สเปนพบเคปเวิร์ด (คาดการณ์ว่าสเปนชนะ 3-0), เบลเยียมพบอียิปต์ (คาดการณ์ 2-1), อุรุกวัยพบซาอุดีอาระเบีย (คาดการณ์ 2-1) และอิหร่านพบนิวซีแลนด์ (คาดการณ์ 1-0)
ผลลัพธ์ที่ออกมากลับผิดคาดอย่างสิ้นเชิง เมื่อการแข่งขันทั้ง 4 คู่จบลงด้วยผลเสมอ ซึ่งเป็นความเป็นไปได้ที่ Copilot ไม่ได้นำมาพิจารณาเลยแม้แต่น้อย เบลเยียมเสมอกับอียิปต์ และอุรุกวัยเสมอกับซาอุดีอาระเบียด้วยสกอร์ 1-1 ขณะที่อิหร่านเสมอกับนิวซีแลนด์ 2-2 แต่ผลการแข่งขันที่หักปากกาเซียนที่สุดคือคู่ของเคปเวิร์ด ที่ โจซิมาร์ "โวซินญา" ดิอาส ผู้รักษาประตูที่กำลังเป็นกระแสไวรัล โชว์ฟอร์มซูเปอร์เซฟจนสามารถยันเสมอทีมเต็งแชมป์โลกอย่างสเปนไปได้ 0-0
จุดอ่อนของ AI ในการวิเคราะห์กีฬา
การวิเคราะห์ของ Copilot สะท้อนให้เห็นถึงจุดอ่อนสำคัญ โดย AI ให้เหตุผลว่าแนวรุกของสเปนจะสามารถเจาะแนวรับของเคปเวิร์ดจนพังทลายได้อย่างง่ายดาย ซึ่ง USA Today ชี้ให้เห็นว่าระบบ AI มีแนวโน้มที่จะประมวลผลและอ้างอิงข้อมูลจากกระแสข่าวโหมโรงของสื่อ มากกว่าการใช้ชุดข้อมูลวิเคราะห์เชิงลึกที่แม่นยำ
ไม่ใช่แค่ Copilot เท่านั้นที่ทำผลงานได้น่าผิดหวัง ก่อนหน้านี้มีนักข่าวได้ทดสอบให้ ChatGPT คาดการณ์ผลการแข่งขันบาสเกตบอล NBA ฤดูกาล 2026 รอบชิงชนะเลิศระหว่าง นิวยอร์ก นิกส์ และ ซานอันโตนิโอ สเปอร์ส โดย ChatGPT ประเมินว่า สเปอร์สจะคว้าแชมป์ไปครอง และซูเปอร์สตาร์อย่าง วิคเตอร์ เวมบันยามา จะพาทีมยื้อไปจนถึงเกมที่ 7 แต่ในความเป็นจริง นิกส์กลับคว้าแชมป์ไปได้อย่างสวยงามในเกมที่ 5 ภายใต้การนำของจาเลน บรันสัน, คาร์ล-แอนโทนี ทาวน์ส รวมถึง โอจี อานูโนบี
งานวิจัยยืนยันมนุษย์ยังเหนือกว่า
ความล้มเหลวในการคาดการณ์เหล่านี้สอดคล้องกับงานวิจัยล่าสุดที่ชี้ว่า โมเดลภาษาขนาดใหญ่ (LLMs) อย่าง ChatGPT และ Copilot ยังขาดศักยภาพอย่างหนักในการประเมินผลการแข่งขันกีฬา หรือแม้แต่วิเคราะห์รูปเกมที่เกิดขึ้นไปแล้ว โดยในการทดสอบให้ AI คาดการณ์ผลลัพธ์ของช่วงเวลาการแข่งขันสั้นๆ 3 - 15 นาที โมเดลที่ทำผลงานได้ดีที่สุดมีความแม่นยำเพียง 43 เปอร์เซ็นต์เท่านั้น ในขณะที่มนุษย์สามารถรักษามาตรฐานความแม่นยำได้ถึง 58.9 เปอร์เซ็นต์
ดังนั้น ข้อสรุปที่ว่าโมเดลภาษาขนาดใหญ่ยังคงล้าหลังในด้าน "ความรู้เรื่องกีฬา" อีกทั้งยังเป็นสัญญาณเตือนภัยที่น่ากังวลสำหรับอุตสาหกรรมเทคโนโลยีที่ทุ่มเม็ดเงินหลายแสนล้านดอลลาร์สหรัฐ เพื่อพยายามผลักดันให้ AI กลายเป็นระบบเครื่องจักรที่มีความสามารถในการคิดวิเคราะห์และใช้เหตุผลเชิงซ้อน (Complex reasoning) ได้เทียบเท่ากับมนุษย์



