ใหม่ CHATGPT: ฉลาดกว่า แต่ … เงินเพิ่มเติม?

Openai เพิ่งเปิดตัว CHATGPT, O3 และ O4-MINI สองเวอร์ชันใหม่ซึ่งโฆษณาว่ามีความสามารถในการคิดเชิงตรรกะที่เหนือกว่า อย่างไรก็ตามผลการทดสอบภายในน่าประหลาดใจ: ทั้งสองรุ่นนี้มี “ภาพหลอน” – นั่นคือการผลิตข้อมูล – ด้วยความถี่ที่น่าตกใจซึ่งสูงกว่ารุ่นก่อน สิ่งนี้ก่อให้เกิดความท้าทายที่ดีสำหรับ OpenAI ในการรับรองความถูกต้องและความน่าเชื่อถือของผลิตภัณฑ์ AI รุ่นต่อไป บทความนี้จะวิเคราะห์เพิ่มเติมเกี่ยวกับปัญหานี้และผลกระทบที่อาจเกิดขึ้น

การเปิดตัว O3 และ O4-Mini เป็นขั้นตอนสำคัญในเทคโนโลยีการประมวลผลภาษาธรรมชาติ (NLP) Openai คาดว่าทั้งสองรุ่นนี้จะจัดการงานที่ซับซ้อนได้ดีขึ้นซึ่งต้องการการใช้เหตุผลเชิงตรรกะ อย่างไรก็ตามความเป็นจริงแสดงให้เห็นว่านอกเหนือจากการปรับปรุงที่สำคัญในความสามารถในการคิดแนวโน้ม “ประดิษฐ์” ของ O3 และ O4-MINI ได้เพิ่มขึ้นอย่างมีนัยสำคัญ สิ่งนี้ทำให้เกิดความกังวลมากมายเกี่ยวกับการประยุกต์ใช้แบบจำลองเหล่านี้ในทางปฏิบัติโดยเฉพาะในพื้นที่ที่ต้องการความแม่นยำสูงเช่นสื่อสุขภาพหรือกฎหมาย

ปัจจุบัน OpenAI ยังไม่ได้เผยแพร่รายละเอียดเกี่ยวกับสาเหตุของปรากฏการณ์นี้ อย่างไรก็ตามผู้เชี่ยวชาญหลายคนเชื่อว่าการมุ่งเน้นการปรับปรุงตรรกะมากเกินไปอาจลดความสามารถในการตรวจสอบข้อมูลของแบบจำลองโดยไม่ตั้งใจ การฝึกอบรมแบบจำลองเกี่ยวกับข้อมูลจำนวนมากซึ่งอาจมีข้อมูลเท็จจำนวนมากก็เป็นปัจจัยที่ต้องพิจารณา

เหตุการณ์นี้ทำให้เกิดคำถามใหญ่เกี่ยวกับทิศทางการพัฒนาของเทคโนโลยี AI โดยทั่วไป วิธีการปรับสมดุลการเพิ่มประสิทธิภาพของการคิดเชิงตรรกะและรับรองความถูกต้องของข้อมูล? OpenAI สามารถเอาชนะปัญหานี้ได้และนำ ChatgTops ที่เชื่อถือได้มากขึ้นในอนาคตหรือไม่? สิ่งเหล่านี้เป็นความท้าทายที่ Openai ต้องการแก้ไขเพื่อรักษาตำแหน่งผู้นำในสาขาของ AI การพัฒนาเทคโนโลยี AI จะต้องเชื่อมโยงกับความรับผิดชอบเพื่อให้แน่ใจว่ามีความโปร่งใสและความน่าเชื่อถือหลีกเลี่ยงผลที่ไม่พึงประสงค์

#openai #chatgpt

: OpenAI เป็นเรื่องยากที่จะพูด

Openai เพิ่งเปิดตัวสองรุ่นใหม่ O3 และ O4-miniออกแบบมาเป็นพิเศษเพื่อจัดการงานที่ต้องใช้การคิดเชิงตรรกะ อย่างไรก็ตามจากการทดสอบภายในโมเดลทั้งสองนี้มีแนวโน้มที่จะสร้างข้อมูลเท็จ (หรือที่เรียกว่า “ภาพหลอน”) ที่มีความถี่สูงกว่ารุ่นก่อนหน้าเช่น GPT-4O

ปรากฏการณ์ภาพลวงตายังคงเป็นหนึ่งในปัญหาที่ยากที่สุดในอุตสาหกรรม AI โมเดลใหม่มักจะปรับปรุงความแม่นยำ แต่ O3 และ O4-Mini ไปกับแนวโน้มนั้น ตามรายงานทางเทคนิคจาก OpenAI โมเดลเหล่านี้ “สร้างข้อความเพิ่มเติม” ควรให้ข้อมูลเพิ่มเติมอย่างเหมาะสม แต่ยังมีคำตอบที่ผิดพลาดมากขึ้น

ผลการทดสอบแสดงให้เห็นว่า O3 เป็นภาพหลอนใน 33%ของคำถามของข้อมูล PersonQA ที่ตั้งอยู่สองเท่าของ O1 (16%) และ O3-MINI (14.8%) O4-MINI นั้นสูงขึ้นโดยมีอัตราสูงถึง 48% นี่คือก้าวถอยหลังเมื่อเทียบกับความคาดหวังของความถูกต้องของรุ่น AI รุ่นใหม่

AI รุ่นที่ได้รับความนิยมในปัจจุบันของ CHATGPT

ไม่เพียง แต่ OpenAI บันทึกปัญหานี้ ตามที่ Cusion ห้องปฏิบัติการวิจัย AI อิสระ O3 มีแนวโน้มที่จะ “ประดิษฐ์” งานในการปฏิบัติงาน ในกรณีหนึ่งโมเดลกล่าวว่าได้เรียกใช้รหัสบน MacBook Pro 2021 และคัดลอกผลลัพธ์ลงในคำตอบ – สิ่งที่เป็นไปไม่ได้อย่างแน่นอนที่จะทำในความเป็นจริง

Neil Chowdhury นักวิจัยที่ Cugure และอดีตเจ้าหน้าที่ Openai กล่าวว่าอัลกอริทึมการเรียนรู้การเสริมแรงที่ใช้สำหรับสายโมเดล O อาจมีข้อผิดพลาดโดยไม่ตั้งใจซึ่งจะลดลงเล็กน้อยโดยกระบวนการฝึกอบรมแบบดั้งเดิม ในมุมมองเดียวกันผู้ร่วมก่อตั้ง CoDuce คือ Sarah Schwettmann กล่าวว่าอัตราการปรากฏตัวสูงทำให้ O3 มีประสิทธิภาพน้อยกว่าศักยภาพจริง

บาง บริษัท ยังคงทดสอบ O3 ในสภาพแวดล้อมจริง Kian Katanforoosh อาจารย์ที่ Stanford และ CEO ของ Workera กล่าวว่ากลุ่มของเขาให้คะแนน O3 สูงกว่าคู่แข่งเมื่อใช้ในกระบวนการเขียนโปรแกรม อย่างไรก็ตามพวกเขายังค้นพบว่าโมเดลนี้มักจะสร้างลิงค์เว็บที่ขาดหายไป

แม้ว่าบางครั้งคำตอบที่ “สร้างสรรค์” จาก AI สามารถนำไปสู่ความคิดใหม่ ๆ แต่ในด้านต่าง ๆ เช่นกฎหมายหรือการเงินซึ่งต้องใช้ความแม่นยำอย่างแท้จริงปรากฏการณ์ของภาพหลอนเป็นอุปสรรคใหญ่ วิธีการที่มีแนวโน้มคือการรวมคุณสมบัติการค้นหาเว็บเข้ากับโมเดล AI ตัวอย่างเช่น GPT-4O มีการค้นหาเพื่อให้ได้ความแม่นยำ 90% ใน SimpleQa ตามข้อมูลจาก OpenAI

Niko Felix ตัวแทน OpenAI กล่าวว่าการปรับปรุงความแม่นยำและภาพหลอนเป็นลำดับความสำคัญของการวิจัยอย่างต่อเนื่องของ บริษัท อย่างไรก็ตามหากการขยายตัวของรูปแบบการคิดยังคงทำให้ปัญหานี้แย่ลงอุตสาหกรรมของ AI จะประสบปัญหาเร่งด่วนมากขึ้นกว่าเดิม

ในบริบทของวิธีการฝึกอบรมแบบดั้งเดิมเริ่มแสดงให้เห็นว่าประสิทธิภาพลดลง บริษัท เทคโนโลยีหลายแห่งกำลังเปลี่ยนเป็นรูปแบบการคิด แม้จะมีการประหยัดทรัพยากรและมีประสิทธิภาพในหลาย ๆ งาน แต่ก็เป็นที่ชัดเจนว่ายังมีอุปสรรคมากมายที่จะเอาชนะเพื่อให้พวกเขามีความน่าเชื่อถืออย่างแท้จริง

ปรากฏการณ์ภาพลวงตายังคงเป็นหนึ่งในปัญหาที่ยากที่สุดในอุตสาหกรรม AI โมเดลใหม่มักจะปรับปรุงความแม่นยำ แต่ O3 และ O4-Mini ไปกับแนวโน้มนั้น ตามรายงานทางเทคนิคจาก OpenAI โมเดลเหล่านี้ “สร้างข้อความเพิ่มเติม” ควรให้ข้อมูลเพิ่มเติมอย่างเหมาะสม แต่ยังมีคำตอบที่ผิดพลาดมากขึ้น

ผลการทดสอบแสดงให้เห็นว่า O3 เป็นภาพหลอนใน 33%ของคำถามของข้อมูล PersonQA ที่ตั้งอยู่สองเท่าของ O1 (16%) และ O3-MINI (14.8%) O4-MINI นั้นสูงขึ้นโดยมีอัตราสูงถึง 48% นี่คือก้าวถอยหลังเมื่อเทียบกับความคาดหวังของความถูกต้องของรุ่น AI รุ่นใหม่

OpenAI เป็นเรื่องยากที่จะพูดคุยกัน O3, O4-MINI — AI รุ่นที่ได้รับความนิยมในปัจจุบันของ CHATGPT

ไม่เพียง แต่ OpenAI บันทึกปัญหานี้ ตามที่ Cusion ห้องปฏิบัติการวิจัย AI อิสระ O3 มีแนวโน้มที่จะ “ประดิษฐ์” งานในการปฏิบัติงาน ในกรณีหนึ่งโมเดลกล่าวว่าได้เรียกใช้รหัสบน MacBook Pro 2021 และคัดลอกผลลัพธ์ลงในคำตอบ – สิ่งที่เป็นไปไม่ได้อย่างแน่นอนที่จะทำในความเป็นจริง

Neil Chowdhury นักวิจัยที่ Cugure และอดีตเจ้าหน้าที่ Openai กล่าวว่าอัลกอริทึมการเรียนรู้การเสริมแรงที่ใช้สำหรับสายโมเดล O อาจมีข้อผิดพลาดโดยไม่ตั้งใจซึ่งจะลดลงเล็กน้อยโดยกระบวนการฝึกอบรมแบบดั้งเดิม ในมุมมองเดียวกันผู้ร่วมก่อตั้ง CoDuce คือ Sarah Schwettmann กล่าวว่าอัตราการปรากฏตัวสูงทำให้ O3 มีประสิทธิภาพน้อยกว่าศักยภาพจริง

บาง บริษัท ยังคงทดสอบ O3 ในสภาพแวดล้อมจริง Kian Katanforoosh อาจารย์ที่ Stanford และ CEO ของ Workera กล่าวว่ากลุ่มของเขาให้คะแนน O3 สูงกว่าคู่แข่งเมื่อใช้ในกระบวนการเขียนโปรแกรม อย่างไรก็ตามพวกเขายังค้นพบว่าโมเดลนี้มักจะสร้างลิงค์เว็บที่ขาดหายไป

แม้ว่าบางครั้งคำตอบที่ “สร้างสรรค์” จาก AI สามารถนำไปสู่ความคิดใหม่ ๆ แต่ในด้านต่าง ๆ เช่นกฎหมายหรือการเงินซึ่งต้องใช้ความแม่นยำอย่างแท้จริงปรากฏการณ์ของภาพหลอนเป็นอุปสรรคใหญ่ วิธีการที่มีแนวโน้มคือการรวมคุณสมบัติการค้นหาเว็บเข้ากับโมเดล AI ตัวอย่างเช่น GPT-4O มีการค้นหาเพื่อให้ได้ความแม่นยำ 90% ใน SimpleQa ตามข้อมูลจาก OpenAI

Niko Felix ตัวแทน OpenAI กล่าวว่าการปรับปรุงความแม่นยำและภาพหลอนเป็นลำดับความสำคัญของการวิจัยอย่างต่อเนื่องของ บริษัท อย่างไรก็ตามหากการขยายตัวของรูปแบบการคิดยังคงทำให้ปัญหานี้แย่ลงอุตสาหกรรมของ AI จะประสบปัญหาเร่งด่วนมากขึ้นกว่าเดิม

h1>บทสรุปของ OpenAI นั้นยากที่จะพูดคุยกัน O3, O4-MINI “ข้อมูลประดิษฐ์” เพิ่มเติม

ในบริบทของวิธีการฝึกอบรมแบบดั้งเดิมเริ่มแสดงให้เห็นว่าประสิทธิภาพลดลง บริษัท เทคโนโลยีหลายแห่งกำลังเปลี่ยนเป็นรูปแบบการคิด แม้จะมีการประหยัดทรัพยากรและมีประสิทธิภาพในหลาย ๆ งาน แต่ก็เป็นที่ชัดเจนว่ายังมีอุปสรรคมากมายที่จะเอาชนะเพื่อให้พวกเขามีความน่าเชื่อถืออย่างแท้จริง
. WEADEDE {ตำแหน่ง: สัมบูรณ์; ชายแดน: 2px Solid #990000; -MOZ-Border-Radius: 50%; -MS-Border-Radius: 50%; แนวชายแดน: 50%; แอนิเมชั่น: ตีกลับ 2s ไม่มีที่สิ้นสุด; -webkit-animation: ตีกลับ 2s ไม่มีที่สิ้นสุด; -moz-Animation: ตีกลับ 2s ไม่มีที่สิ้นสุด; -o-anime: ตีกลับ 2s ไม่มีที่สิ้นสุด; แสดง: Inline-Block; Padding: 3px 3px 3px; สี: #FFF; ความเป็นมา: #990000; ขนาดตัวอักษร: 20px; ความสูงบรรทัด: 1; -moz-Border-Radius: 5px; -webkit-Border-Radius: 5px; -moz-box-shadow: 0 1px 3px #999; -webkit-box-shadow: 0 1px 3px #999; ข้อความ -Shadow: 0 -1px 1px #222; ขอบด้านล่าง: 1px Solid #222; ตำแหน่ง: ญาติ; เคอร์เซอร์: ตัวชี้; –

โพสต์ CHATGPT: ฉลาดกว่า แต่ … เงินมากขึ้น? ปรากฏตัวครั้งแรกบน Queen Mobile

Discover more from 24 Gadget - Review Mobile Products

Subscribe to get the latest posts sent to your email.

Best Review

ใหม่ CHATGPT: ฉลาดกว่า แต่ … ประดิษฐ์เงินมากขึ้น?

ใหม่ CHATGPT: ฉลาดกว่า แต่ … เงินเพิ่มเติม?

: OpenAI เป็นเรื่องยากที่จะพูด

Like this:

Related

Discover more from 24 Gadget - Review Mobile Products

Queen Mobile

Leave a ReplyCancel reply