
OpenAI เปิดตัว GPT-5.3-Codex ซึ่งเป็นโมเดลแรกที่ “มีส่วนร่วมในการสร้างตัวเอง” เพื่อดีบักโค้ดของตัวเอง จัดการการปรับใช้ และวินิจฉัยการทดสอบ Karpathy เรียกการแก้ไขว่า “ใกล้เคียงกับฉากบินขึ้นของ AI มากที่สุด”
เปิดตัวบัญชีอย่างเป็นทางการของ OpenAI: GPT-5.3-Codex เปิดตัวอย่างเป็นทางการ ซึ่งเป็น “คนแรกที่มีส่วนร่วมในการสร้างโมเดลของคุณเอง” มันหมายความว่าอย่างไร? กล่าวอีกนัยหนึ่งในระหว่างกระบวนการพัฒนา AI นี้ช่วยดีบักโค้ดการฝึกอบรมของตัวเองจัดการกระบวนการปรับใช้ของตัวเองและวินิจฉัยผลการทดสอบของตัวเอง ในแง่ของมนุษย์ AI ได้เริ่มสร้าง AI
Andrej Karpathy อดีตนักวิจัย OpenAI และผู้อํานวยการ Tesla AI ทวีตโดยตรงหลังจากอ่าน: “นี่เป็นสิ่งที่ใกล้เคียงที่สุดที่ฉันเคยเห็นกับฉาก AI ในนิยายวิทยาศาสตร์” การประเมินจากนักวิจัย AI ชั้นนํานี้มีน้ําหนักมาก เนื่องจาก Karpathy มีประสบการณ์หลายขั้นตอนสําคัญของการพัฒนา AI เป็นการส่วนตัว และการตัดสินของเขาขึ้นอยู่กับความเข้าใจทางเทคนิคอย่างลึกซึ้ง
AI ทําซ้ําด้วยตัวเองนี่ไม่ใช่วาทศิลป์ทางการตลาด ตามการเปิดเผยภายในของ OpenAI GPT-5.3-Codex ได้ทําสิ่งเหล่านี้ในระหว่างกระบวนการพัฒนา: วิเคราะห์การทดสอบที่ล้มเหลวในการตั้งค่าสถานะบันทึกการฝึกอบรม แนะนําการแก้ไขสําหรับสคริปต์และโปรไฟล์การฝึกอบรม สิ่งนี้หมายความว่าอย่างไร AI ไม่ได้เป็นเพียงเครื่องมืออีกต่อไป แต่เริ่มเป็นส่วนหนึ่งของทีมพัฒนา และเป็นประเภทที่สามารถปรับปรุงตัวเองได้
ความสามารถในการมีส่วนร่วมในการพัฒนานี้ผลักดันผ่านการวางตําแหน่ง AI แบบดั้งเดิม ในอดีต โมเดล AI ได้รับการออกแบบ ฝึกอบรม และปรับใช้โดยมนุษย์ทั้งหมด และ AI เป็นผลิตภัณฑ์แบบพาสซีฟ ตอนนี้ GPT-5.3 มีบทบาทอย่างแข็งขันในการเกิดของตัวเอง และในขณะที่ยังอยู่ภายใต้การดูแลของมนุษย์ มันบอกเป็นนัยถึงความเป็นไปได้: โมเดล AI ในอนาคตอาจได้รับการออกแบบและปรับให้เหมาะสมโดย AI เองเป็นส่วนใหญ่ โดยมนุษย์จะให้ทิศทางและการตรวจสอบขั้นสุดท้ายเท่านั้น
วิเคราะห์บันทึกการฝึกอบรม: ตั้งค่าสถานะการทดสอบที่ล้มเหลวโดยอัตโนมัติเพื่อระบุความผิดปกติระหว่างการฝึกอบรม
แผนการซ่อมที่แนะนํา: แนะนําการปรับปรุงสคริปต์การฝึกอบรมและโปรไฟล์
สร้างสูตรการปรับใช้: ทําให้กระบวนการปรับใช้เป็นแบบอัตโนมัติและลดการดําเนินการด้วยตนเอง
สรุปความผิดปกติของการประเมิน: จัดระเบียบผลการประเมินที่ซับซ้อนเป็นรายงานที่มนุษย์เข้าใจได้
บทความ SEAL ล่าสุดที่ตีพิมพ์โดย MIT (arXiv:2506.10943) อธิบายถึงสถาปัตยกรรม AI ที่เรียนรู้อย่างต่อเนื่องหลังจากการปรับใช้ พัฒนาตัวเองโดยไม่ต้องฝึกอบรมใหม่ โดยเฉพาะอย่างยิ่ง นักวิจัย SEAL บางคนได้เข้าร่วม OpenAI แล้ว ซึ่งหมายความว่า AI ได้เปลี่ยนจาก “เครื่องมือคงที่” เป็น “ระบบไดนามิก” การเรียนรู้ไม่ได้หยุดอยู่ที่การปรับใช้อีกต่อไป และขอบเขตของการอนุมานและการฝึกอบรมกําลังละลาย GPT-5.3 อาจเป็นแอปพลิเคชั่นเชิงพาณิชย์ครั้งแรกของสถาปัตยกรรมใหม่นี้
เมื่อวันที่ 5 กุมภาพันธ์ OpenAI และ Anthropic ต่างก็เปิดตัวโมเดลรุ่นใหม่ห่างกันเพียง 20 นาที ขั้นแรก Anthropic เปิดตัว Claude Opus 4.6 จากนั้น OpenAI ก็เปิดตัว GPT-5.3-Codex เนื่องจาก OpenAI ต้องการใช้ GPT-5.3-Codex เพื่อซุ่มยิงโมเดลใหม่ของผู้อื่น จึงต้องมีความสามารถบางอย่าง ข้อมูลไม่ได้โกหก GPT-5.3-Codex สร้างสถิติใหม่ในเกณฑ์มาตรฐานอุตสาหกรรมหลายแห่งทันทีที่เปิดตัว
Terminal-Bench 2.0 ทดสอบความสามารถในการปฏิบัติงานของ AI ในสภาพแวดล้อมเทอร์มินัลจริง คอมไพล์โค้ด โมเดลการฝึกอบรม และการกําหนดค่าเซิร์ฟเวอร์ GPT-5.3-Codex ได้คะแนน 77.3% ในขณะที่ GPT-5.2-Codex มีเพียง 64.0% และ Claude Opus 4.6 รายงาน 65.4% นี่เป็นการเพิ่มขึ้น 13 เปอร์เซ็นต์ระหว่างรุ่น ซึ่งเป็นการก้าวกระโดดครั้งใหญ่ในด้าน AI การเปรียบเทียบ 77.3% กับ 65.4% แสดงให้เห็นว่า GPT-5.3 สร้างข้อได้เปรียบที่สําคัญในงานวิศวกรรมในโลกแห่งความเป็นจริง
SWE-Bench Pro เป็นเกณฑ์มาตรฐานที่ออกแบบมาโดยเฉพาะเพื่อทดสอบความสามารถทางวิศวกรรมซอฟต์แวร์ในโลกแห่งความเป็นจริง ซึ่งครอบคลุมภาษาโปรแกรมสี่ภาษา: Python, JavaScript, Go และ Ruby GPT-5.3-Codex ได้คะแนน 56.8% แซงหน้า 56.4% ของ GPT-5.2-Codex รุ่นก่อน และยังคงรักษาตําแหน่งที่หนึ่งในอุตสาหกรรมอย่างต่อเนื่อง ที่สําคัญกว่านั้น OpenAI เปิดเผยว่า GPT-5.3-Codex ใช้โทเค็นเอาต์พุตจํานวนน้อยที่สุดของโมเดลใดๆ เมื่อถึงคะแนนนี้ ซึ่งหมายความว่าไม่เพียงแต่แม่นยําแต่ยังมีประสิทธิภาพอีกด้วย
OSWorld-Verified ทดสอบความสามารถของ AI ในการทํางานด้านประสิทธิภาพการทํางานให้เสร็จสมบูรณ์ในสภาพแวดล้อมเดสก์ท็อปแบบภาพ GPT-5.3-Codex ได้คะแนน 64.7% เทียบกับค่าเฉลี่ยของมนุษย์ที่ 72% ซึ่งหมายความว่าได้เข้าใกล้ประสิทธิภาพของคนธรรมดาในงานการทํางานของคอมพิวเตอร์เกือบสองเท่าจากรุ่นก่อน ประสิทธิภาพที่ใกล้เคียงกับมนุษย์นี้ทําให้ AI สามารถทํางานในสํานักงานได้อย่างแท้จริงเป็นครั้งแรก แทนที่จะเป็นเพียงเครื่องมือเสริม
สิ่งที่น่าสังเกตยิ่งกว่านั้นคือ Claude Opus 4.6 รองรับหน้าต่างบริบทโทเค็น 100K (เบต้า) เป็นครั้งแรกในโมเดลระดับ Opus ซึ่งสามารถประมวลผลโค้ดเบสทั้งหมดหรือเอกสารหลายร้อยหน้าพร้อมกัน และเปิดตัวฟังก์ชัน Agent Teams ซึ่งตัวแทน AI หลายคนสามารถทํางานร่วมกันในการเขียนโปรแกรม ทดสอบ และเขียนเอกสารได้ในเวลาเดียวกัน
เมื่อ OpenAI และ Anthropic เปิดตัวโมเดลเรือธงในวันเดียวกันและในเวลาเดียวกัน การแข่งขันครั้งนี้ไม่ได้เป็นเพียงการแข่งขันทางเทคนิคอีกต่อไป แต่เป็นการต่อสู้เพื่อแย่งชิงรูปร่างในอนาคตของ AI: เส้นทาง “วิวัฒนาการตนเอง” ของ OpenAI หรือเส้นทาง “การทํางานร่วมกันของตัวแทนหลายคน” ของ Anthropic กลยุทธ์ของ OpenAI คือการทําให้ AI ตัวเดียวมีประสิทธิภาพมากขึ้นและแม้กระทั่งปรับปรุงตัวเอง กลยุทธ์ของ Anthropic คือการอนุญาตให้ AI หลายตัวทํางานร่วมกันในงานที่ซับซ้อนผ่านการแบ่งงานและการทํางานร่วมกัน
บริบทของโทเค็น 100K เป็นความก้าวหน้าทางเทคโนโลยี ซึ่งเทียบเท่ากับคําภาษาอังกฤษประมาณ 75 ล้านคําหรืออักขระภาษาจีน 300 ตัว ซึ่งเพียงพอที่จะพอดีกับโค้ดทั้งหมดของโครงการซอฟต์แวร์ขนาดกลางหรือเอกสารทางเทคนิคแบบหนา ความสามารถนี้ช่วยให้ Claude สามารถ “มองเห็น” โครงการทั้งหมดแทนที่จะเป็นความเข้าใจที่แยกส่วน สําหรับการวิเคราะห์สถาปัตยกรรมและการปรับโครงสร้างของโครงการขนาดใหญ่มุมมองระดับโลกนี้มีความสําคัญ
Agent Teams นําแนวคิดของการทํางานร่วมกันมาสู่ AI เอเจนต์คนหนึ่งเขียนโค้ด อีกคนหนึ่งทําการทดสอบ และคนที่สามเขียนเอกสาร และพวกเขาสามารถสื่อสารและประสานงานกันได้ รูปแบบนี้เลียนแบบวิธีการทํางานของทีมซอฟต์แวร์ของมนุษย์ และอาจเหมาะกับบางสถานการณ์มากกว่า Super AI เพียงตัวเดียว อย่างไรก็ตาม การทํางานร่วมกันของตัวแทนหลายคนยังทําให้เกิดความซับซ้อนใหม่ๆ เช่น วิธีประสานงาน วิธีหลีกเลี่ยงความขัดแย้ง และวิธีรับรองความสอดคล้องกัน
ทั้งสองเส้นทางมีข้อดีและข้อเสีย เส้นทางวิวัฒนาการตนเองของ OpenAI นั้นก้าวร้าวมากขึ้น และหากประสบความสําเร็จ อาจนําไปสู่การปรับปรุงความสามารถแบบทวีคูณ แต่ก็อาจควบคุมไม่ได้เช่นกัน เส้นทางหลายตัวแทนของ Anthropic นั้นอนุรักษ์นิยมมากกว่า โดยลดความเสี่ยงจุดเดียวโดยการกระจายความสามารถ แต่ต้นทุนการประสานงานสามารถจํากัดประสิทธิภาพได้ เมื่อ AI เริ่มมีวิวัฒนาการในป่าคําถามเกี่ยวกับการกํากับดูแลจะเปลี่ยนจาก “ฉลาดแค่ไหน” เป็น “เราจะจัดการระบบที่เปลี่ยนแปลงตลอดเวลาได้อย่างไร” และเมื่อบริษัท AI ชั้นนําสองแห่งเปิดตัวโมเดลที่ก้าวล้ําติดต่อกันภายใน 20 นาที กรอบเวลาที่เหลือสําหรับการคิดและการเตรียมการของมนุษย์จะหดตัวลงด้วยความเร็วที่มองเห็นได้ด้วยตาเปล่า
btc.bar.articles
ปริมาณการซื้อขายน้ำมัน Hyperliquid แตะ 1.2 พันล้านดอลลาร์ ท่ามกลางความขัดแย้งของอิหร่าน
iShares ETF เกาหลีเช้านี้ปิดบวก 5.6% สองที่อยู่ที่เกี่ยวข้องกันตามติดการซื้อเพิ่มและถือครองรวม 3.7 ล้านดอลลาร์สหรัฐ
อัยการเกาหลีใต้ขายคืนบิทคอยน์ที่ถูกขโมยจำนวน 320.8 เหรียญ และนำเงินสด 21.5 ล้านดอลลาร์สหรัฐเข้าคลังหลวง
CFTC: สหรัฐกำลังกลายเป็น “ศูนย์กลางคริปโต” ทั่วโลก
คำเตือนของ Robert Kiyosaki: Bitcoin, เงินสเตอร์ลิง และน้ำมัน คือเกราะป้องกันเดียวของคุณจากการล่มสลายของหนี้สินที่จะมาถึง
ตลาดหุ้นยุโรปราคาพุ่งขึ้นอย่างมาก ดัชนีสต็อก 50 เพิ่มขึ้นเกือบ 3%