การตรวจสอบ AI เข้าสู่การปฏิบัติจริง OpenAI เปิดตัว EVMbench เสริมความแข็งแกร่งในการประเมินความปลอดภัยของสมาร์ทคอนแทรกต์

ETH-0.84%
WELL-0.02%

OpenAI ร่วมมือกับ Paradigm เปิดตัว EVMbench ทดสอบความสามารถในการโจมตีและป้องกันสัญญาอัจฉริยะบน EVM เผยความกังวลเกี่ยวกับจุดอ่อนและความแข็งแกร่งของการโจมตี

เน้นการทดสอบในสภาพแวดล้อมทางเศรษฐกิจ OpenAI ร่วมกับ Paradigm เสริมความปลอดภัยบนบล็อกเชน

ผู้นำด้านปัญญาประดิษฐ์ OpenAI ประกาศความร่วมมือกับบริษัทลงทุนในคริปโตเคอเรนซีชื่อดัง Paradigm และบริษัทด้านความปลอดภัย OtterSec เปิดตัวเครื่องมือทดสอบมาตรฐาน EVMbench ซึ่งออกแบบมาเพื่อประเมินประสิทธิภาพของ AI ตัวแทน (AI Agents) ในด้านความปลอดภัยของสัญญาอัจฉริยะบน Ethereum Virtual Machine (EVM)

ด้วยการบูรณาการอย่างลึกซึ้งระหว่าง AI กับเทคโนโลยีคริปโต สัญญาอัจฉริยะกลายเป็นโครงสร้างพื้นฐานสำคัญในการจัดการสินทรัพย์คริปโตเปิดจำนวนมากกว่า 1,000 พันล้านดอลลาร์ การเปิดตัวเครื่องมือนี้เป็นสัญญาณว่าอุตสาหกรรมเริ่มให้ความสนใจต่อความสามารถของ AI ในสภาพแวดล้อมที่มีความหมายทางเศรษฐกิจ

ทีมงาน OpenAI ชี้ว่า ด้วยความก้าวหน้าของ AI ตัวแทนในด้านการเขียนและวางแผนโค้ด ในอนาคตโมเดลเหล่านี้จะมีบทบาทเปลี่ยนแปลงทั้งด้านการโจมตีและการป้องกันบนบล็อกเชน ดังนั้น การสร้างมาตรฐานการประเมินผลจึงเป็นสิ่งสำคัญในการติดตามความก้าวหน้าของ AI

การทดสอบเชิงลึกใน 3 โหมด พร้อม 120 ช่องโหว่จากการตรวจสอบจริงกลายเป็นเกณฑ์วัดความสามารถของ AI

การออกแบบหลักของ EVMbench มุ่งเน้นไปที่การทดสอบ 120 ช่องโหว่ที่สกัดจากรายงานการตรวจสอบเชิงมืออาชีพจำนวน 40 รายการ ซึ่งข้อมูลมาจากการแข่งขันการตรวจสอบสาธารณะ เช่น Code4rena เพื่อให้แน่ใจว่าสภาพแวดล้อมการทดสอบใกล้เคียงกับความซับซ้อนในโลกจริง เครื่องมือนี้จะประเมิน AI ตัวแทนในสามโหมดการทำงาน:

ภาพประกอบ: การออกแบบหลักของ EVMbench ของ OpenAI คือการประเมิน AI ตัวแทนในสามโหมดการทำงาน

  • โหมดแรกคือ “ตรวจจับ (Detect)” ซึ่งให้ AI ตรวจสอบโค้ดสัญญาอัจฉริยะและระบุช่องโหว่ที่รู้จัก พร้อมให้คะแนนตามระดับความรุนแรงของปัญหา
  • โหมดที่สองคือ “แก้ไข (Patch)” ซึ่งท้าทาย AI ให้ลบช่องโหว่ที่สามารถโจมตีได้และแก้ไขโค้ดโดยไม่กระทบต่อฟังก์ชันเดิม
  • โหมดสุดท้ายคือ “ใช้ประโยชน์ (Exploit)” ซึ่งเป็นโหมดที่ถกเถียงกันมาก AI ต้องดำเนินการโจมตีขโมยเงินในสภาพแวดล้อม sandbox ของบล็อกเชนแบบ end-to-end

เพื่อความแน่นอนและความสามารถในการทำซ้ำ ทีมงานได้พัฒนาสถาปัตยกรรมการทดสอบบนภาษา Rust โดยใช้เทคนิคการเล่นธุรกรรมที่เป็นเอกลักษณ์เพื่อยืนยันว่าการโจมตีหรือการแก้ไขของ AI สำเร็จหรือไม่

แนวโน้มการโจมตีและการป้องกันชัดเจน GPT-5.3-Codex แสดงอัตราการเติบโตของการโจมตีที่น่าทึ่ง

ผลการทดสอบเบื้องต้นแสดงให้เห็นว่า AI มีความสามารถแตกต่างกันอย่างชัดเจนในแต่ละภารกิจ โดย GPT-5.3-Codex รุ่นล่าสุด ทำผลงานได้ดีในโหมดใช้ประโยชน์ (Exploit Mode) ด้วยคะแนนสูงถึง 72.2% ซึ่งสูงกว่ารุ่น GPT-5 ที่เปิดตัวเมื่อหกเดือนก่อนซึ่งได้เพียง 31.9% อย่างมาก

ภาพประกอบ: สรุปคะแนนของโมเดล AI ต่าง ๆ ของ OpenAI ในสามโหมด

สิ่งนี้แสดงให้เห็นว่า เมื่อเป้าหมายชัดเจนว่า “ขโมยเงิน” AI มีความสามารถในการวางแผนและดำเนินการอย่างมีประสิทธิภาพ อย่างไรก็ตาม ผลด้านการป้องกันกลับค่อนข้างอ่อนแอ AI มักจะหยุดการค้นหาเมื่อพบข้อผิดพลาดเพียงจุดเดียว และเมื่อแก้ไขความซับซ้อนของตรรกะ ก็ยังพบว่ามีความยากในการซ่อมแซมช่องโหว่โดยไม่ส่งผลกระทบต่อการทำงานของสัญญาอย่างสมบูรณ์ ผู้เชี่ยวชาญด้านความปลอดภัยแสดงความกังวลว่า AI อาจลดเวลาที่ใช้ในการค้นหาช่องโหว่และพัฒนาวิธีโจมตีลงอย่างมาก ซึ่งเป็นความท้าทายต่อความเร็วในการป้องกันของโปรเจกต์ DeFi

การรับสมัครบุคลากรและการสนับสนุนด้านการป้องกัน OpenAI วางแผนสร้างความปลอดภัยในระบบนิเวศ AI ตัวแทน

นอกจากการพัฒนาเครื่องมือแล้ว OpenAI ยังเน้นการวางกลยุทธ์ด้านบุคลากรและการป้องกันในระบบนิเวศ โดยล่าสุดได้ว่าจ้าง Peter Steinberger ผู้ก่อตั้งโครงการ AI ตัวแทนโอเพนซอร์ส OpenClaw เพื่อเป็นผู้นำในการพัฒนาตัวแทนส่วนบุคคลรุ่นใหม่ และเปลี่ยนโครงการนี้เป็นโมเดลกองทุนสนับสนุนโดย OpenAI

เพื่อรับมือกับความเสี่ยงด้านความปลอดภัยทางไซเบอร์ที่อาจเกิดจาก AI OpenAI สัญญาว่าจะใช้เงินสนับสนุน 10 ล้านดอลลาร์จากโครงการสนับสนุนด้านความปลอดภัยทางไซเบอร์ เพื่อสนับสนุนเครื่องมือป้องกันโอเพนซอร์สและการวิจัยโครงสร้างพื้นฐานสำคัญ เหตุการณ์นี้มีความสำคัญอย่างยิ่งหลังจากเหตุการณ์ในโปรโตคอล Moonwell ซึ่งเกิดความผิดพลาดในการคำนวณราคาด้วย AI ส่งผลให้เกิดความเสียหายประมาณ 1.78 ล้านดอลลาร์

อ่านเพิ่มเติม
ปฏิเสธข้อเสนอจาก Meta มูลค่าหลายพันล้านดอลลาร์ ผู้สร้าง OpenClaw เข้าร่วมชิงตำแหน่งใน OpenAI กระแสแรง? การคาดการณ์ของ Moonwell เกิดข้อผิดพลาด ทำให้เสียหาย 1.78 ล้านดอลลาร์ ใครจะรับผิดชอบ?

ในอนาคต เมื่อมีการเพิ่มตัวแทนชำระเงินแบบอัตโนมัติและกระเป๋าเงินอัจฉริยะที่ใช้ AI เข้าสู่ระบบนิเวศมากขึ้น การใช้เครื่องมือเช่น EVMbench เพื่อแยกแยะโมเดลที่สามารถอธิบายช่องโหว่ได้เพียงอย่างเดียว กับโมเดลที่สามารถให้แนวทางป้องกันที่เชื่อถือได้ จะกลายเป็นจุดเปลี่ยนสำคัญในอุตสาหกรรมความปลอดภัยของบล็อกเชน

ดูต้นฉบับ
news.article.disclaimer

btc.bar.articles

หุ้นเบรเราร่วงลงท่ามกลางการเปลี่ยนทิศทางของ Solana ที่เพิ่มขึ้น ขณะที่บริษัท 'Solmate' ขายทีมฟุตบอล

โดยสรุป หุ้นของ Brera Holdings (SLMT) ร่วงลงกว่า 19% ในวันพุธ บริษัทประกาศความตั้งใจที่จะเปลี่ยนโฟกัสไปที่บริษัทโครงสร้างพื้นฐาน Solana ที่เน้นในสหรัฐอาหรับเอมิเรตส์ในช่วงเย็นวันอังคาร หนึ่งในผู้ถือหุ้นสถาบันรายใหญ่ที่สุดของบริษัท, Ark Invest, เริ่มขายส่วนเล็กน้อยของหุ้นของตน

Decrypt6 นาที ที่แล้ว

Société Générale-FORGE ขยายสกุลเงินดิจิทัลเสถียรภาพ EURCV ไปยังเครือข่าย Stellar ภายใต้กฎระเบียบ MiCA

Société Générale-FORGE ได้ขยายสกุลเงินดิจิทัลเสถียรภาพ EUR CoinVertible ซึ่งสนับสนุนยูโร ไปยังบล็อกเชน Stellar เพื่อเสริมกลยุทธ์หลายสายโซ่และเปิดโอกาสให้เข้าถึงสกุลเงินดิจิทัลที่เป็นไปตามข้อบังคับมากขึ้น การเติบโตนี้มีเป้าหมายเพื่อเชื่อมโยงการเงินแบบดั้งเดิมกับเทคโนโลยีบล็อกเชนและสนับสนุนระเบียบข้อบังคับ MiCA ของสหภาพยุโรป

CryptometerIo59 นาที ที่แล้ว

DoubleZero เปิดตัวแพลตฟอร์มส่งมอบข้อมูลตลาดแบบเรียลไทม์ DoubleZero Edge

DoubleZero เปิดตัวแพลตฟอร์มส่งมอบข้อมูลตลาดแบบเรียลไทม์ DoubleZero Edge เมื่อวันที่ 11 มีนาคม เพื่อให้บริการส่งข้อมูลความเร็วสูงแก่เทรดเดอร์ แพลตฟอร์มนี้ใช้เทคโนโลยี multicast เพื่อรับประกันสภาพแวดล้อมการแข่งขันที่เป็นธรรม ตั้งแต่ Epoch 939 เป็นต้นไป ผู้ตรวจสอบจะได้รับการยกเว้นค่าธรรมเนียมรางวัลบล็อก 5% และสามารถสร้างรายได้เพิ่มเติมโดยการเผยแพร่ shreds

GateNews1 ชั่วโมง ที่แล้ว

คาร์ดาโนแนะนำโทเค็นโปรแกรมได้ด้วยมาตรฐาน CIP-0113 ใหม่

มูลนิธิ Cardano ได้ปล่อย CIP-0113 ซึ่งอนุญาตให้ผู้ออกโทเค็นฝังตรรกะการปฏิบัติตามกฎระเบียบที่สามารถบังคับใช้ได้โดยตรงกับสินทรัพย์พื้นเมืองบนเครือข่าย เป้าหมายคือเพื่อเสริมสร้างการสร้างโทเค็นที่อยู่ภายใต้กฎระเบียบ เนื่องจากสถาบันต่างๆ เรียกร้องให้มีโทเค็นที่สามารถบังคับใช้คุณสมบัติเช่น KYC และ AML

CryptoNewsFlash1 ชั่วโมง ที่แล้ว

Across Protocol เสนอข้อเสนอการตรวจสอบอุณหภูมิ เพื่อสำรวจการเปลี่ยนแปลงเป็นบริษัทประเภท C ของสหรัฐอเมริกาและโครงสร้างหุ้นส่วน

Across Protocol เสนอข้อเสนอการตรวจสอบอุณหภูมิ โดยวางแผนเปลี่ยนโครงสร้าง DAO และโทเค็นเดิมให้เป็นบริษัทประเภท C ของสหรัฐอเมริกา ผู้ถือโทเค็น ACX สามารถแลกเปลี่ยนหุ้นตามสัดส่วนหรือไถ่ถอนเป็น USDC ได้ ผู้ถือสามารถเลือกวิธีเข้าร่วมที่แตกต่างกันตามขนาดของตนเอง

GateNews1 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น