Intel ยิง Xeon Max CPU, GPUs เพื่อแข่งขันกับ AMD, Nvidia

เพียงไม่กี่วันก่อน Supercomputing 22 จะเริ่มขึ้น Intel ได้เปิดตัวXeon Max CPU

เจเนอเรชันถัดไป ซึ่งก่อนหน้านี้มีชื่อรหัสว่าSapphire Rapids HBMและ Data Center GPU Max Series ประมวลผล GPU หรือที่รู้จักในชื่อPonte Vecchio ผลิตภัณฑ์ใหม่นี้รองรับเวิร์กโหลดการประมวลผลประสิทธิภาพสูงประเภทต่างๆ หรือทำงานร่วมกันเพื่อแก้ปัญหาซูเปอร์คอมพิวเตอร์ที่ซับซ้อนที่สุด

แทงบอล

Xeon Max CPU: Sapphire Rapids รับ 64GB ของ HBM2Eโปรเซสเซอร์ x86 สำหรับใช้งานทั่วไปได้ถูกนำมาใช้ในการคำนวณทางเทคนิคแทบทุกประเภทมาเป็นเวลาหลายสิบปี ดังนั้นจึงสนับสนุนการใช้งานจำนวนมาก อย่างไรก็ตาม แม้ว่าประสิทธิภาพของคอร์ CPU ที่ใช้งานทั่วไปจะเพิ่มขึ้นอย่างรวดเร็วเป็นเวลาหลายปี โปรเซสเซอร์ในปัจจุบันมีข้อจำกัดที่สำคัญสองประการเกี่ยวกับประสิทธิภาพในปัญญาประดิษฐ์และเวิร์กโหลด HPC: การทำคู่ขนานและแบนด์วิดท์หน่วยความจำ โปรเซสเซอร์ Xeon Max ‘Sapphire Rapids HBM’ ของ Intel สัญญาว่าจะลบขอบเขตทั้งสองออก

โปรเซสเซอร์ Xeon Max ของ Intel มีแกน Golden Cove ที่มีประสิทธิภาพสูงถึง 56 ตัว (กระจายมากกว่าสี่ชิปเล็ตที่เชื่อมต่อกันโดยใช้เทคโนโลยี EMIB ของ Intel) ที่ได้รับการปรับปรุงเพิ่มเติมด้วยเอ็นจิ้นการเร่งความเร็วหลายตัวสำหรับเวิร์คโหลด AI และ HPC และหน่วยความจำ HBM2E บนแพ็คเกจ 64GB เช่นเดียวกับซีพียู Sapphire Rapids อื่น ๆ Xeon Max จะยังคงสนับสนุนหน่วยความจำ DDR5 แปดช่องสัญญาณและอินเทอร์เฟซ PCIe Gen 5 ที่มีโปรโตคอล CXL 1.1 อยู่ด้านบน ดังนั้นจึงสามารถใช้ตัวเร่งความเร็วที่เปิดใช้งาน CXL ได้ทั้งหมดเมื่อเหมาะสม

หน่วยความจำ HBM2E บนแพ็คเกจ 64GB (สี่กอง 16GB) ให้แบนด์วิดธ์สูงสุดประมาณ 1TB/s ซึ่งแปลเป็น ~1.14GB ของ HBM2E ต่อคอร์ที่ 18.28 GB/s ต่อคอร์ ในการใส่ตัวเลขลงในบริบท โปรเซสเซอร์ Sapphire Rapids 56 คอร์ ที่ ติดตั้งโมดูล DDR5-4800 แปดโมดูล จะได้รับแบนด์วิดธ์สูงถึง

307.2 GB/s ซึ่งหมายถึง 5.485 GB/s ต่อคอร์ ในขณะเดียวกัน Xeon Max สามารถใช้หน่วยความจำ HBM2E ได้หลายวิธี: ใช้เป็นหน่วยความจำระบบซึ่งไม่จำเป็นต้องเปลี่ยนรหัส ใช้เป็นแคชประสิทธิภาพสูงสำหรับระบบย่อยหน่วยความจำ DDR5 ซึ่งไม่ต้องการรหัสเปลี่ยน ใช้เป็นส่วนหนึ่งของพูลหน่วยความจำแบบรวม (โหมดแบน HBM) ซึ่งเกี่ยวข้องกับการปรับซอฟต์แวร์ให้เหมาะสม

ขึ้นอยู่กับเวิร์กโหลด โปรเซสเซอร์ XeonMaxที่เปิดใช้งานAMXของIntelสามารถให้การปรับปรุงประสิทธิภาพ 3X – 5.3X เหนือโปรเซสเซอร์ Xeon Scalable 8380 ที่มีอยู่ในปัจจุบันซึ่งใช้การประมวลผลFP32 ทั่วไปสำหรับเวิร์กโหลดเดียวกัน ในขณะเดียวกัน ในแอปพลิเคชันต่างๆเช่นการพัฒนาแบบจลองสำหรับไดนามิกระดับโมเลกุล ซีพียูที่ติดตั้ง HBM2E ใหม่นั้นเร็วกว่าEPYC 7773X ของ AMDสูงสุดถึง2.8เท่าซึ่งมีฟีเจอร์3DV-Cache

แต่ HBM2E มีนัยสำคัญอีกประการหนึ่งสำหรับ Intel เนื่องจากช่วยลดค่าใช้จ่ายในการเคลื่อนย้ายข้อมูลระหว่าง CPU และ GPU ซึ่งจำเป็นสำหรับปริมาณงาน HPC ต่างๆ มันนำเราไปสู่การประกาศครั้งที่สองของวันนี้: Data Center GPU Max Series ประมวลผล GPU

เนื่องจากมีทรานซิสเตอร์มากกว่า 100 พันล้านตัว (ไม่รวม หน่วยความจำ) มากกว่า 47 แผ่น (รวม 8 แผ่น HBM2E) นอกจากนี้ ผลิตภัณฑ์นี้ใช้เทคโนโลยีบรรจุภัณฑ์ขั้นสูงของ Intel อย่างกว้างขวาง (เช่น EMIB) เนื่องจากผู้ผลิตรายอื่นผลิตแผ่นกระเบื้องที่แตกต่างกันโดยใช้เทคโนโลยีกระบวนการที่แตกต่างกัน

 

 

Releated