Intel ยิง Xeon Max CPU, GPUs เพื่อแข่งขันกับ AMD, Nvidia ⋆ World Blogs

Intel ยิง Xeon Max CPU, GPUs เพื่อแข่งขันกับ AMD, Nvidia

10/11/2022

เพียงไม่กี่วันก่อน Supercomputing 22 จะเริ่มขึ้น Intel ได้เปิดตัวXeon Max CPU

เจเนอเรชันถัดไป ซึ่งก่อนหน้านี้มีชื่อรหัสว่าSapphire Rapids HBMและ Data Center GPU Max Series ประมวลผล GPU หรือที่รู้จักในชื่อPonte Vecchio ผลิตภัณฑ์ใหม่นี้รองรับเวิร์กโหลดการประมวลผลประสิทธิภาพสูงประเภทต่างๆ หรือทำงานร่วมกันเพื่อแก้ปัญหาซูเปอร์คอมพิวเตอร์ที่ซับซ้อนที่สุด

บทความอื่น ๆ : ksfuerte.com

Xeon Max CPU: Sapphire Rapids รับ 64GB ของ HBM2Eโปรเซสเซอร์ x86 สำหรับใช้งานทั่วไปได้ถูกนำมาใช้ในการคำนวณทางเทคนิคแทบทุกประเภทมาเป็นเวลาหลายสิบปี ดังนั้นจึงสนับสนุนการใช้งานจำนวนมาก อย่างไรก็ตาม แม้ว่าประสิทธิภาพของคอร์ CPU ที่ใช้งานทั่วไปจะเพิ่มขึ้นอย่างรวดเร็วเป็นเวลาหลายปี โปรเซสเซอร์ในปัจจุบันมีข้อจำกัดที่สำคัญสองประการเกี่ยวกับประสิทธิภาพในปัญญาประดิษฐ์และเวิร์กโหลด HPC: การทำคู่ขนานและแบนด์วิดท์หน่วยความจำ โปรเซสเซอร์ Xeon Max ‘Sapphire Rapids HBM’ ของ Intel สัญญาว่าจะลบขอบเขตทั้งสองออก

โปรเซสเซอร์ Xeon Max ของ Intel มีแกน Golden Cove ที่มีประสิทธิภาพสูงถึง 56 ตัว (กระจายมากกว่าสี่ชิปเล็ตที่เชื่อมต่อกันโดยใช้เทคโนโลยี EMIB ของ Intel) ที่ได้รับการปรับปรุงเพิ่มเติมด้วยเอ็นจิ้นการเร่งความเร็วหลายตัวสำหรับเวิร์คโหลด AI และ HPC และหน่วยความจำ HBM2E บนแพ็คเกจ 64GB เช่นเดียวกับซีพียู Sapphire Rapids อื่น ๆ Xeon Max จะยังคงสนับสนุนหน่วยความจำ DDR5 แปดช่องสัญญาณและอินเทอร์เฟซ PCIe Gen 5 ที่มีโปรโตคอล CXL 1.1 อยู่ด้านบน ดังนั้นจึงสามารถใช้ตัวเร่งความเร็วที่เปิดใช้งาน CXL ได้ทั้งหมดเมื่อเหมาะสม

หน่วยความจำ HBM2E บนแพ็คเกจ 64GB (สี่กอง 16GB) ให้แบนด์วิดธ์สูงสุดประมาณ 1TB/s ซึ่งแปลเป็น ~1.14GB ของ HBM2E ต่อคอร์ที่ 18.28 GB/s ต่อคอร์ ในการใส่ตัวเลขลงในบริบท โปรเซสเซอร์ Sapphire Rapids 56 คอร์ ที่ ติดตั้งโมดูล DDR5-4800 แปดโมดูล จะได้รับแบนด์วิดธ์สูงถึง

307.2 GB/s ซึ่งหมายถึง 5.485 GB/s ต่อคอร์ ในขณะเดียวกัน Xeon Max สามารถใช้หน่วยความจำ HBM2E ได้หลายวิธี: ใช้เป็นหน่วยความจำระบบซึ่งไม่จำเป็นต้องเปลี่ยนรหัส ใช้เป็นแคชประสิทธิภาพสูงสำหรับระบบย่อยหน่วยความจำ DDR5 ซึ่งไม่ต้องการรหัสเปลี่ยน ใช้เป็นส่วนหนึ่งของพูลหน่วยความจำแบบรวม (โหมดแบน HBM) ซึ่งเกี่ยวข้องกับการปรับซอฟต์แวร์ให้เหมาะสม

ขึ้นอยู่กับเวิร์กโหลด โปรเซสเซอร์ XeonMaxที่เปิดใช้งานAMXของIntelสามารถให้การปรับปรุงประสิทธิภาพ 3X – 5.3X เหนือโปรเซสเซอร์ Xeon Scalable 8380 ที่มีอยู่ในปัจจุบันซึ่งใช้การประมวลผลFP32 ทั่วไปสำหรับเวิร์กโหลดเดียวกัน ในขณะเดียวกัน ในแอปพลิเคชันต่างๆเช่นการพัฒนาแบบจลองสำหรับไดนามิกระดับโมเลกุล ซีพียูที่ติดตั้ง HBM2E ใหม่นั้นเร็วกว่าEPYC 7773X ของ AMDสูงสุดถึง2.8เท่าซึ่งมีฟีเจอร์3DV-Cache

แต่ HBM2E มีนัยสำคัญอีกประการหนึ่งสำหรับ Intel เนื่องจากช่วยลดค่าใช้จ่ายในการเคลื่อนย้ายข้อมูลระหว่าง CPU และ GPU ซึ่งจำเป็นสำหรับปริมาณงาน HPC ต่างๆ มันนำเราไปสู่การประกาศครั้งที่สองของวันนี้: Data Center GPU Max Series ประมวลผล GPU

เนื่องจากมีทรานซิสเตอร์มากกว่า 100 พันล้านตัว (ไม่รวม หน่วยความจำ) มากกว่า 47 แผ่น (รวม 8 แผ่น HBM2E) นอกจากนี้ ผลิตภัณฑ์นี้ใช้เทคโนโลยีบรรจุภัณฑ์ขั้นสูงของ Intel อย่างกว้างขวาง (เช่น EMIB) เนื่องจากผู้ผลิตรายอื่นผลิตแผ่นกระเบื้องที่แตกต่างกันโดยใช้เทคโนโลยีกระบวนการที่แตกต่างกัน