วีดีโอ: Using A Supercomputer (ธันวาคม 2024)
เมื่อฉันดูการประกาศและการดำเนินการของการประชุม Supercomputing 15 (SC15) ของเดือนที่แล้วใน Austin เมื่อเดือนที่แล้วปรากฏว่าในขณะที่การคำนวณประสิทธิภาพสูงอาจอยู่ในช่วงกล่อมเล็กน้อยตลาดเป็นตลาดสำหรับการเปลี่ยนแปลงครั้งใหญ่ในปีที่ผ่านมา มา.
หากคุณดูผู้นำในรายชื่อ 500 อันดับแรกรายชื่อคอมพิวเตอร์ที่เร็วที่สุดในโลกปีละสองครั้งผู้นำอันดับที่หกติดต่อกันคือ Tianhe-2 ซูเปอร์คอมพิวเตอร์ที่สร้างโดยมหาวิทยาลัยเทคโนโลยีแห่งชาติของจีน ตามรายการ top500 เครื่องนี้ให้ 33.86 petaflop / s (quadrillions ของการคำนวณต่อวินาที) ของประสิทธิภาพการทำงานที่ยั่งยืนบนมาตรฐาน Linpack และ 54.9 petaflop / s ของประสิทธิภาพสูงสุดตามทฤษฎี สิ่งนี้ขึ้นอยู่กับโปรเซสเซอร์ Intel Xeon และ Xeon Phi
อันดับที่สองยังคงดำเนินต่อไปที่ Titan ซึ่งเป็นระบบ Cray XK7 ซึ่งใช้ CPU AMD Opteron และ Nvidia K20x GPUs ที่ติดตั้งที่ Oak Ridge National Laboratory ของ DOE ที่ 17.59 petaflop / s ประสิทธิภาพที่ยั่งยืนบนมาตรฐาน Linpack
เครื่องใหม่สองเครื่องที่แตกเป็น 10 อันดับแรกคอมพิวเตอร์ทรีนีตี้ที่ห้องปฏิบัติการแห่งชาติลอเรนซ์ลิเวอร์โมร์ (LLNL) อยู่ที่อันดับที่ 8.1 Petaflop / s ในขณะที่ระบบ Hazel-Hen ที่Höchstleistungsrechenzentrum Stuttgart (HLRS) ทั้งสองเป็นเครื่อง Cray XC ซึ่งใช้โปรเซสเซอร์ Intel Xeon ที่มีการเชื่อมต่อระหว่าง Aries
การเปลี่ยนแปลงที่ใหญ่กว่านั้นเกิดขึ้นในรายการโดยเฉพาะอย่างยิ่งเมื่อระบบจีนมีจำนวนเพิ่มขึ้นอย่างมากซึ่งเพิ่มขึ้นเป็น 109 เทียบกับเพียงแค่ 37 รายการในรายการก่อนหน้า ในส่วนนี้น่าจะมาจากระบบภาษาจีนเพิ่มเติมที่ใช้การวัดประสิทธิภาพและการส่งผลลัพธ์สำหรับรายการ เป็นผลให้จำนวนระบบของสหรัฐอเมริกาลดลงจาก 231 เป็น 200 ซึ่งเป็นจำนวนที่ต่ำที่สุดนับตั้งแต่รายการเริ่มต้นในปี 1993 และจำนวนระบบยุโรปลดลงจาก 141 เป็น 108
แนวโน้มใหญ่อย่างหนึ่งคือการเพิ่มจำนวนของระบบที่ใช้ตัวเร่งความเร็วหรือตัวประมวลผลร่วมซึ่งเพิ่มขึ้นเป็น 104 ระบบในรายการปัจจุบันเพิ่มขึ้นจาก 90 ในเดือนกรกฎาคม ระบบส่วนใหญ่ใช้ Nvidia Tesla GPUs ตามด้วยโปรเซสเซอร์ร่วม Xeon Phi ของ Intel โดยมีเพียงไม่กี่ตัวที่ใช้งานร่วมกัน Nvidia ชี้ให้เห็นว่ามันอยู่ใน 70 ระบบเหล่านี้รวมถึง 23 จาก 24 ระบบใหม่ในรายการ
ในงานแสดง Nvidia เน้นการเติบโตของเครื่องเร่งความเร็วและโดยเฉพาะอย่างยิ่งจำนวนแอพพลิเคชั่นที่สามารถปรับให้เหมาะสมสำหรับสถาปัตยกรรม CUDA ของ บริษัท บริษัท บอกว่า 90% ของ 10 อันดับแรกของแอพพลิเคชั่นการประมวลผลประสิทธิภาพสูงและ 70% ของ 50 อันดับแรกกำลังเร่งขึ้น การใช้งานที่น่าสนใจอย่างหนึ่งสำหรับระบบที่ใช้การจำลองสภาพอากาศซึ่งเป็นแอปพลิเคชั่นที่สำคัญสำหรับการคำนวณประสิทธิภาพสูงเนื่องจากการพยากรณ์อากาศนั้นผลิตโดยรัฐบาลทุกประเภท ก่อนหน้านี้เครย์ชี้ไปที่การใช้เครื่องเร่งความเร็วดังกล่าวที่สำนักงานอุตุนิยมวิทยาสวิส (MeteoSwiss) และได้พูดคุยเกี่ยวกับวิธีการทำงานร่วมกับนักวิจัยในสวิตเซอร์แลนด์ในการเขียนแอปพลิเคชั่นหลายตัว Nvidia กำลังชี้ไปที่การใช้เครื่องเร่งความเร็วโดย National Oceanic and Atmospheric Administration (NOAA) สำหรับการพยากรณ์อากาศเช่นกัน
ในบรรดาแอปพลิเคชันอื่น ๆ Cray โน้มน้าวแอปพลิเคชันน้ำมันและก๊าซเช่นการใช้ธรณีฟิสิกส์ 3 มิติเพื่อจำลองอ่างเก็บน้ำรวมถึงบริการทางการเงินเช่นการประเมินความเสี่ยง แอปพลิเคชันดังกล่าวไม่ได้สร้างระบบที่เร็วที่สุดในโลก แต่เป็นข้อบ่งชี้ว่าการใช้คอมพิวเตอร์ประสิทธิภาพสูงนั้นมีบทบาทที่กว้างขึ้นในแอพพลิเคชั่นขององค์กร เครย์ได้พูดคุยเกี่ยวกับความก้าวหน้าอย่างต่อเนื่องในการใช้แบบจำลองที่มีขนาดใหญ่ขึ้นและมีรายละเอียดมากขึ้นในทุกสาขาวิชาวิทยาศาสตร์และวิศวกรรมรวมถึงการรวมปริมาณงานดั้งเดิมกับการวิเคราะห์
ฉันยังสนใจในการประกาศโดย Linux Foundation ของความพยายามใหม่ที่เรียกว่า OpenHPC ซึ่งออกแบบมาเพื่อสร้างมาตรฐานแบบเปิดมากขึ้นในโลก HPC มันเป็นความคิดที่น่าสนใจและเป็นเรื่องที่ดูเหมือนว่าจะมีผู้เล่นรายใหญ่มากมายที่ลงชื่อเข้าใช้
มีระบบใหม่จำนวนมากในการทำงาน IBM กำลังสร้างเครื่องใหม่ชื่อ Summit ที่ห้องปฏิบัติการแห่งชาติ Oak Ridge (ORNL) และอีกห้องหนึ่งเรียกว่า Sierra at Lawrence Livermore ห้องปฏิบัติการแห่งชาติ (LLNL) ทั้งสองตั้งอยู่บนสถาปัตยกรรมของ IBM Power CPU, Nvidia Tesla GPU และ Mellanox interconnects การประชุมสุดยอดคาดว่าจะส่งมอบ 150 ถึง 300 สูงสุดของ petaflop / s และ Sierra มากกว่า 100 petaflop / s
นอกจากนี้ Intel และ Cray กำลังสร้างเครื่องจักรใหม่ที่เรียกว่าออโรร่าโดยใช้หน่วยประมวลผลของอัศวินฮิลล์ Intel Xeon Phi สำหรับ Argonne Leadership Computing Facility (ส่วนหนึ่งของ Argonne National Labs) ซึ่งมีเป้าหมายสำหรับ 150 petaflops ในปี 2018 ทั้งหมดนี้ เป็นส่วนหนึ่งของโครงการพลังงานของกระทรวงพลังงานที่รู้จักกันในชื่อการทำงานร่วมกันของโอ๊กริดจ์, อาร์กอนและลอเรนซ์ลิเวอร์มอร์ (CORAL) ห้องปฏิบัติการแห่งชาติมุ่งเป้าไปที่การเร่งพัฒนาประสิทธิภาพสูง - คอมพิวเตอร์
ถึงกระนั้นเรายังมีอีกหลายทางที่จะเดินทางไปสู่
ในระหว่างนี้มีการประกาศตัวประมวลผลหลายตัวที่สามารถลางดีสำหรับอนาคต โดยเฉพาะอย่างยิ่ง Nvidia ได้ผลักดันการใช้ซูเปอร์คอมพิวเตอร์สำหรับแอปพลิเคชั่นเว็บที่มีประสิทธิภาพมากโดยเฉพาะอย่างยิ่งการเรียนรู้ของเครื่อง ได้ประกาศผลิตภัณฑ์ที่มีราคาต่ำกว่าเล็กน้อย: บอร์ด Tesla M40 ที่มี 3072 CUDA แกนซึ่งกล่าวว่าสามารถทำงานได้ที่ 7 teraflop / s ที่มีความแม่นยำเดียวโดยมีจุดประสงค์หลักในการฝึกอบรม "การเรียนรู้ลึก" และ M4 บอร์ดพลังงานต่ำที่มี 1024 คอร์และ 2.2 เทราฟลอปที่มีความแม่นยำเดียวซึ่งสามารถใช้สำหรับการอนุมานการเรียนรู้เชิงลึกรวมถึงสิ่งต่าง ๆ เช่นการประมวลผลภาพและวิดีโอ นอกจากนี้ บริษัท ยังได้ประกาศ "hyperscale suite" ใหม่ที่มีแอพพลิเคชั่นที่มุ่งไปยังเว็บไซต์คอมพิวเตอร์ที่ใหญ่ที่สุด ทั้งสองผลิตภัณฑ์ฮาร์ดแวร์ใหม่ใช้เทคโนโลยีการผลิต 28nm และสถาปัตยกรรม Maxwell ของ บริษัท
บริษัท ได้ประกาศสถาปัตยกรรมติดตามสองอันที่รู้จักกันในชื่อ Pascal ซึ่งมีกำหนดส่งในปีหน้าและ Volta ซึ่งจะติดตามมัน Intel ให้ความสำคัญกับวิธีการที่ HPC ส่งผลกระทบต่อวิทยาศาสตร์และฉันรู้สึกทึ่งกับคำอธิบายของวิธีการใช้ซูเปอร์คอมพิวเตอร์ของตัวเองซึ่งปัจจุบันอยู่ในอันดับที่ 99 จาก 500 รายการสูงสุดเพื่อช่วยออกแบบโปรเซสเซอร์ของตัวเอง โดยเฉพาะอย่างยิ่ง บริษัท กล่าวว่ามันใช้ล้านชั่วโมง CPU เพียงเพื่อออกแบบ photomasks สำหรับโปรเซสเซอร์รุ่นต่อไป
กิจกรรมส่วนใหญ่ของ Intel นั้นเน้นไปที่ Knights Landing ซึ่งเป็นชิป Xeon Phi รุ่นถัดไปซึ่งสามารถใช้เป็นตัวเร่งความเร็ว แต่ยังสามารถบู๊ตได้ และผ้า Omni-Path แม้ว่า Intel จะกล่าวว่าความพร้อมใช้งานทั่วไปจะอยู่ในช่วงครึ่งแรกของปี 2559 แต่มีลูกค้าเพียงเล็กน้อยเท่านั้นที่สามารถเข้าถึง Knights Landing ได้ แต่เนิ่นๆ ปัจจุบัน Cray กำลังทดสอบระบบ Knights Landing ขนาดใหญ่เพื่อเตรียมส่งซูเปอร์คอมพิวเตอร์ตัวใหม่ที่ชื่อว่า Cori สำหรับศูนย์วิทยาศาสตร์คอมพิวเตอร์แห่งชาติด้านการวิจัยพลังงาน (NERSC) และห้องปฏิบัติการแห่งชาติ Los Alamos และ Sandia National Laboratories ในปีหน้า บูลซึ่งเป็นหน่วยงานหนึ่งของ Atos ผู้ติดตั้งระบบของฝรั่งเศสได้รับ Knights Landing รุ่นแรก ๆ เพื่อเตรียมความพร้อมสำหรับระบบ Tera 1000 ที่สร้างขึ้นสำหรับคณะกรรมการพลังงานทดแทนของฝรั่งเศสและคณะกรรมาธิการพลังงานปรมาณู Argonne Leadership Computing Facility ทำงานบนระบบที่เรียกว่า Theta ซึ่งมีกำหนดส่งมอบในปีหน้าและ Sandia National Laboratories กำลังทำงานกับ Penguin Computing เพื่ออัพเกรดระบบหลายระบบที่ใช้โปรเซสเซอร์ร่วม Xeon Phi รุ่นก่อนหน้า
Intel ได้กล่าวก่อนหน้านี้แล้วว่าจะมี Knights Landing แตกต่างกันสามรุ่น: โปรเซสเซอร์โฮสต์พื้นฐาน (สามารถบูตได้ด้วยตนเอง), โฮสต์โปรเซสเซอร์ที่มีโครงสร้าง Omni-Path ในตัวและการ์ดเร่งความเร็ว PCIe ชิปนั้นจะประกอบด้วยไพ่ 36 ใบแต่ละอันมีแกน CPU สองแกน (รวม 72 แกน) หน่วยประมวลผลเวคเตอร์สี่หน่วย (สองแกนต่อแกน), L2 แคชที่ใช้ร่วมกัน 1MB และเอเจนต์แคชสำหรับรักษาการเชื่อมโยงกัน และ Intel ได้กล่าวว่ามันควรจะส่งมอบประสิทธิภาพสเกลาร์ของซีพียู Knights Corner ประมาณสามเท่าโดยมีความแม่นยำสองเท่าของ 3 teraflop / s และ 6 teraflop / s ความแม่นยำสูงสุดในระดับเดียว นอกจากนี้ยังใช้ระบบหน่วยความจำใหม่ที่เรียกว่า MCDRAM ซึ่งเป็นหน่วยความจำภายในแพ็กเกจที่มีแบนด์วิดท์มากกว่า 3 เท่าเมื่อเปรียบเทียบกับ DDR4 ที่ดูเหมือนจะเป็นตัวแปรในสถาปัตยกรรม Hybrid Memory Cube ที่ Intel และไมครอนพูดถึง ในการแสดง Cray มีระบบต้นแบบที่มีท่าจอดเรือที่สามารถบู๊ตได้และมีผู้ค้ารายอื่นจำนวนมากที่แสดงระบบที่ออกแบบมาสำหรับ Knights Landing Xeon Phi รุ่นนี้มีกำหนดจะตามด้วยรุ่นที่เรียกว่า Knights Hill ซึ่งจะถูกสร้างขึ้นในกระบวนการ 10nm ที่กำลังจะมาถึง
นอกจากนี้ฟูจิตสึยังได้พูดคุยเกี่ยวกับโครงการ Flagship 2020 เพิ่มเติมอีกเล็กน้อยโดยอิงจากชิปใหม่ที่รู้จักกันในชื่อ FX100 ที่มี 32 คอร์ สิ่งนี้คาดว่าจะเพิ่มประสิทธิภาพของจุดลอยตัวสี่เท่าคร่าวๆใน FX10 ปัจจุบันและเช่นเดียวกับ Knights Landing, FX100 ของฟูจิตสึจะใช้สถาปัตยกรรม Hybrid Memory Cube รุ่นหนึ่งด้วย นอกจากนี้ NEC ยังมีชื่อรหัสโครงการ Aurora (ไม่เกี่ยวข้องกับโครงการ CORAL) โดยขึ้นอยู่กับการติดตามชิป SX-ACE แต่มีแบนด์วิดท์หน่วยความจำที่มากขึ้น นี่เป็นเป้าหมายสำหรับปี 2560