บ้าน ส่งต่อความคิด ในที่สุดการเปลี่ยนแปลงครั้งใหญ่ก็เกิดขึ้นที่ขอบฟ้าของซูเปอร์คอมพิวเตอร์

ในที่สุดการเปลี่ยนแปลงครั้งใหญ่ก็เกิดขึ้นที่ขอบฟ้าของซูเปอร์คอมพิวเตอร์

วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (ธันวาคม 2024)

วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (ธันวาคม 2024)
Anonim

เมื่อมองย้อนกลับไปที่การประชุมซุปเปอร์คอมพิวติ้ง ISC 17 ของสัปดาห์นี้ดูเหมือนว่าโลกคอมพิวติ้งจะได้เห็นการอัพเกรดครั้งใหญ่ในอีกไม่กี่ปีข้างหน้า แต่การอัปเดตเป็น 500 อันดับแรกของซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลก รุ่นก่อนหน้า

คอมพิวเตอร์ที่เร็วที่สุดในโลกยังคงเป็นเครื่องจักรขนาดใหญ่ของจีนสองเครื่องที่ติดอันดับไม่กี่ปี: คอมพิวเตอร์ Sunway TaihuLight จากศูนย์คอมพิวเตอร์ซูเปอร์คอมพิวเตอร์แห่งชาติของจีนในเมืองอู๋ซีด้วยประสิทธิภาพของ Linpack มากกว่า 93 petaflops (จุดลอยน้ำ 93, 000 ล้านล้านจุด) การทำงานต่อวินาที); และคอมพิวเตอร์ Tianhe-2 จากศูนย์ซูเปอร์คอมพิวเตอร์แห่งชาติของจีนในกวางโจวโดยมีผลการดำเนินงานอย่างต่อเนื่องยาวนานกว่า 33.8 petaflops สิ่งเหล่านี้ยังคงเป็นเครื่องจักรที่เร็วที่สุดด้วยอัตรากำไรมหาศาล

หมายเลขใหม่ที่สามคือระบบ Piz Daint จาก Swiss National Supercomputing Center ซึ่งเป็นระบบ Cray ที่ใช้ Intel Xeons และ Nvidia Tesla P100s ซึ่งได้รับการอัพเกรดเมื่อเร็ว ๆ นี้เพื่อให้ Linpack มีประสิทธิภาพการทำงานที่ 19.6 petaflops สองครั้งก่อนหน้านี้ทั้งหมด นั่นทำให้มันขยับขึ้นจากอันดับแปดในรายการ

สิ่งนี้จะทำให้ระบบของสหรัฐอเมริกาที่มีขนาดใหญ่ที่สุด - ระบบไททันที่ห้องปฏิบัติการแห่งชาติโอ๊คริดจ์ลดลงถึงอันดับที่สี่ทำให้เป็นครั้งแรกในรอบยี่สิบปีที่ไม่มีระบบของสหรัฐอเมริกาในสามอันดับแรก ส่วนที่เหลือของรายการยังคงไม่เปลี่ยนแปลงโดยที่สหรัฐยังคงคิดเป็นห้าในสิบอันดับแรกโดยรวมและญี่ปุ่นสองรายการ

แม้ว่ารายชื่อคอมพิวเตอร์ที่เร็วที่สุดจะไม่เปลี่ยนแปลงมากนัก แต่ก็มีการเปลี่ยนแปลงครั้งใหญ่ที่อื่น ในรายการ Green 500 ของระบบที่ประหยัดพลังงานมากที่สุดเก้าในสิบอันดับแรกเปลี่ยนไป ด้านบนคือระบบ Tsubame 3.0 ซึ่งเป็นระบบ HPE ICE XA ที่ได้รับการดัดแปลงที่ Tokyo Institute of Technology ซึ่งใช้ Xeon E5-2680v4 14 คอร์, Omni-Path interconnect และ Nvidia Tesla P100 ซึ่งอนุญาตให้ 14.1 gigaflops ต่อวัตต์ นี่เป็นการกระโดดครั้งใหญ่จาก DGX Saturn V ของ Nvidia โดยใช้แพลตฟอร์ม DGX-1 ของ บริษัท และชิป P100 ซึ่งเป็นหมายเลขหนึ่งในรายการเดือนพฤศจิกายน แต่หมายเลขสิบในครั้งนี้ที่ 9.5 กิกะบิต / วัตต์ P100 เป็นหนึ่งในเก้าของสิบระบบกรีน 500

การทำลาย 10 gigaflops / watt เป็นเรื่องใหญ่เพราะมันหมายถึงว่าระบบ exaflop ที่สร้างขึ้นโดยใช้เทคโนโลยีในปัจจุบันจะใช้พลังงานน้อยกว่า 100 เมกะวัตต์ (MW) ยังคงมากเกินไป - เป้าหมายคือ 20-30 MW สำหรับระบบ exaflop ซึ่งนักวิจัยหวังว่าจะได้เห็นในอีกห้าปีข้างหน้าหรือมากกว่านั้น - แต่มันเป็นก้าวใหญ่

เช่นเดียวกับ Top 500 list มีการเปลี่ยนแปลงเพียงเล็กน้อยในรายการที่คล้ายกันที่มีเกณฑ์มาตรฐานที่แตกต่างกันเช่นเกณฑ์มาตรฐานประสิทธิภาพสูง Conjugate Gradients (HPCG) ที่เครื่องจักรมีแนวโน้มที่จะเห็นประสิทธิภาพสูงสุดตามทฤษฎีเพียง 1-10 เปอร์เซ็นต์และจุดสูงสุด ระบบ - ในกรณีนี้เครื่อง Riken K ยังคงส่งมอบน้อยกว่า 1 petaflop ทั้งระบบ TaihuLight และ Piz Daint ขยับขึ้นในรายการนี้ เมื่อนักวิจัยพูดถึงเครื่อง exaflop พวกเขามักจะหมายถึงมาตรฐานของ Linpack แต่ HPCG อาจสมจริงมากขึ้นในแง่ของประสิทธิภาพที่แท้จริงของโลก

การเกิดขึ้นของการคำนวณ GPU ในฐานะตัวเร่งซึ่งมักจะใช้โปรเซสเซอร์ Nvidia GPU เช่น P100 นั้นเป็นการเปลี่ยนแปลงที่เห็นได้ชัดเจนที่สุดในรายการเหล่านี้ในปีที่ผ่านมาตามด้วยการแนะนำตัวเร่งความเร็วของ Intel Xeon Phi แบบหลายแกน รุ่น Knights Landing ล่าสุด) รายการ 500 อันดับแรกในปัจจุบันประกอบด้วยระบบ 91 ระบบที่ใช้ตัวเร่งความเร็วหรือตัวประมวลผลร่วมรวมถึง 74 กับ Nvidia GPUs และ 17 กับ Xeon Phi (อีกสามตัวใช้ทั้งคู่); หนึ่งตัวที่มี AMD Radeon GPU เป็นตัวเร่งความเร็วและอีกสองตัวที่ใช้หน่วยประมวลผลหลายคอร์จาก PEZY Computing ซึ่งเป็นซัพพลายเออร์ญี่ปุ่น ตอนนี้ระบบอีก 13 ระบบใช้ Xeon Phi (Knights Landing) เป็นหน่วยประมวลผลหลัก

แต่การเปลี่ยนแปลงที่ยิ่งใหญ่ของซูเปอร์คอมพิวเตอร์จำนวนมากยังคงเกิดขึ้นในขณะที่เราเริ่มเห็นระบบที่ใหญ่ขึ้นซึ่งออกแบบโดยคำนึงถึงแนวคิดเหล่านี้ ตัวอย่างหนึ่งคือ MareNostrum 4 ใหม่ที่ Barcelona Supercomputing Center ซึ่งเข้าสู่ 500 อันดับแรกของรายการที่ 13 เมื่อติดตั้งแล้วนี่เป็นระบบของ Lenovo ที่ใช้ Xeon Platinum รุ่น Skylake-SP (อย่างเป็นทางการที่ Xeon Platinum 8160 24 ตัวประมวลผล -core) สิ่งที่น่าสนใจที่นี่คือสามกลุ่มใหม่ของ "เทคโนโลยีที่เกิดขึ้นใหม่" ที่วางแผนไว้สำหรับสองสามปีข้างหน้ารวมถึงคลัสเตอร์หนึ่งที่มีโปรเซสเซอร์ IBM Power 9 และ Nvidia GPUs ออกแบบมาเพื่อให้มีความสามารถในการประมวลผลสูงสุดมากกว่า 1.5 Petaflops วินาทีตามรุ่นอัศวินฮิลล์ของ Xeon พี; และหนึ่งในสามนั้นใช้โปรเซสเซอร์ ARMv8 64 บิตที่ออกแบบโดยฟูจิตสึ

แนวคิดเหล่านี้ถูกนำมาใช้ในโครงการซูเปอร์คอมพิวเตอร์ขนาดใหญ่อื่น ๆ อีกหลายโครงการซึ่งได้รับการสนับสนุนจากกระทรวงพลังงานของสหรัฐอเมริกาซึ่งเป็นส่วนหนึ่งของความร่วมมือปะการังที่ Oak Ridge, Argonne และ Lawrence Livermore National Labs สิ่งแรกที่ควรทำคือการประชุมสุดยอดที่ Oak Ridge ซึ่งจะใช้โปรเซสเซอร์ IBM Power 9 และ GPU Nvidia Volta และกำหนดไว้เพื่อส่ง petaflops มากกว่า 150 ถึง 300; ตามด้วยเซียร์ร่าที่ลอเรนซ์ลิเวอร์มอร์กำหนดส่งมอบ petaflops สูงสุด 100 แห่ง

จากนั้นเราควรจะเห็นซูเปอร์คอมพิวเตอร์ออโรร่าที่ห้องปฏิบัติการแห่งชาติ Argonne อ้างอิงจากรุ่น Knights Hill ของ Xeon Phi และสร้างโดย Cray ซึ่งกำหนดไว้เพื่อส่ง petaflops สูงสุด 180 ตัว ระบบ CORAL ควรจะขึ้นและ วิ่ง ปีหน้า.

ในขณะเดียวกันกลุ่มชาวจีนและญี่ปุ่นได้วางแผนการอัพเกรดเช่นกันส่วนใหญ่จะใช้สถาปัตยกรรมที่เป็นเอกลักษณ์ มันควรจะน่าสนใจที่จะดู

ดูเหมือนว่าการเปลี่ยนแปลงครั้งยิ่งใหญ่กว่านั้นจะยิ่งไกลออกไปเพียงเล็กน้อยนั่นคือการเปลี่ยนไปสู่การเรียนรู้ของเครื่องโดยทั่วไปจะอยู่ในหน่วยประมวลผลแบบขนานขนาดใหญ่ภายในโปรเซสเซอร์ ในขณะที่หมายเลข Linpack หมายถึงประสิทธิภาพ 64- บิตหรือความแม่นยำสองชั้น แต่ก็มีแอพพลิเคชั่นหลายประเภทรวมถึงแอพพลิเคชั่นที่ใช้โครงข่ายประสาทเทียมจำนวนมากซึ่งทำงานได้ดีกว่าด้วยการคำนวณที่แม่นยำเพียงครึ่งเดียว โปรเซสเซอร์ใหม่กำลังใช้ประโยชน์จากสิ่งนี้เช่นประกาศ Volta V100 ล่าสุดของ Nvidia และ Knights Mill เวอร์ชั่นใหม่ของ Xeon Phi ในการแสดง Intel กล่าวว่าเวอร์ชั่นซึ่งมีกำหนดจะผลิตในไตรมาสที่สี่จะมีชุดคำสั่งใหม่สำหรับ "การคำนวณที่มีความแม่นยำต่ำ" เรียกว่า Quad Fused Multiply Add (QFMA) และคำสั่งเครือข่ายประสาทเสมือน Quad (QVNNI) .

ฉันคิดว่าแนวคิดเหล่านี้สามารถนำไปใช้กับสถาปัตยกรรมอื่น ๆ ได้เช่น TPU ของ Google หรือชิป FPGA และ Nervana ของ Intel

แม้ว่าเราจะไม่เห็นการเปลี่ยนแปลงครั้งใหญ่ในปีนี้ แต่ปีหน้าเราควรคาดหวังว่าจะได้เห็นมากขึ้น แนวคิดของเครื่องจักร exascale (1, 000 teraflops) ยังคงเห็นอยู่แม้ว่ามันอาจจะเกี่ยวข้องกับการเปลี่ยนแปลงจำนวนมาก

ในที่สุดการเปลี่ยนแปลงครั้งใหญ่ก็เกิดขึ้นที่ขอบฟ้าของซูเปอร์คอมพิวเตอร์