Gara-gara baca berita detik tentang ini ni, perhatian gw dr ngerjain thesis teralihkan sebentar. Tenang, masih ada hubungannya ama thesis gw kok, makanya gw jadi pengen nyari infonya. Soal yang di detik.com spec nya ga dijelasin. Gini ternyata..
Awalnya, ini cita-cita IBM yang pengen ngwujudin sebuah supercomputer dengan kemampuan petaflops computing. Sebagai informasi, 1 peta = 1000 terra = 1 juta giga, trus flops itu singkatan dari floating point operations per second, yakni kemampuan kalkulasi sebuah processor dalam satu detik. Sebagai perbandingan, processor Intel Core 2 Duo yang lg musim sekarang ini kemampuannya berada di kisaran 5-25 gigaflops. Jadi udah kebayangkan gimana kemampuan supercomputer itu. Nah balik lagi. Ternyata cita-cita IBM ini sejalan dengan ambisi King Abdullah University of Science and Technology (KAUST) yang ingin mendirikan Supercomputing Research Center terbesar di dunia. Jadi lah mereka bekerjasama mewujudkan cita-cita ini dalam beberapa tahun ke depan. Nah, sebagai langkah awal, dibangun lah supercomputer keluaran IBM tipe terbaru yakni Blue Gene/P System yang akan ditempatkan di Al-Khawarzimi Applied Mathematics Building, KAUST. Blue Gene/P Sytem ini pengembangan dari tipe Blue Gene/L System yang dirilis November 2004 silam.
Lantas, gw jadi tertarik nyari tau perbedaannya.
IBM Blue Gene/L | IBM Blue Gene/P | |
Nodes per rack | 1,024 | 1,024 |
Processors per node | 2 | 4 |
Clock speed (GHz) | 0.7 | 0.85 |
FLOPs/clock | 4 | 4 |
Peak performance per rack(Gflops) | 5,734.40 | 13,926.40 |
Power required per rack(kW) | 27 | 40 |
Gflops/kW | 212.4 | 348.16 |
Racks required for 1 petaflops | 174 | 72 |
Total power for 1 petaflops(MW) | 4.7 | 2.9 |
Node properties |
||
Node processors | two core 440 | quad core 450 |
Processor frequency | 0.7 GHz | 0.85 GHz |
L1 cache (private) | 32-KB I-cache + 32-KB | 32-KB I-cache + 32-KB |
D-cache per processor | D-cache per processor | |
L2 cache (private) | Seven-stream prefetching | Seven-stream prefetching |
L3 cache size (shared) | 4MB | 8MB |
Memory per node | 512 MB and 1 GB | 2 GB and 4 GB |
Memory bandwidth | 5.6 GB/s (16 bytes wide) | 13.6 GB/s (2 × 16 bytes wide) |
Peak performance | 5.6 Gflops/node | 13.6 Gflops/node |
Torus network |
||
Bandwidth | Core injects/receives packets 6 × 2 × 175 MB/s = 2.1 GB/s | DMA injects/receives packets 6 × 2 × 425 MB/s = 5.1 GB/s |
Hardware latency (nearest neighbor) | <1 μs | <1 μs |
Hardware latency (worst case, 72 racks) | 7 μs (68 hops) | 5 μs (68 hops) |
Collective network |
||
Bandwidth | 3 × 2 × 350 MB/s = 2.1 GB/s | 3 × 2 × 850 MB/s = 5.1 GB/s |
Hardware latency (round-trip worst case, 72 racks) | 6.0 μs | 5.0 μs |
System properties (e.g., 72 racks) |
||
Area | 150 m2 | 200 m2 |
Peak performance | 410 Tflops | 1 Pflops |
Total power (LINPACK) | 1.9 MW | 2.9 MW |
Rencananya, supercomputer yang akan ditempatkan di KAUST bakal terdiri dari 16 rack. Ini berarti akan terdapat 16384 nodes. Dengan masing-masing node memiliki 4 buah quad-core processor, maka berarti akan terdapat 262144 core processing di dalam supercomputer ini. Tak heran bila supercomputer ini memiliki kemampuan 222 terraflops. Selain itu, setiap node juga dilengkapi dengan 4GB memory.
Supercomputer tersebut akan diberi nama “Shaheen”, yang merupakan bahasa arab untuk burung sejenis elang, Peregrine Falcon, yang mampu terbang dengan kecepatan hingga 324 km/jam.
Coba bandingin ama cluster di lab gw yang ga seberapa ni, liat gambar di samping ni. Udah lah cuma 4 nodes dengan 2 core processor, trus dipakenya keroyokan lagi. 🙁
Gimana thesis gw mo maju coba, ngerjain simulasi aja harus malem-malem, nunggu orang-orang pada pulang, Ish, ish, ish, issshh..
Kok gw jadi curhat yakk ??.. 😀 Maaph, maaph penonton.. 😛
# diambil dari berbagai sumber
1 thought on “Shaheen Supercomputer”