A szuperszámítógépek világranglistáján a kínai Tianjin Nemzeti Központ másodpercenként 5 biliárd művelet elvégzésére képes, 2,67 petaflop teljesítményű Tianhe-1A-ja leelőzte az amerikai Oak Ridge Nemzeti Laboratórium Cray XT5 Jaguárját.
Stephen Jarvis, az angliai Warwick Egyetem kutatója Tianhe-1A apropóján összehasonlította a kínai és az amerikai fejlesztési módszereket, a rendszerek működési elveit, és a két versengő technológia hosszan elhúzódó „háborúját” vetítette előre. Leegyszerűsítve: a kínaiak általános célú GPU-ját (GPGPU) vetette egybe az Egyesült Államokban alkalmazott alternatív szuperszámítógép-tervezési módszerekkel.
Jarvis az IBM Blue Gene-jét hozza fel a Tianhe-1A ellenpéldájaként: a gép moduláris felépítésű, masszívan párhuzamos, teljesítménye méretezhető.
A kutató nem hirdet ki hosszútávú győztest, hiszen „senki nem tudja, melyik tervezéssel jutunk el a XXI. századi informatika következő mérföldkövéhez, az exa-szintű számításokig.” A sikerhez az architektúra kiválasztása mellett bonyolult programozási, áramellátási és biztonsági kérdéseket is meg kell oldani.
Munkájához matematikai modelleket, szimulációt, szintezést/folyamatos összehasonlítást (benchmarking) használt, azokkal próbálta meghatározni a jövőbeli designok lehetséges teljesítményét.
Érdekes következtetéseket vont le; kihívásokat fogalmazott meg, és igyekezett példákkal alátámasztani.
Például, ha az alkalmazás jól működik, a GPGPU-megoldások csúcsteljesítménye felülmúlja a Blue Gene-szerűen tervezett gépekét. Ugyanakkor rengeteg számítási kapacitást nem használnak ki: a Tianhe-1A elvileg 4,7 petaflop teljesítményre képes, amitől viszont az eddigi csúcs, a 2,67 igencsak távol van. Ezzel szemben a Lawrence Livermore Nemzeti Laboratórium Dawn Blue Gene/P-je csak 0,5-re kalibrált, de a 0,415-ös átlagot viszonylag „simán hozza.”
A Blue Gene-típusú gépeknek sokkal több feldolgozást támogató elemmel, feldolgozóegységgel kell rendelkezniük ugyanazon feladat elvégzéséhez. Ezen a szinten a legtöbb algoritmus már nem tud megbirkózni a méretezhetőséggel, és könnyen „előfordulhat, hogy hiába lesznek fantasztikus gépeink, nem tudjuk majd használni őket.”
Szintén megoldandó probléma a GPGPU-k párhuzamosan, széles skálán történő összekapcsolása. Egyelőre még nem tudni, mi az optimális technológia.
Jarvis modellje azt is kimutatta, hogy a GPGPU-alapú rendszerek minimum háromszor, maximum hétszer gyorsabban oldanak meg problémákat. De ha növeljük a feldolgozást végző elemek számát, teljesítményük belassul, a Blue Gene-jellegű gépek sokkal gyorsabbak.