Тип системы: NUMA Веб-сайт: http://lits.ccfebras.ru/ Место установки: Вычислительный центр Дальневосточного отделения Российской академии наук Год установки: 2021 Разработчики: NVIDIA, ООО «Форсайт Северо-Запад»
Количество узлов: 1 Количество CPU: 2 Количество ядер CPU: 128 Количество GPU-ускорителей: 8 Количество мультипроцессорных блоков GPU: 864 Количество GPU-ядер/CUDA-ядер: 55296 Всего ядер: 992 Архитектура: узлов: 1 [2x AMD EPYC 7742, 2048 GB RAM; Acc: 8x NVIDIA A100]
Rpeak (Тфлоп/с): 156.0 Область применения: Наука и образование Транспортная сеть: HDR InfiniBand Сервисная сеть: Gigabit Ethernet Топология: Коммуникационная сеть отсутствует. Семейство коммуникационной сети: Коммуникационная сеть отсутствует.
Linpack: Результат (Rmax): 94.64 Тфлоп/с Linpack Nmax: 201600 Выдача Linpack: ================================================================================
HPL-NVIDIA 1.0.0 -- NVIDIA accelerated HPL benchmark -- NVIDIA
================================================================================
HPLinpack 2.1 -- High-Performance Linpack benchmark -- October 26, 2012
Written by A. Petitet and R. Clint Whaley, Innovative Computing Laboratory, UTK
Modified by Piotr Luszczek, Innovative Computing Laboratory, UTK
Modified by Julien Langou, University of Colorado Denver
================================================================================
An explanation of the input/output parameters follows:
T/V : Wall time / encoded variant.
N : The order of the coefficient matrix A.
NB : The partitioning blocking factor.
P : The number of process rows.
Q : The number of process columns.
Time : Time in seconds to solve the linear system.
Gflops : Rate of execution for solving the linear system.
The following parameter values will be used:
N : 201600
NB : 320
PMAP : Row-major process mapping
P : 4
Q : 2
PFACT : Left
NBMIN : 2
NDIV : 2
RFACT : Left
BCAST : 2ringM
DEPTH : 1
SWAP : Spread-roll (long)
L1 : no-transposed form
U : transposed form
EQUIL : no
ALIGN : 8 double precision words
--------------------------------------------------------------------------------
- The matrix A is randomly generated for each test.
- The following scaled residual check will be computed:
||Ax-b||_oo / ( eps * ( || x ||_oo * || A ||_oo + || b ||_oo ) * N )
- The relative machine precision (eps) is taken to be 1.110223e-16
- Computational tests pass if scaled residuals are less than 16.0
================================================================================
T/V N NB P Q Time Gflops
--------------------------------------------------------------------------------
WR03L2L2 201600 320 4 2 57.72 9.464e+04
--------------------------------------------------------------------------------
||Ax-b||_oo/(eps*(||A||_oo*||x||_oo+||b||_oo)*N)= 0.0000440 ...... PASSED
================================================================================
Finished 1 tests with the following results:
1 tests completed and passed residual checks,
0 tests completed and failed residual checks,
0 tests skipped because of illegal input values.
--------------------------------------------------------------------------------
End of Tests.
================================================================================
Позиции в редакциях Top50:
|