пресс-центр

NVIDIA Tesla P100 ускоряет приложения глубокого обучения и высокопроизводительные вычисления

Пять инновационных технологий обеспечивают 12-кратный прирост производительности по сравнению с архитектурой предыдущего поколения

За дополнительной информацией обращайтесь:
Ирина Шеховцова
NVIDIA Corporation
Тел.: +7 (495) 981 03 00 доб. 10777
E-mail: irinas@nvidia.com

 
tesla-p100-gpu

САН-ХОСЕ, Калифорния—GPU Technology Conference—5 апреля, 2016—NVIDIA сегодня представила самый передовой ускоритель для сверхмасштабируемых дата-центров из когда-либо созданных - NVIDIA® Tesla® P100.

Новейшее решение для платформы ускоренных вычислений NVIDIA Tesla, Tesla P100 позволяет создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Современные дата-центры — обширные сетевые инфраструктуры с многочисленными взаимосвязанными CPU-серверами — обрабатывают огромное количество транзакций, например, вэб-сервисов. Но их мощи недостаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы.

Ускоритель Tesla P100, основанный на новой архитектуре NVIDIA Pascal™ с пятью передовыми технологиями, обеспечивает несравненную производительность и экономичность для самых ресурсоемких приложений.

“Для решения самых актуальных научно-технических задач— поиска лекарств от рака, выявление причин изменения климата, создания умных машин— требуется колоссальная вычислительная мощь, - говорит Дженсен Хуанг (Jen-Hsun Huang), генеральный директор и соучредитель NVIDIA. – Архитектура Pascal была изначально создана, чтобы стать воплощением инноваций на каждом уровне. Это большой шаг вперед в скорости и эффективности вычислений, который поможет ярким талантам совершить новые прорывы”.

Д-р Джон Келли III (John Kelly III), старший вице-президент Cognitive Solutions и IBM Research, отмечает: “Искусственный интеллект и познание требуют абсолютно нового подхода и нового уровня вычислений. Графические процессоры NVIDIA соместно с технологией OpenPOWER уже ускоряют обучение Watson новым умениям. Связка из архитектуры Power от IBM и архитектуры Pascal от NVIDIA с интерфейсом NVLink вместе еще больше ускорит изучение процессов познания, ускорив развитие искусственного интеллекта”.

Пять архитектурных прорывов
Tesla P100 обеспечивает беспрецедентную производительность, масштабируемость и эффективность программирования благодаря использованию пяти прогрессивных технологий:

  • Архитектура NVIDIA Pascal для экспоненциального роста производительности –Tesla P100 на базе архитектуры Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения NVIDIA Maxwell™.
  • NVIDIA NVLink для максимальной масштабируемости приложений NVIDIA NVLink™ , высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе.1 NVLink позволяет связать до восьми GPU Tesla P100, максимально повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.
  • 16нм FinFET для высокой энергоэффективности – Обладая 15.3 млрд. транзисторов, построенных на базе 16нм процесса FinFET, графический процессор Pascal является крупнейшим в мире FinFET чипом.2 Он создан, чтобы обеспечить высочайшую производительность и энергоэффективность для нагрузок с практически неограниченными вычислительными требованиями.
  • CoWoS с HBM2 для больших нагрузок – архитектура Pascal объединяет процессор и данные в одном пакете, чтобы максимально повысить эффективность вычислений. Инновационный подход к строению памяти, Chip-on-Wafer-on-Substrate (CoWoS) с HBM2, повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell.
  • Новые алгоритмы искусственного интеллекта для пиковой производительности – новые инструкции половинной точности обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения.

Графический ускоритель Tesla P100 поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, включая приложение молекулярной динамики AMBER, которое работает быстрее на 1-ом серверном узле с графическими процессорами Tesla P100, чем на 48 двухсокетных серверных узлах.3 Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU Tesla P100.4 А популярное приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах.5

Tesla P100 - первый ускоритель со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно – это огромный шаг вперед в скорости обработки данных и ускорении открытий в широком спектре областей.

Обновления в NVIDIA SDK
NVIDIA также анонсировала ряд обновлений в NVIDIA SDK, самой мощной в мире платформе разработки для GPU-вычислений.

В число обновлений входит NVIDIA CUDA® 8. Новейшая версия платформы параллельных вычислений NVIDIA представляет разработчикам прямой доступ к новым возможностям Pascal, включая унифицированную память и NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

NVIDIA также анонсировала cuDNN версии 5, GPU-ускоряемую библиотеку примитивов для сетей глубокого обучения. cuDNN 5 включает поддержку GPU Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для использования в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.

Спецификации Tesla P100

  • Скорость вычислений двойной точности - 5.3 терафлопс, одинарной точности - 10.6 терафлопс и половинной точности - 21.2 терафлопс, с технологией NVIDIA GPU BOOST™
  • Двунаправленный интерфейс NVIDIA NVLink со скоростью 160ГБ/с
  • 16ГБ памяти CoWoS HBM2
  • Полоса пропускания 720ГБ/с памяти CoWoS HBM2
  • Улучшенная программируемость с движком перехода по страницам и унифицированной памятью
  • Защита ECC для повышенной надежности
  • Оптимизация под сервер для высокой пропускной способности и надежности дата-центра

Доступность
Графические ускорители NVIDIA Tesla P100 на базе Pascal появятся в составе новой системы глубокого обучения NVIDIA DGX-1™ в июне. Также ожидается, что новый процессор появится в составе серверов от ведущих производителей в начале 2017 года.

Смотреть видео - https://www.youtube.com/watch?v=roCXXvI5wK4

Следите за новостями NVIDIA:
Подпишитесь на блог NVIDIA, следите за новостями в Facebook, Google+, Twitter, LinkedIn и Instagram, а также смотрите нас на YouTube и Flickr.

О компании NVIDIA
NVIDIA (NASDAQ: NVDA) находится на вершине искусства и науки визуальных вычислений с 1993 года. Технологии компании превращают мир изображений в мир интерактивных открытий для самых разных пользователей — геймеров и ученых, пользователей мобильных устройств, офисных работников и не только. Подробнее смотрите на сайтах http://www.nvidia.ru, http://www.nvidia.ru/page/press_room.html и http://blogs.nvidia.com.


______________________________________

(1) NVLink обеспечивает пропускную способность в 160ГБ/с для двунаправленного канала, тогда как PCIe x16 Gen3 обеспечивает 31.5ГБ/с.

(2) NVIDIA Tesla P100 GPU имеет 15.3 млрд транзисторов, изготовленных по 16нм процессу FinFET.

(3) CPU-система: 48 узлов, каждый узел на базе двух 12-ядерных процессоров Intel E5-2680v3, 128ГБ DDR4, интерфейс FDR IB. GPU-система: один узел, два 16-ядерных Intel E5-2698 v3, 512ГБ DDR4, 4 Tesla P100, интерфейс NVLink.

(4) В сравнении с временем, необходимым для Caffe/AlexNet для обучения набора данных ILSVRC-2012 на кластере двухсокетных систем на базе CPU Intel Xeon E5-2697 v3 с интерфейсом InfiniBand. Сравнение производительности с системой на базе 250 узлов рассчитано с помощью источника: https://software.intel.com/en-us/articles/caffe-training-on-multi-node-distributed-memory-systems-based-on-intel-xeon-processor-e5.

(5) CPU-система: два 16-ядерных Intel E5-2698 v3, 256ГБ DDR4. GPU-система: один узел, два 16-ядерных Intel E5-2698 v3, 512ГБ DDR4, 8 Tesla P100, интерфейс NVLink.

Отдельные заявления данного пресс-релиза, включая, но не ограничиваясь ими, упоминающие о влиянии, производительности, преимуществах и доступности NVIDIA Tesla P100 GPU, NVIDIA SDK и системы глубокого обучения NVIDIA DGX-1, приводятся с расчетом на будущее и могут изменяться в результате обстоятельств и рисков, приводящих к результатам, материально отличным от ожидаемых. Такие обстоятельства и риски включают разработку более быстрой или эффективной технологии, использование CPU для параллельных вычислений, конструкторские, производственные или программные ошибки, влияние технологического развития и конкуренции, изменения в предпочтениях и требованиях покупателей, выбор других стандартов или продуктов конкурентов покупателями, изменения в стандартах отрасли и интерфейсах, неожиданное снижение производительности наших продуктов или технологий при интеграции в системы, а также другие риски, указываемые время от времени в отчетах, которые NVIDIA отсылает в Комиссию по ценным бумагам и биржевым операциям, включая отчет по форме 10-Q за финансовый период, закончившийся 31 января 2016 года. Копии отчетов для SEC опубликованы на нашем сайте и доступны у NVIDIA бесплатно. Данные, относящиеся к будущему заявлению, не относятся к будущей производительности, а только к текущему моменту, и, кроме случаев, установленных законом, NVIDIA не несет ответственность за обновление таких заявлений, чтобы отразить будущие события или обстоятельства.

###

© 2016 NVIDIA Corporation. Все права защищены. NVIDIA, логотип NVIDIA, Tesla, Pascal, Maxwell, NVIDIA NVLink, CUDA, NVIDIA GPU BOOST и DGX-1 являются товарными знаками и/или зарегистрированными товарными знаками компании NVIDIA в США и/или других странах. Все другие названия компаний и/или продуктов могут являться товарными знаками и/или зарегистрированными товарными знаками соответствующих владельцев. Функции, цены, наличие и спецификации могут быть изменены без предупреждения.