Tesla

POWER NEW LEVELS OF USER ENGAGEMENT
Boost throughput and responsive experiences in deep learning inference workloads.
Boost throughput and responsive experiences in deep learning inference workloads

УСКОРЕНИЕ ИНФЕРЕНСА ДЛЯ ГЛУБОКОГО ОБУЧЕНИЯ

В эпоху искусственного интеллекта глубокое обучение позволяет добиться сверхчеловеческой точности выполнения сложных задач и повысить качество нашей повседневной жизни. Голосовой поиск, компьютерное зрение и прогнозная аналитика – вот всего лишь несколько областей, где модели глубокого обучения, натренированные на GPU, продемонстрировали невероятные результаты, которые раньше были недостижимы.

Сервисы, в основе которых лежит искусственный интеллект, вынуждены справляться с постоянно растущим объемом данных и при этом иметь высокий уровень отзывчивости. Сервер, оснащенный одним графическим ускорителем Tesla, обеспечивает в 40 раз более высокую производительность инференса, чем CPU-сервер. Это означает серьезное сокращение расходов на инфраструктуру дата-центров, позволяя масштабировать решения и удовлетворять постоянно растущий спрос на приложения с искусственным интеллектом.

Кроме того, отзывчивость является основным критерием привлекательности для пользователей таких услуг, как поиск по изображению, подбор рекомендаций видео и автоматическое обслуживание. Так как модели глубокого обучения становятся все более сложными, CPU больше не в состоянии обеспечить интерактивные пользовательские возможности. GPU Tesla обеспечивают в 47 раз более высокую производительность в задачах, требующих низкой задержки, по сравнению с CPU-серверами. Это гарантирует уровень отзывчивости, необходимый для сервисов с искусственным интеллектом.

Графические ускорители NVIDIA® Tesla® V100 и P4 представляют собой оптимальные решения, объединяющие в себе высокую производительность и низкие задержки в задачах инференса, что позволяет создавать приложения с искусственным интеллектом нового поколения.

NVIDIA Tesla V100

МАКСИМАЛЬНАЯ ПРОИЗВОДИТЕЛЬНОСТЬ В ЗАДАЧАХ ИНФЕРЕНСА

Tesla V100 – универсальный графический ускоритель для дата-центров, обеспечивающий революционную производительность в задачах HPC и глубокого обучения, включая тренировку алгоритмов и инференс. С учетом производительности инференса в 125 терафлопс на GPU, один сервер, оснащенный восемью графическими процессорами Tesla V100, может обеспечить быстродействие на уровне одного петафлопса.

 
NVIDIA Tesla P40

ВЫСОКАЯ ПРОИЗВОДИТЕЛЬНОСТЬ ИНФЕРЕНСА

Tesla P40 обеспечивает высочайшую производительность в задачах инференса и восьмиразрядных операциях (INT8) и имеет 24 ГБ встроенной памяти.

 

ВЫСОЧАЙШАЯ ЭНЕРГОЭФФЕКТИВНОСТЬ ДЛЯ ГОРИЗОНТАЛЬНО-МАСШТАБИРУЕМЫХ СЕРВЕРОВ

Tesla P4 предназначен для ускорения горизонтально-масштабируемых серверов и обеспечивает в 40 раз более высокую энергоэффективность по сравнению с CPU.

Tesla P4
 

ВОЗМОЖНОСТИ И ПРЕИМУЩЕСТВА

Эти графические ускорители ускоряют вычисления инференса, таким образом обеспечивая потрясающие пользовательские возможности в приложениях, использующих искусственный интеллект.

 
Повышение производительности в 100 раз  позволяет справляться с постоянно растущими объемами данных

Повышение производительности в 100 раз позволяет справляться с постоянно растущими объемами данных

В 50 раз более высокая производительность для растущих рабочих нагрузок Огромные объемы данных, генерируемых каждый день, включая записи показаний датчиков, изображения и видео, экономически невыгодно обрабатывать на CPU. Графические ускорители Tesla V100 на базе архитектуры Volta значительно повышают производительность алгоритмов глубокого обучения в дата-центрах и позволяют извлекать знания из этого цунами информации. Сервер, оснащенный одним графическим ускорителем Tesla V100, может заменить до 50 серверов на базе CPU в задачах инференса, что значительно сокращает общие затраты.

 
Специализированный движок декодирования для новых видеосервисов на основе искусственного интеллекта

Специализированный движок декодирования для новых видеосервисов на основе искусственного интеллекта

Tesla P4 и P40 могут обрабатывать в реальном времени до 39 видеопотоков в разрешении HD благодаря специализированному аппаратно ускоренному движку декодирования, который работает параллельно с ядрами NVIDIA CUDA®, выполняющими операции инференса. Благодаря интеграции алгоритмов глубокого обучения в конвейер обработки видео, вы можете предложить своим пользователям интеллектуальные приложения нового поколения.

Непревзойденная энергоэффективность для горизонтально-масштабируемых серверов

Непревзойденная энергоэффективность для горизонтально-масштабируемых серверов

Tesla P4 повышает производительность горизонтально масштабируемых серверов высокой плотности благодаря своему малому форм-фактору и уровню энергопотребления в 50-75 Вт. Он обеспечивает в 52 раза более высокую энергоэффективность по сравнению с CPU в задачах инференса. Это позволяет масштабировать решения в существующей инфраструктуре и удовлетворять экспоненциально растущий спрос на приложения с искусственным интеллектом.

 
Ускорение развертывания с NVIDIA TensorRT™ и DeepStream SDK

Ускорение развертывания с NVIDIA TensorRT™ и DeepStream SDK

NVIDIA TensorRT – это высокопроизводительный движок инференса, предназначенный для развертывания приложений глубокого обучения. Он содержит библиотеки для повышения пропускной способности и эффективности приложений глубокого обучения путем оптимизации обученных нейронных сетей – обычно в форме 32-битных или 16-битных операций – до операций INT8 пониженной точности на Tesla P4 или половинной точности на Tesla V100. NVIDIA DeepStream SDK использует мощность графических процессоров Tesla для одновременного декодирования и анализа видеопотоков.

 

СПЕЦИФИКАЦИИ ПРОИЗВОДИТЕЛЬНОСТИ УСКОРИТЕЛЕЙ NVIDIA TESLA P4, P40 И V100

 
  Tesla V100 – универсальный ускоритель для дата-центров Tesla P4 для ультраэнергоэффективных горизонтально-масштабируемых серверов Tesla P40 для производительных серверов для задач инференса
Производительность операций одинарной точности с плавающей точкой 14 Терафлопс (PCIe)
15,7 терафлопс (SXM2)
5,5 Терафлопс 12 Терафлопс
Производительность операций половинной точности (FP16) 112 терафлопс (PCIe)
125 терафлопс (SXM2)
-- --
Производительность целочисленных операций -- 22 TOPS* 47 TOPS*
Объем памяти 16 ГБ HBM2 8 ГБ 24 ГБ
Пропускная способность памяти 900 ГБ/c 192 ГБ88/с 346 ГБ88/с
Системный интерфейс/Форм-фактор Полноразмерный форм-фактор PCI Express, два слота
SXM2 / NVLink
Низкопрофильный форм-фактор PCI Express Полноразмерный форм-фактор PCI Express, два слота
Энергопотребление 250 Вт (PCIe)
300 Вт (SXM2)
50 Вт/75 Вт 250 Вт
Аппаратно ускоренный движок транскодирования видео -- 1 движок для декодирования, 2 движка для кодирования 1 движок для декодирования, 2 движка для кодирования

*Тера-операций в секунду с тактовой частотой в режиме Boost

ТЕХНИЧЕСКОЕ ОПИСАНИЕ NVIDIA TESLA P40 И P4

 

КУПИТЕ NVIDIA TESLA P40 И P4 ПРЯМО СЕЙЧАС

Tesla P40 и P4 уже доступны в продаже.

ГДЕ КУПИТЬ

 
CUDA и вычисления на GPU

Что такое вычисления на GPU?
Факты о вычислениях на GPU
Программирование GPU
Архитектура Kepler GPU
Облачные вычисления на GPU

Что такое CUDA?
CUDA в действии
CUDA Альманах
CUDA и OpenACC:
Бесплатный Онлайн курс

Обучение CUDA
Центры повышения
квалификации CUDA

Исследовательские центры CUDA
Центры обучения CUDA

Приложения для
вычислений на GPU

Приложения для вычислений
на Tesla GPU

Примеры применения Tesla
Директивы OpenACC
Тест-драйв Tesla GPU

Tesla GPU для серверов
и рабочих станций

Почему Tesla
Решения Tesla для серверов
Решения Tesla для рабочих станций
Встраиваемая платформа разработок
Купить Tesla GPU

Новости и
информация о Tesla

Истории успеха Tesla
Литература о продукте
Средства программного
обеспечения Tesla

Программные средства
разработки Tesla

Вебинары на русском языке
NVIDIA Research
Уведомления о новостях Tesla
Учебный комплект для
преподавателей

Мы в социальных сетях

VKontakte VKontakte

YouTube YouTube

Twitter Twitter

Instagram Instagram

NVIDIA Blog Блог NVIDIA