пресс-центр

Искусственный интеллект - четвертая индустриальная революция

NVIDIA Blog NVIDIA Blog
NVIDIA Blog https://blogs.nvidia.com/blog/2016/10/24/intelligent-industrial-revolution/

 

Искусственный интеллект - четвертая индустриальная революция

 

Вступительное примечание: За прошедшие несколько недель конференция NVIDIA для разработчиков прошла в разных городах по всему миру. Первая конференция по GPU-технологиям (GTC) состоялась в 2009 году. Ее целью стало содействие развитию новаторского подхода к высокопроизводительным вычислениям, в основу которого легло применение GPU с массивно параллельной архитектурой. Конференция GTC стала эпицентром ускорения алгоритмов глубокого обучения на GPU — новой вычислительной модели, которая спровоцировала настоящую революцию в области современного ИИ. Не секрет, что искусственный интеллект распространяется подобно лесному пожару. Число разработчиков, занимающихся вопросами глубокого обучения на GPU, увеличилось в 25 раз всего за два года. В мире появилось порядка 1500 стартапов в области искусственного интеллекта. Подобный бурный рост привел к высокому спросу на GTC по всему миру. Ниже я хочу коротко изложить, о чем я рассказывал на конференциях, чему научился и каким я вижу будущее ИИ, который кардинально меняет все индустрии одну за другой.

 

Новая эра вычислений

Новая эра вычислений

 

Умные машины на основе компьютеров с искусственным интеллектом, которые могут учиться, размышлять и взаимодействовать с людьми, больше не научная фантастика.  Сегодня беспилотные автомобили с искусственным интеллектом на борту могут без проблем перемещаться по проселочным дорогам и ориентироваться на местности. Робот с искусственным интеллектом методом проб и ошибок может обучиться сложным моторным навыкам. Наступила по-настоящему выдающаяся эпоха.  За три десятилетия, что я работаю в компьютерной индустрии, ни одна технология не имела большего потенциала и не была настолько интересна.  Эра искусственного интеллекта уже наступила.

Компьютерная индустрия - двигатель масштабных изменений в промышленности и обществе. По мере развития вычислений появляются новые компании, создаются новые продукты. Наша жизнь меняется. Оглядываясь назад, становится понятно, что каждая революция в вычислениях была обусловлена появлением инновационной вычислительной модели, новой архитектуры, которая расширяла возможности и доступность вычислений.

В 1995 году с появлением недорогих микропроцессоров (CPU), стандартной операционной системы (Windows 95) и новой поисковой системы (Yahoo!) началась эра Интернета. Она открыла доступ к вычислениям почти миллиарду пользователей и позволила реализовать программу Microsoft "Компьютер на каждый рабочий стол, в каждый дом". Десять лет спустя мы получили iPhone, мобильное устройство с доступом к сети Интернет. С появлением платформы Amazon Web Services началась облачная эра. Компьютерные приложения прочно вошли в нашу жизнь, около 3 миллиардов человек пользуются возможностями, которые предоставили нам мобильные вычисления.

Сегодня мы стоим на пороге новой эры, эры искусственного интеллекта, в основе которой лежит новая вычислительная модель - глубокое обучение с ускорением на GPU. Эта новая модель, в которой нейронные сети обучаются распознавать шаблоны из большого объема входных данных, доказала свою бесспорную эффективность в решении самых сложных задач в компьютерной науке.  В эру искусственного интеллекта программное обеспечение пишет себя само, а машины самостоятельно обучаются. Скоро сотни миллиардов устройств будут наделены искусственным интеллектом. Искусственный интеллект кардинально изменит все индустрии.

 

Революционный подход к использованию GPU для глубокого обучения

 

Революционный подход к  использованию GPU для глубокого обучения

 

Весь мир проявил к этому интерес. Исследователи в области ИИ стали использовать алгоритмы глубокого обучения с ускорением на GPU. Baidu, Google, Facebook и Microsoft стали первыми компаниями, внедрившими этот метод для распознавания образов. К 2015 году они добились "сверхчеловеческих" результатов: компьютер научился распознавать изображения лучше, чем человек. Исследователи Microsoft использовали алгоритмы глубокого обучения с ускорением на GPU и пришли к  историческому достижению, добившись паритета с человеком в деле машинного распознавания речи.

В вопросах распознавания изображений и речи глубокое обучение с ускорением на GPU представляет собой платформу, позволяющую машинам воспринимать информацию, обучаться и решать поставленные задачи. Поначалу GPU применялись как движки для моделирования человеческого воображения, создания потрясающих виртуальных миров и голливудских фильмов.  Теперь графические процессоры NVIDIA обрабатывают алгоритмы глубокого обучения, симулируя человеческий мозг, и выступают в качестве "головного мозга" компьютеров, роботов и беспилотных автомобилей, которые способны воспринимать наш мир и взаимодействовать с ним. Графические решения и искусственный интеллект связаны так же, как и воображение человека и его интеллект.  Два режима работы мозга - два режима работы GPU. Это объясняет, почему графические процессоры NVIDIA широко используются в задачах глубокого обучения, а NVIDIA все больше становится известна как "компания в области вычислений для ИИ".

 

Комплексная платформа для новой вычислительной модели

Комплексная платформа для новой вычислительной модели

Технология глубокого обучения с ускорением на GPU меняет то, как разрабатывается и используется программное обеспечение. В прошлом инженеры ПО создавали программы и писали коды для алгоритмов. Теперь алгоритмы обучаются на многочисленных примерах из реальной жизни - программное обеспечение пишет себя само. Программирование заключается в написании кодов инструкций. Глубокое обучение заключается в создании и тренировке нейронных сетей. Нейронную сеть можно развернуть в дата-центре для проведения инференса, прогнозирования и классификации новых представленных данных. Нейронные сети могут быть интегрированы в умные устройства, такие как камеры, автомобили и роботы, чтобы воспринимать происходящее вокруг. Новые данные собираются для дальнейшей тренировки и совершенствования нейросети. Знания, полученные на миллиардах устройств, делают все устройства в сети намного умнее. Нейронные сети используют преимущества как экспоненциального развития вычислений на GPU, так и крупных нейронных сетей. Вот почему они будут становиться умнее быстрее, чем согласно закону Мура.

 
 

В то время как старая вычислительная модель основана на обработке команд, новая модель требует обработки больших объемов данных. Чтобы способствовать развитию искусственного интеллекта во всех направлениях, мы разрабатываем комплексную вычислительную платформу для ИИ - архитектуру, способную объединить обучение, инференс и миллиарды умных устройств, с которыми мы сталкиваемся.

 

В то время как старая вычислительная модель основана на обработке команд, новая модель требует обработки больших объемов данных. Чтобы способствовать развитию искусственного интеллекта во всех направлениях, мы разрабатываем комплексную вычислительную платформу для ИИ - архитектуру, способную объединить обучение, инференс и миллиарды умных устройств, с которыми мы сталкиваемся.

Давайте начнем с обучения. На создание нового  GPU с архитектурой Pascal  ушло $2 миллиарда, его разработкой занимались несколько тысяч инженеров на протяжении трех лет. Это первый GPU, оптимизированный для задач глубокого обучения. Pascal может тренировать более крупные нейросети в 65 раз быстрее по сравнению с GPU Kepler, которые использовал в своей работе Алекс Крижевский.(1) Один компьютер, оснащенный восемью GPU Pascal, объединенными самым высокоскоростным в истории интерфейсом NVIDIA NVLink, по скорости тренировки нейросетей превосходит 250 традиционных серверов.

 
 
 

Скоро ежедневные десятки миллиардов запросов в сети Интернет потребуют применения искусственного интеллекта. Это значит, что для обработки каждого запроса потребуется выполнение на миллиарды больше математических операций.  Общая нагрузка на облачные сервисы станет слишком большой, чтобы обеспечить отклик в реальном времени. Чтобы ускорить инференс в дата-центрах, мы представили графические ускорители TeslaP40 и P4. P40 ускоряет производительность инференса в дата-центрах в 40 раз. P4 потребляет всего 50 Вт энергии и предназначен для ускорения сверхмасштабируемых дата-центров. Программное обеспечение является важной частью платформы NVIDIA для глубокого обучения. Для тренировки алгоритмов мы предлагаем CUDA и cuDNN. Для задач инференса мы анонсировали TensorRT, библиотеку оптимизации моделей глубокого обучения для инференса. Библиотека TensorRT повышает производительность вычислений за счет снижения точности операций до FP16 или INT8 и многих других техник. 

 
 

Когда-нибудь миллиарды умных устройств смогут использовать возможности глубокого обучения для плавного выполнения интеллектуальных задач. Дроны будут самостоятельно маневрировать по складским помещениям, находить необходимые продукты и переносить их. Портативные медицинские инструменты будут использовать искусственный интеллект для мгновенного диагностирования состояния пациента в момент забора крови.  Умные камеры научатся поднимать тревогу только в случаях, которые действительно важны.  Для разработки подобных умных устройств мы представили энергоэффективный суперкомпьютер для задач искусственного интеллекта, Jetson TX1. Модульный суперкомпьютер Jetson TX1 размером с кредитную карту обеспечивает производительность в 1 Терафлопс в операциях FP16, потребляя при этом всего 10 Вт энергии. Эти платформы построены на той же архитектуре, что и самые мощные GPU, и совместимы с тем же ПО. 
Иными словами, мы предлагаем комплексную вычислительную платформу для задач искусственного интеллекта, от GPU до алгоритмов и программного обеспечения для глубокого обучения, от систем для обучения до бортовых автомобильных компьютеров с ИИ, от облака до дата-центра, ПК и роботов.  Вычислительная платформа NVIDIA для искусственного интеллекта найдет применение везде.

ИИ-вычисления для всех индустрий

Наша платформа - это первый шаг к тому, что внедрение искусственного интеллекта станет возможным для каждой индустрии. Глобальная экосистема глубокого обучения на NVIDIA GPU быстро растет.  Прорывные результаты вызвали гонку по внедрению ИИ в Интернет-сервисы для поиска, распознавания речи и изображений, генерирования рекомендаций, перевода и много другого.  Провайдеры облачных сервисов, от Alibaba и Amazon до IBM и Microsoft, делают платформу для глубокого обучения на базе NVIDIA GPU доступной для компаний любых размеров. Самые крупные в мире технологические компании оснащают свои серверы графическими процессорами NVIDIA. Мы были рады осветить на GTC стратегическую важность нашей платформы в основных отраслях:

Искусственный интеллект в индустрии перевозок: Перевозки - это огромная отрасль, которую искусственный интеллект способен кардинально изменить. Автопилотируемые транспортные средства способны сократить число аварий, повысить качество грузовых и пассажирских перевозок. Мы уже сообщали, что такие компании, как Baidu и TomTom остановили свой выбор на NVIDIADRIVEPX 2 в качестве платформы для разработки беспилотных автомобилей. С каждой из них мы работаем над созданием открытой платформы "облако-автомобиль", которая включает систему для создания HD-карт, алгоритмы искусственного интеллекта и суперкомпьютер для задач ИИ.

Вождение - это навык, приобретенный в результате обучения. Однако мы не можем запрограммировать компьютер для овладения этим навыком. Беспилотное вождение требует применения всех возможностей искусственного интеллекта. Компьютеру необходимо оценить окружающую обстановку и  условия для передвижения, спланировать оптимальный маршрут и продолжать процесс обучения, чтобы расширить представления о мире. Широкий спектр опций беспилотного вождения требует открытой масштабируемой архитектуры.

 

 

NVIDIA DRIVE PX 2 имеет масштабируемую архитектуру для обеспечения беспилотного вождения с поддержкой ИИ. На конференции GTC, мы представили конфигурацию вычислительной платформы DRIVEPX 2 с функцией AutoCruise , которая предназначена для автоматического ведения машины по автомагистрали и привязки к карте. Наряду с этим мы представили DriveWorksAlpha 1, операционную систему для автопилотируемых транспортных средств, которая поддерживает все аспекты беспилотного вождения: определение объектов и местоположения, планирование маршрута и управление движением.

Все эти возможности объединены в беспилотном автомобиле NVIDIA BB8. Вот небольшое видео:

NVIDIA стремится создавать инновации на пересечении таких областей, как визуальные вычисления, искусственный интеллект и HPC. Эта уникальная комбинация лежит в самом сердце умных автопилотируемых машин. Впервые у нас есть алгоритмы ИИ, способные превратить беспилотные автомобили и автономных роботов в реальность. Однако для этого требуется эффективная и экономичная вычислительная система.

 

На GTC мы анонсировали Xavier, самую амбициозную однокристальную систему для задач ИИ. Xavier имеет 7 миллиардов транзисторов - больше, чем самые современные CPU для серверов. Примечательно, что Xavier обладает мощностью, эквивалентной компьютеру DRIVE PX 2, представленному ранее в этом году на CES — 20 тера-операций в секунду в задачах глубокого обучения при потреблении всего 20 Вт энергии. По словам Forbes , с Xavier мы удвоили ставку на беспилотные автомобили.

Искусственный интеллект в промышленности: Компания IBM, которая оценивает потенциал когнитивных вычислений в $2 триллиона, представила новый сервер на основе POWER8 и NVIDIA Tesla P100, призванный внедрить технологию искусственного интеллекта в промышленность. А компания SAP объявила, что получила два первых суперкомпьютера  NVIDIA DGX-1 и активно работает над разработкой корпоративных решений для машинного обучения для 320000 своих клиентов в 190 странах.

 
 

Умные города: К 2020 году в мире будет насчитываться порядка 1 миллиарда камер. Hikvision, мировой лидер по производству систем видеонаблюдения, использует искусственный интеллект, чтобы повысить уровень безопасности в населенных пунктах. Компания использует систему DGX-1 для тренировки нейросетей и собрала революционный сервер под названием “Blade”, в состав которого вошли 16 процессоров Jetson TX1. Blade занимает 1/20 от площади 21 сервера на базе CPU и потребляет в 10 раз меньше энергии, обеспечивая эквивалентный уровень производительности.

 

Искусственный интеллект на промышленных объектах: Во всем мире существует около 2 миллиардов промышленных роботов. Япония - центр инноваций в сфере робототехники. На GTC мы рассказали о том, что FANUC, японский гигант робототехнической промышленности, построит завод будущего полностью на базе платформы NVIDIA для искусственного интеллекта. Компания планирует тренировать свои нейронные сети на графических процессорах NVIDIA, системы FANUC Fog на основе GPU будут осуществлять управление роботами и позволят им учиться вместе. Каждый робот получит встроенный GPU для обработки алгоритмов ИИ в реальном времени. MIT Tech Review написали об этом в статье “Роботы японского промышленного гиганта получат "мозги".”

 
 

Новый этап развития: Технология ускорения алгоритмов глубокого обучения на GPU приводит к появлению новой волны стартапов - сейчас их более 1500 по всему миру - в области здравоохранения, финансов, автомобилестроения, разработки веб-приложений и других отраслей. Компания Drive.ai, которая недавно получила лицензию на тестирование своих транспортных средств на дорогах Калифорнии, в разработке беспилотных автомобилей применяет технологию глубокого обучения. Preferred Networks, японский разработчик фреймворка Chainer, разрабатывает решения на основе глубокого обучения для IoT. Лондонский стартап Benevolent.ai, который одним из первых получил систему DGX-1, использует технологии глубокого обучения для поиска лекарств от таких заболеваний, как болезнь Паркинсона, Альцгеймера и редких форм онкологических заболеваний. Согласно данным CB Insights, финансирование стартапов в области искусственного интеллекта во втором квартале превысило $1 миллиард, побив все рекорды.

Рост числа стартапов - еще один индикатор широкого внедрения ИИ в разные индустрии. Как недавно написали в Fortune, глубокое обучение “трансформирует корпоративную Америку.”  

 

Новая эра вычислений

 

Искусственный интеллект для всех

Искусственный интеллект может решить проблемы, которые еще пару лет назад казались невозможными. Используя данные из реального мира, компьютеры могут научиться распознавать образы слишком сложные, большие или, наоборот, слишком маленькие для ПО, созданного человеком, или даже самого человека.  Благодаря ускорению алгоритмов глубокого обучения на GPU теперь это стало возможным и может быть использовано для решения разнообразных задач. Беспилотные автомобили кардинально изменят индустрию перевозок, которая оценивается в $10 триллионов.  Работники здравоохранения будут использовать ИИ для выявления заболеваний на самых ранних стадиях, изучения человеческих генов и поиска лекарств от рака или назначения наиболее эффективных способов лечения. Искусственный интеллект станет частью четвертой индустриальной революции. После автоматизации производства умные роботы положат начало повышению производительности и индивидуализации промышленности для массового потребителя. Искусственный интеллект затронет каждого. Эра искусственного интеллекта уже наступила.

(1) Относительное ускорение обработки кадров в секунду по сравнению с K40 в 2013 году. Производительность AlexNet указана на основе 20 итераций. CPU: 12-ядерный E5-2680v3 с тактовой частотой 2,5 ГГц. 128 ГБ системной памяти, ОС Ubuntu 14.04. Точка данных M40: 8 GPU M40 в узле, P100: 8 GPU P100 с интерфейсом NVLink.