пресс-центр

Искусственный интеллект помогает идентифицировать для науки различные виды растений

Исследователи из Технологического института Коста-Рики и Французского центра международных исследований и развития в сфере сельского хозяйства разработали алгоритм глубокого обучения для автоматической идентификации образцов растений, которые были спрессованы, высушены и помещены на гербарные листы.

По словам ученых, это первая попытка использования глубокого обучения для решения сложной таксономической задачи по идентификации видов растений, представленных в естественно-исторических коллекциях.

В мире насчитывается около 3000 гербариев, в которых хранится порядка 350 миллионов видов растений, и лишь небольшая их часть оцифрована. Проект iDigBio Национального научного фонда США содержит более 150 миллионов изображений растений и животных, которые были собраны со всей страны. Целью проекта является оцифровка имеющейся базы данных, чтобы ученые со всего мира могли ею пользоваться.


Фотографии гербарных листов из набора данных для тренировки нейронной сети.

Используя графические карты GeForce GTX и фреймворк глубокого обучения Caffe с библиотекой cuDNN, ученые обучили свою сверточную нейросеть на более 1000 видах растений, которые были представлены на более чем 260000 сканированных изображений гербарных листов. Натренированный алгоритм демонстрирует 80-процентную точность. Причем в 90% случаев он выбирает один из пяти наиболее вероятных вариантов. Исследователи считают, что уже сейчас разработанный искусственный интеллект существенно превосходит возможности специалиста-систематика.

«Некоторые опасаются, что подобные технологии могут обесценить труд ученых в области ботаники, - говорит ботаник Пьер Бонне (Pierre Bonnet) из Французского центра международных исследований и развития в сфере сельского хозяйства в Монпелье, обращаясь к специалистам, кoторые считают, что их работа недооценивается. - Но описанный подход удалось реализовать только потому, что существует реальный ботанический опыт по определению растений. Разработанный алгоритм никогда не заменит человека». К тому же, добавляет он, необходимо проверять результаты, полученные машиной.

Использование технологии глубокого обучения позволит исследователям проводить дополнительные анализы. Гербарные образцы несут в себе огромный объем информации: к примеру, где и когда они были собраны, находилось ли растение в фазе цветения или плодоносило во время сбора, а также то, насколько плотно цветки были сгруппированы. Так как некоторым образцам уже несколько сотен лет, эти данные могут помочь нарисовать картину того, как растения приспосабливаются к климатическим изменениям. Эта область изучения вызывает все больший интерес в связи с проблемой изменения климата.

Читать подробнее >