В 2020 году в Самарском университете им. Королева появилась новая академическая структура в формате "гринфилд". Она аккумулировала накопленный опыт ведущих научных школ и занимается исследованиями в области искусственного интеллекта. О том, над чем сейчас работают ученые одноименного института, "Первому" рассказал руководитель структуры Артем Никоноров.
— Каковы самые свежие и интересные проекты института искусственного интеллекта?
— Начну с того, что одна из ключевых задач института – поиск крупных высокотехнологичных партнеров. Сбер – одна из компаний, с которыми у нас сложились достаточно продуктивные отношения. В 2021-2022 годах мы совместно со Сбером участвовали в создании мультимодальной нейросети ruDALL-E, сейчас она называется Kandinsky. Эта нейросеть генерирует картинку по вашему текстовому запросу. Например, вы даете задание чат-боту на смартфоне или компьютере: нарисуй мне "зеленый луг в солнечный день" или "Петра I на корабле в Голландии" – и через несколько секунд картинка готова. Это наш российский ответ Midjourney. Сбер ее представил на международной конференции AI Journey.
— А чем она отличается от иностранных аналогов?
— Она сделана полностью на русскоязычном корпусе. Сейчас наблюдается интересный тренд – на основе таких больших языковых моделей можно заниматься не только интертейментом – можно уйти в промышленность, в образование, используя для создания базиса как языковые, так и визуальные инструменты.
— Поясните.
— Сейчас нейросети GPT используют для генерации текста или для его креативного рерайтинга. Но этот текстовый помощник можно превратить в консультанта, к примеру, в юридической сфере. В России до 115 тысяч различных законодательных актов, и для написания чего-то чуть более сложного, чем доверенность на ребенка для выезда за границу, нужно сразу обращаться к юристу. То есть нужен специалист, у которого в голове есть все необходимые законы. Однако теперь можно поручить это GPT, чтобы сеть проанализировала вопросы и посоветовала, в каком направлении действовать.
— Сколько же юристов может лишиться работы…
— Наоборот, это их разгрузит, снимет рутину и позволит заниматься более сложными и интересными вопросами. Я говорю о первичной обработке запроса, можно даже на портале "Госуслуги" такой ресурс завести. К примеру, когда мы обучали ruDALL-E, то загрузили в нейросеть 250 млн аннотированных изображений. А здесь можно добавить сотни тысяч законодательных актов.
Если к текстовой модальности добавить визуальную, то этот же принцип можно масштабировать, например, для анализа состояния посевов или лесопосадок с беспилотников для нужд сельского хозяйства. Заложив в нейросеть разные породы деревьев и связав текст с картинкой, мы сможем ввести текстовый запрос: скажи нам, пожалуйста, такая-то нейросеть, сколько на этом видео елок, каков их средний возраст и т.д. Такие нейросети называют базисными отраслевыми моделями, по-английски Foundation AI Models.
— То есть, получается, вы уже говорите о создании нейросетей для беспилотников.
— Да, и здесь мы развиваем эту тему с нашим ключевым партнером – компанией "Транспорт будущего". Это амбициозная, крупная компания с большим потенциалом. Она создает на территории Особой экономической зоны "Тольятти" завод по производству гражданских беспилотников. По сути, она строит новую отрасль в стране.
— А какова там будет ваша роль?
— Мы делаем для них базисную отраслевую модель, которая будет оценивать и контролировать, как специалист собирает и эксплуатирует дрон: правильные ли винтики вкручивает, в той ли последовательности, как разводит лопасти, заливает масло, насколько он в целом вовлечен в процесс – слушает он вас или витает в облаках… В конце дня такую нейросеть можно будет попросить рассказать обо всех происшествиях – кто с чем не справился, что пошло не так. Та же система подойдет для обучения на производстве, для контроля эксплуатационных процессов – везде, где задействовано много людей, техники, где действует большой конвейер. В основе будет лежать базисная модель, учитывающая до 150 млрд. различных параметров.
— А если какой-то из сборщиков дрона отвлечется – он негоден?
— Главное, чтобы оператор дрона был в тонусе, внимателен и вовлечен в процесс. Внимание можно натренировать с помощью обучающих тренажеров – VR, специальных датчиков, показывающих вовлеченность человека в процесс.
— То есть вы делаете систему, которая сводит так называемый человеческий фактор, возможность ошибки к нулю. Искусственный интеллект здесь, получается, призван помочь человеку?
— Именно так.
—А сейчас вы акцентировали работу на транспорте?
— Да, у нашего университета большой бэкграунд по транспортной тематике, а софт для "умных" беспилотников, аватары для обучения операторов дронов – это сфера, где у нас есть мощная научная школа и хорошие кейсы.
— Какие же беспилотники нужны "Транспорту будущего"?
— В первую очередь агродроны. Поскольку они хотят создать новую отрасль, то здесь возникает много вызовов – например, чтобы дрон смог быть в воздухе не 40 минут, а 10 часов. Вопрос в том, какой двигатель для этого нужно "навесить" на беспилотник, и здесь перед всем нашим университетом открывается широкий спектр задач.
Наша же "айтишная" задача, – создать мозг для эффективной и безопасной работы беспилотников. Ведь если самолетов в стране сейчас летает несколько сотен, то дронов и беспилотников, если мы говорим о целой отрасли, будут тысячи. И их нужно будет контролировать: понадобится особая экосистема, спообная проверять коды беспилотников так же строго, как и коды авиалайнеров. Нужно будет создать планировщик миссий для протяженной инфраструктуры. Нужно будет контролировать производство и эксплуатацию дронов.
Все это необходимо в конечном счете для того, чтобы аграрий сказал дрону: облети вот это поле и скажи мне, сколько удобрений нужно внести. И машина должна его слушаться. При этом дрон не должен залететь в чужой воздушный коридор. Для этого такая задача должна уйти на полетный контроллер, то есть на "мозги" коптера.
Главное требование для появления и развития беспилотной авиационной отрасли – максимальная безопасность дронов для человека и окружающей его среды, для важной инфраструктуры. Вспоминается сходная ситуация в строительной индустрии, лифты в зданиях стали строить повсеместно, во всем мире, только после того, как Отис изобрел автоматический ловитель – устройство, автоматически останавливающее лифт в случае обрыва троса. До того лифты были весьма небезопасны, что и блокировало их распространение. Поэтому подобная интеллектуальная система, обеспечивающая безопасность полетов БПЛА, несомненно, даст толчок к созданию беспилотной авиационной отрасли в нашей стране и мире.
— А сейчас кто контролирует воздушные коридоры для дронов?
— Компания "Небосвод", она согласует все воздушные коридоры для беспилотников. И мы сейчас интегрируемся в ее систему.
— С какими еще партнерами у вас сложились успешные кейсы?
— Ряд наших разработок внедряется на объектах Российской железной дороги. Одна из них – это система технического зрения для проверки передвижного состава. Еще одна технология позволяет с помощью камер на беспилотных летательных аппаратах вести мониторинг дорожной инфраструктуры, строить трехмерные модели и определять повреждения объектов. Первая технология отвечает за управление беспилотными летательными аппаратами, которые в процессе осмотра объектов инфраструктуры выполняют их фото- и видеосъемку. Второй модуль занимается фотограмметрической обработкой полученных изображений и на их основе выполняет линейные и объемные измерения объектов.
— Для чего это используется?
— У РЖД самая большая в стране по протяженности путевая инфраструктура, которую надо быстро и очень внимательно обслуживать. Условно говоря, для проверки семи тысяч километров путей Куйбышевской ЖД необходимо 150 человек: они все обходят, проверяют шпалы, заклепки и т.д. А тут оперативно пролетает дрон, фиксирует все параметры – и все. Наша нейросеть выявляет дефекты и повреждения на путях, на зданиях и сооружениях и сообщает о них, позволяя человеку принять решение об их ремонте.
— То есть, опять же, мы говорим о том, что искусственный интеллект отбирает у людей работу?
— Нет, мы говорим о том, что из "синих" воротничков сотрудники становятся "белыми" воротничками. И могут заниматься высококвалифицированным трудом – стать операторами дронов, получить новую специализацию, правильно спланировать весь сложный процесс. Сейчас у университета контракт на поставку 16 таких лицензий по всей РЖД. 30 ноября наши ребята ездили в Москву и установили этот "умный" софт для анализа видео с дронов.
Фото: Ирина Кудрина, Олеся Орина