Из Института кибернетики 1960-х – в Google: Украинская школа распознавания образов

Подтянутые миллиардеры, продвинутые айтишные парни, выступая со сцены, рассказывают понятными человеческими словами о своих разработках, польза и удобство которых очевидны – да, к таким хочется пойти за, образно, говоря, «айфоном», даже в очереди с удовольствием можно постоять. Но почему среди них нету «золотых мозгов» Украины, что не так с украинскими ребятами?

«Гранит науки» начинает серию публикаций об украинской «силиконовой долине» — Международном научно-учебном центре информационных технологий и систем (МНУЦИТиС) НАН и МОН Украины под руководством соратника всемирно известного кибернетика Глушкова, члена-корреспондента НАНУ Владимира Ильича Гриценко. И первый рассказ – об украинской школе распознавания образов, наработками которой в настоящее время совершенно законно пользуется компания Google.

Основанная Глушковым, еще на заре развития украинской кибернетики (1962 год), киевская школа распознавания образов известна во всем мире. Первый заведующий одноименного отдела в Институте кибернетики, выдающийся ученый Владимир Антонович Ковалевский – последние четверть века он живет в Берлине – стоял у истоков авторитетной организации IAPR (InternationalAssociation for Pattern Recognition), вместе с K.S. Fu, C.K. Chow, R.O. Duda, H. Freeman, L. A. Rosenfeld, и первым в Советском Союзе ее членом.

Характерной чертой школы является соединение фундаментальных исследований и прикладных разработок. После обретения Украиной независимости Институт кибернетики разделился на 5 институтов: так легче было выживать. Отдел распознавания образов оказался в составе МНУЦИТиС. Международный Центр явился инициатором исследований и разработки концепции нового класса информационных технологий – интеллектуальных информационных технологий, в состав которых входят и технологии, основанные на распознавании образов. Это особые наукоемкие информационные технологии, отличающиеся от известных ИТ использованием в процессах переработки информации наряду с технологиями программных вычислений технологий нового качества – оперирование образами информационных объектов. Трудно перечислить все возможные области применения распознавания образов. Еще труднее назвать те области науки и техники, которые в распознавании образов не нуждаются. Функциональные возможности и особенности интеллектуальных информационных технологий открывают новые пути решения сложных задач в самых различных областях.

Профессор Ковалевский передал руководство отделом своему ученику, ныне не менее известному ученому Михаилу Шлезингеру (его повествование о школе с сугубо научного ракурса читайте здесь). В настоящее время «звезда» европейского распознавания», известная во многих мировых университетах личность (в том числе, он проводил серию семинаров в Оксфорде), автор книги «10 лекций по статическому и структурному распознаванию», которая вышла на трех языках (чешском, английском и русском), профессор Михаил Иванович Шлезингер продолжает трудиться в отделе на должности главного научного сотрудника: она позволяет больше заниматься наукой и меньше – организационной работой. На посту руководителя его сменил более молодой воспитанник профессора Ковалевского, кандидат технических наук Вячеслав Мацелло, который пришел в отдел 43 года назад. Фамилия Вячеслава Васильевича звучит иностранно, хотя он украинец и в родословной итальянских корней не имеет, а вот профессор Шлезингер по национальности чех, родом из Ужгорода.

*Научный лидер отдела профессор Шлезингер, застигнутый в коридоре МНУЦИТиСа*

Учеными украинской школы распознавания впервые в мире были созданы теоретические основы, постановка задачи и алгоритмы самообучения систем распознавания. Этот результат сейчас составляет один из базовых методов прикладной статистики. Важные фундаментальные результаты были получены в создании математических основ структурного распознавания, а именно теории двумерных грамматик, теории удовлетворения ограничений и ее стохастических и оптимизационных обобщений.

С 1997 года исследования проблемы сосредоточены в МНУЦИТиС, по инициативе которого была принята государственная научно-техническая программа «Образный компьютер», что свидетельствовало о понимании их государственной важности. Формирование программы завершило организационное становление распознавания образов как самостоятельной научной дисциплины. Важным научным результатом выполнения этой программы явилось существенное расширение научного содержания проблемы распознавания образов как математической модели особого типа мышления, названного образным мышлением.

По результатам исследований профессор Шлезингер предложил формальную математическую конструкцию, которая позволяет математически формулировать различные задачи, которые относятся к искусственному интеллекту, и решать их. Эта модель (построенная на требованиях, которые предъявляются к решению) получила название модели образного мышления – в отличие от логического мышления, на котором основана информатика (исходные данные – алгоритм решения на компьютере – результат). Полученные результаты являются основой дальнейшего развития науки о распознавании образов как составной части новейшего направления информатики: теории машинного образного мышления.

«Сейчас бытует мнение, что искусственный интеллект – это нейронные сети, обучающиеся на примерах, и все. Например, в программу закладывается большое количество примеров с меткой: «это А» , «это не А». И система настраивает свои параметры так, чтобы на этих примерах давать правильный ответ. Но нейронная сеть не сможет промоделировать, например, такое интеллектуальное занятие человека, как решение математических головоломок типа судоку или решить еще множество задач, относящихся к ИИ. Кроме нейронных сетей, для задач ИИ существует масса методов, которые, в том числе, разработали мы в нашем отделе. Например, структурные методы распознавания, которые вписываются в проблему Constrained Satisfaction Problem, а также новые статистические методы. Представьте задачу самообучения: на изображении есть 4 области с разной текстурой, примеров при этом не показывается, ИИ должен определить сам, где какая. Впервые этот апарат предложил как раз профессор Шлезингер еще в 1968 году», — рассказал Вячеслав Мацелло. Спор о том, что такое ИИ, ведется до сих пор, но чтобы получить более четкое представление о том, какой смысл вкладывают в это понятие профессионалы, а не «рекламщики», Вячеслав Васильевич рекомендует ознакомиться со статьей Михаила Шлезингера и Владимира Гриценко «Взаимосвязь проблем распознавания образов, машинного мышления и обучения», опубликованной в №3 международного научно-технического журнала «Проблемы управления и информатики» в 2020 году.

*Вячеслав Мацелло проводит презентацию технологических разработок отдела*

Результаты теоретических исследований воплощены в ряд прикладных информационных технологий обработки и понимания изображений, таких, как многострочные цифровые тексты, бланки документов, нотные тексты, геофизические карты, треки микрочастиц, стереопары изображений, дактилоскопические изображения, изображения человеческих лиц и т.д. За рубежом внедрены:

Система распознавания чертежей большого размера (в 6 раз быстрее, чем в среднем в мире; за эту технологию ещё в советское время отдел получил Золотую медаль ВДНХ в Москве; внедрено на фирме WACOM, Япония).
Технология текстурной сегментации аэроизображений (внедрено на фирме JenaOptronics, Германия).
По заказу полиции Германии совместно с немецкими коллегами создана технология для распознавания отпечатков обуви (пока не внедрена).
Технология восстановления трехмерного изображения городских кварталов (внедрено на фирме MAPPI, Франция).
Технология идентификации личности по изображению ее лица (внедрена на фирме Viewdle, США-Украина). Это первая украинская информационная технология, которая была закуплена корпорацией Google.

О последнем пункте стоит рассказать подробнее. Данную сделку в мире ІТ сразу назвали «сделкой года», а ее предмет министр образования и науки в 2016 году Лилия Гриневич назвала одним из четырех наиболее существенных достижений украинцев за годы независимости. Правда, приписав его непосредственно «проекту Viewdle киевлянина Егора Анчишкина по разработке уникальных алгоритмов выявления и распознавания лиц и объектов». Якобы проект был начат в 2006 году, а уже в 2012 году компанию и «ее разработки» купил Google, и «сегодня алгоритмы и решения, предложенные Viewdle, широко используют в поисковых технологиях» — в частности, «на основе этой технологии работает сервис поиска по изображению, когда для запроса используются файлы, загруженные в поисковую строку».

Вот что рассказывает по этому поводу Вячеслав Мацелло:

— Распознавание образов и применение новых методов для распознавания изображений – очень важная тема, ведь 90% информации об окружающем мире мы получаем через зрение. Научить компьютер видеть – не только записать, но еще и понимать увиденное – такая задача стоит перед разработчиками систем распознавания изображений. В 2002 году МНУЦИТиС «пробил» на 10 лет государственную научно-техническую программу «Образный компьютер», нацеленную на создание интеллектуальных компьютерных технологий. В ходе выполнения программы было разработано почти два десятка технологий, в том числе распознавание человеческих лиц. На эту технологию мы получили патент Украины, а потом ею заинтересовался, увидев коммерческую перспективу, Егор Анчишкин, выпускник КПИ. Он слушал лекции профессора Шлезингера, его товарищи проходили практику в нашем отделе. Вместе со своим другом Максимом Школьником они организовал свой стартап под названием Viewdle и после длительных переговоров заключили контракт с МНУЦИТиС на право патентования технологии распознавания лиц за рубежом.

Контракт был заключен с роялти, но до самой своей продажи стартап Viewdle не был прибыльным.Да, ребята были очень грамотные, активные, участвовали в конкурсах стартапов – и в итоге суммарно привлекли около 10 млн. долларов инвестиций на техническую разработку идеи. У нас была экспериментальная система, а они довели ее за эти деньги до уровня готового продукта. Для Академии наук эта сумма, конечно, была несусветной. Поэтому я не считаю, что Viewdle нас «ограбил» на технологию. Любой стартап это рискованное дело, могло получиться, могло — нет. Мы получили свои 2% ($700 тыс. от суммы продажи $35 млн.) от суммы продажи их компании, как то и было оговорено в нашем контракте. И все же: если бы нас послушали в правительстве и сделали продолжение программы «Образный компьютер», дали возможность создавать и развить наукоемкие технологии, мы бы сейчас находились в гораздо более завидном положении.

А после той продажи тема распознавания лиц в нашем отделе уже была завершена, разве что на основании этой же технологии мы разработали компьютерную систему доступа в помещения «Видеосекьюрити». Прототип ее, лабораторный макет, «слепленный на коленке», если использовать слэнг, и сейчас прикреплен у входа в наш отдел. Нажимаешь на кнопку – если система тебя знает, то говорит «Здравствуйте, Вячеслав Васильевич» и пропускает, если нет – «Извините, я вас не знаю». Мы сделали Видеосекьюрити одними из первых в мире, и сделали довольно хорошо. Обычно эти системы чувствительны к поворотам. Но мы, используя сгенерированную нами 3D-модель лица, можем прогенерировать все повороты, что позволило улучшить качество распознавания.

К сожалению, внедрение «Видеосекьюрити» в Украине не получилось: конструкторскую документацию делал львовский коллектив при заводе «Текон-Электрон», и уровень ее оказался не такой, чтобы это еще кого-то заинтересовало. Даже опытная партия из 10 устройств, произведенная на «Электроне», оказалась по качеству гораздо ниже современных рыночных требований.

*Центральный вход в МНУЦИТиС (по-украински кратко — МННЦ) на Теремках*

Вы спросите: а какие же из разработок были внедрены в Украине? Может, полностью вся Нацполиция работает на интеллектуальной собственности МНУЦИТиС? Быть может, днюют и ночуют в приемной директора представители коммерческих фирм, с целью получить хоть кроху с интеллектуального пиршества, которое непрерывно совершается в стенах этого двухэтажного ничем не приметного здания на околице Киева, кроме, пожалуй, красивого торцевого панно на кибернетическую тему?

Увы. Один из немногих примеров – технология кодирования геофизических карт, внедренная в Институте геофизики НАНУ. «Как-то в Украине трудно найти своего потребителя, — говорит Вячеслав Мацелло. – Мы Академия наук, наша основная продукция это новые знания. Мы их добываем, «откапываем» и делаем экспериментальные системы, которые доказывают, что эти знания правильные. Нашей задачей не является выпуск на рынок продуктов для конечного пользователя. Этим должны заниматься грамотные программисты, экономисты и маркетологи (которых очень много в Украине), используя технологии, предложенные учеными, и с учетом требований рынка. Нужно свое опытное производство, где бы подготовленные специалисты воплощали в железе идеи ученых – то, что сейчас модно во всем мире и называется красивым словом «технопарк». Мы участвовали во многих выставках в Украине и за рубежом, неоднократно «докладывались» в министерства, которых наши разработки могли бы заинтересовать. Все каждый раз в восхищении, но чтобы довести идею до серийного производства, расходы требуются в 10 раз больше, чем на научную разработку. Поэтому «конечному потребителю» проще купить готовый продукт за границей, чем заказать такую разработку в Украине. Мы не смирились с этой ситуацией и продолжаем искать партнеров в Украине. В то же время мы направляем много своих усилий на подготовку талантливых молодых исследователей, на повышение количества умных людей в Украине. Для этого, в частности, по нашей инициативе открыта новая специальность магистров в Физико-техническом институте КПИ. Совместно с преподавателями Политеха мы приглашаем для чтения лекций известных украинских и зарубежных специалистов в области искусственного интеллекта. До карантина, в 2019 году, например, такие курсы читали профессор Б.Флах из Германии, доктор Ф.Вернер из Чехии и другие».

О некоторых прикладных разработках отдела распознавания образов МНУЦИТиС 10-летней давности, с иллюстрациями, можно прочитать в этой статье. После окончания работы над «Видеосекьюрити» отдел все больше занимался теоретической работой, фундаментальными исследованиями. Новое доказательство леммы Неймана о седловой точке (для «непосвященных» — даже не имеет смысла объяснять, что это, но для мира кибернетиков более чем существенно), новые структурные методы разметки, самый быстрый в мире алгоритм определения схожести замкнутых циклов в метрике Фреше. Недавним изобретением, пользу которого можно увидеть воочию, стала технология, крайне актуальная в эпоху онлайн-образования. На ее основе создана программа, «стирающая» преподавателя, чтобы он не закрывал собою доску, пока что-то на ней пишет. Но, по словам Вячеслава Мацелло, это не «стирание» технически: «Вы первая из посторонних, кто эту “доску” смотрит. В ней применены методы, которые для таких задач еще не применялись: чтобы оставить только те объекты, которые находятся в плоскости доски, мы используем методы стереозрения, восстановление объектов по стереопарам снимков. По сути, это ноу-хау, и мы хотим получить на него патент».

Премьера технологии, разработанной отделом распознавания образов Международного научно-учебного центра информационных технологий и систем (МНУЦИТС) Национальной академии наук Украины и Министерства образования и науки. Видео передано эксклюзивно «Граниту науки»

Несколько воспитанников отдела распознавания образов МНУЦИТиС работают в Гейдельбергском университете, университете Цюриха, Дрезденском и Пражском технических университетах, один является профессором в Оклендском университете (Новая Зеландия). Егор Анчишкин после продажи своей фирмы на некоторое время возвращался в Киев, где руководил компанией, связанной с доставкой продуктов из торговых сетей; сейчас он снова в США, организовывает другой стартап. По призыву нового американского менеджмента Viewdle в Силиконовую долину уехали половина разработчиков из отдела, возглавляемого Вячеславом Мацелло – набравшись ума и опыта. Здесь готовились кадры, которые работают в Motorolla, Samsung, Huawei и подобных гигантах IT-индустрии. «Сейчас выигрывают талантливые ребята, которые на основе своих инженерных знаний делают стартапы очень полезные, но не очень наукоемкие, — объясняет Вячеслав Васильевич. – Например, программа, которая помогает облегчить онлайн-торговлю… Стартапы направлены на решение практических задач, это отличный инженерный труд. А наши вещи основаны на ноу-хау, новых знаниях».

Странное дело. До чего абсурдная, холодящая своей глубиной пропасть между светлыми умами ученых – и потребностями жизни! Вячеслав Мацелло убежден, что это не дело Академии наук, искать прикладные задачи, чтобы решать их новейшими технологиями, которые разрабатываются учеными с их высокими научными интересами. «У нас нету сил, возможности следить за рынком, отслеживать цены и какие продукты вышли на рынок, какие нет, — говорит он. – В этом отношении показателен опыт Вьюдл: они изучали тенденции и задачи, которые могли быть успешно проданы». При Советском Союзе проблема финансирования отечественных разработчиков решалась автоматически: всем государственным (других не было) предприятиям и министервам из бюджета выделялись средства, которые они могли потратить только на новую технику, модернизацию и исследования. Оттуда Институт кибернетики получал хорошие заказы и, в результате, золотые медали ВДНХ. Сейчас даже у госструктур «принято» делать заказы за рубежом, поскольку на этом есть возможность что-то «наварить» – свидетельств подобных злоупотреблений в истории независимой Украины немало. А чтобы сделать из разработки того же отдела распознавания образов МНУЦИТиС продукт, которым может пользоваться, например, следователь-криминалист, надо наоборот что-то вложить, причем по-честному.

Да, проблему невостребованности и отсутствия денег на исследования и научные разработки вроде бы призваны решить конкурсы проектов на гранты от государства, но вот один из таких недавно прошел в Украине, и многим явным претендентам на победу было отказано – среди прочих, не получила поддержки заявка МНУЦИТиС. Поэтому Вячеславу Мацелло «не хватает» частных инвесторов, которые готовы вкладывать в фундаментальную науку. Вообще, Вячеславу Васильевичу аж нисколько не претит пример зарубежных коллег, руководителей научных подразделений, половину рабочего времени которых занимает написание многочисленных параллельных грантовых заявок, а вторую половину – их реализация. «Я считаю, что государственные грантовые конкурсы – это полезное начинание, но там еще много недостатков, не всегда гранты получают самые достойные. Это такая “кибернетика”, в которой я до сих пор не разобрался», — с грустью вздыхает ученый.