В отличие от корпораций уровня Apple, Google или Facebook, в распоряжении стартапов, разрабатывающих ПО с искусственным интеллектом, нет миллионов картинок. Так что для обучения алгоритмов им приходится подделывать изображения. Так, у стартапа из Берлина Spil.ly были проблемы. Компания разрабатывала приложение дополненной реальности сродни полноразмерной версии селфи-фильтров Snapchat. ПО позволяет, например, с помощью телефона трансформировать тела друзей при помощи спецэффектов: меха, огня и т.д. Чтобы функционал заработал, ребятам из Spil.ly нужно было обучить алгоритмы достаточно близкому отслеживанию на видеоролике тела человека. Однако у стартапа не было ресурсов для сбора десятков и сотен тысяч сделанных вручную снимков, необходимых для обучения алгоритмов в проекте такого рода. Один из руководителей Spil.ly, Макс Шнайдер, подтверждает, что новичкам действительно сложно работать с искусственным интеллектом. Любой из них просто не может себе позволить оплачивать так много данных.

Каким может быть решение? Сфабриковать информацию!

Некоторые стартапы используют фейковые данные для тренировки искусственного интеллекта

Инженеры Spil.ly начали создавать собственные картинки для обучения алгоритмов, адаптируя технологии, используемые при создании графики игр и видеографики. Около года спустя у компании было примерно 10 миллионов изображений, созданных путем вставки так называемых людей-симуляторов во вполне реальные фотографии. Выглядят они неважно, но работают неплохо. Можно рассматривать это как вставку искусственного в искусственный интеллект.

Инженер компании Адам Шустер отмечает, что используемые ими модели – это полностью синтезированные данные, довольно близкие при этом к моделям, которые получены из реальных данных. Имеется демонстрация, на которой виртуальная обезьянка на столе, отображаемом камерой iPhone, спрыгивает на землю. Затем она обрызгивает краской одежду стоящего рядом реального человека. Слоган «Fake it ‘til you make it» («Притворяйся этим, пока не сделаешь это правдой») реально используется многими стартапами, пытающимися выжить на рынках с более крупными игроками. Но некоторые компании, вроде инноватора в области анализов крови Theranos, получили с такой идеологией массу неприятностей. И все же в мире машинного обучения подмена обучающих данных становится вполне законным способом быстрого старта проектов в условиях нехватки денег или собственно информации.

Движение фальшивых данных может увеличить использование искусственного интеллекта в новых областях жизни и бизнеса. Машинные обучающие алгоритмы не настолько гибки, как разум человека. Применение их для решения новых задач обычно требует наличия специфичных данных. Так, базирующийся в эстонском Таллинне стартап Neuromation разрабатывает изображения, содержащие «фальшивых» свиней. Это – часть работы на клиента, желающего использовать камеры для отслеживания роста домашнего скота. Тем временем компании Apple, Google и Microsoft вовсю публикуют научно-исследовательские работы, посвященные удобству использования синтетических обучающих данных. Партнер венчурной фирмы LDV Capital Эван Ниссельсон утверждает, что синтетические данные дают стартапам шанс на успешную конкуренцию с богатыми гигантами в этой области. По его словам, талантливые команды часто страдают от нехватки данных. Он полагает, что возможность создавать синтетические данные для обучения моделей может уравновесить исходные условия стартапов и крупных компаний. История Spil.ly делает этот аргумент более весомым. В феврале 2018 года компания Facebook анонсировала собственное приложение машинного обучения, способное накладывать спецэффекты на людей в видеосюжетах. Это ПО, Densepose, было обучено на 50 000 картинках людей, аннотированных вручную с 5 миллионов позиций. Вскоре Spil.ly начала синтезировать данные, подобные указанным Facebook. Стартап интегрировал использованные в Densepose идеи в собственный продукт.

Некоторые стартапы используют фейковые данные для тренировки искусственного интеллекта

Neuromation и другие компании хотят утвердиться в роли брокеров фейковых данных. У Neuromation есть еще один проект, включающий создание картинок с полками продуктовых магазинов для OSA HP. Эта аналитическая компания работает в сфере розничной торговли с клиентами, включая французскую группу компаний Ашан. Данные представляют собой алгоритмы, считывающие картинки для отслеживания запасов на полках. Александр Исаев, один из руководителей OSA, говорит, что огромное количество категорий продуктов и различные условия розничной торговли делают сбор и маркировку изображений нецелесообразным. Офир Чейкон, сооснователь израильского стартапа DataGen, заверяет, что его компания взимает семизначные суммы за производство пользовательских видео с симулированными (и довольно-таки жуткими) руками. Реалии компании – часть техники, популярной в сфере машинного обучения: так называемые «генеративные состязательные сети» могут создавать фотореалистичные картинки. На взгляд человека, эти руки, равно как и фейковые свинки компании Neuromation, не выглядят настоящими. Шустер из Spil.ly отмечает, что когда впервые увидел синтезированный набор данных, решил, что это просто ужасно. Он не понимал, как вообще компьютер может на этом обучаться. Но кому какое дело до нашего впечатления, если компьютер понимает подобную картинку. Конечно, определенные усилия потребуются на то, чтобы заставить компьютер понимать все корректно. Spil.ly первоначально синтезировала только обнаженные фигуры. Но было замечено, что приложение училось следить только за кожей. Теперь система стартапа генерирует людей с разными очертаниями тела, оттенками кожи, волос и одежды. Spil.ly и другие компании нередко также обучают свои системы на небольших объемах реальных изображений, дополняя ими миллионы синтетических примеров. Даже компании, обладающие наибольшим количеством денег и данных, прибегают к использованию синтетической информации. К примеру, исследователи Google тренируют роботов на симулированных мирах. А компания Microsoft опубликовала прошлогодние данные использования 2 миллионов синтетических предложений для улучшения перевода с левантийского диалекта арабского языка.

Некоторые стартапы используют фейковые данные для тренировки искусственного интеллекта

Компания Apple держит работу с искусственным интеллектом в большем секрете. Но и она демонстрирует интерес к фейковой обучающей информации. В 2016 году компания опубликовала исследование, посвященное генерации реалистичных изображений глаз для улучшения ПО определения взгляда. Примерно через год компания выпустила iPhone X, который разблокировывается по взгляду пользователя, а затем распознает его лицо. Некоторые исследователи работали в обоих проектах. Компания отказывается сообщать, использовала ли она результаты исследований в функционале разблокировки. В робототехнике синтетические обучающие данные помогают исследователям проводить эксперименты в большем масштабе, чем это возможно в реальном мире. Как говорят представители Alphabet, беспилотные машины компании проехали миллионы миль по общественным дорогам. Однако во время испытаний приложение путешествовало по биллионам миль симулированных улиц. Если давать машинам цифровые пары, это поможет роботам обучиться лучшему управлению объектами на производствах и дома. Исследователи OpenAI, научного института, сооснованного Илоном Маском, обнаружили, что могут обучать программное обеспечение на симулированном мире. Любопытно, что это неплохо работает с реальными роботами. Подобные приемы помогают использовать в симулированном мире случайным образом выбранные цвета и текстуры. При этом приложение фокусируется на главной проблеме. Кроме того, формируются миллионы различных объектов странной формы, которые приложению нужно усвоить. Как уверяет Джон Тобин, исследователь из OpenAI, еще пару лет назад превалировала уверенность в том, что симулированные данные не слишком полезны. Однако в последнее время это убеждение в целом пошатнулось. И все же, несмотря на эти успехи, фейковые данные не всесильны. Многие сложные вещи еще не настолько хорошо поняты, чтобы можно было их реалистично воспроизводить. Бывает и так, что ставки слишком высоки для того, чтобы можно было рисковать, создавая систему хоть сколько-нибудь оторванную от реальности. Михаил Абрамов, профессор Университета Иовы (University of Iowa), разработал способы генерирования изображений сетчатки. По его словам, им используются синтетические данные из студенческих проектов. Однако он придерживался реальных изображений при разработке программного обеспечения для проверки сетчатки. В итоге его стартап IDx был одобрен FDA. По словам Абрамова, на этом этапе они пытались оставаться предельно консервативными.