Связанные одной

Прослушать новость

Наталья Югринова

Компьютеры стремительно осваивают задачи, с которыми прежде справлялся только человек. И в последние годы они делают это все успешнее — благодаря развитию глубокого машинного обучения и нейронных сетей. В России бизнес, связанный с нейросетями, строят десятки больших и мелких компаний, а соответствующие технологии вовсю приживаются в потребительских сервисах. Кого и зачем «опутывают» нейросети?

В конце 2015 года молодой российский стартап NTechLab отмечал свою первую большую победу. Алгоритм распознавания лиц, созданный его командой, опередил в одном из соревнований на мировом чемпионате в Сиэтле разработку Google. Он распознал 73,3% нужных лиц из миллиона фотографий людей примерно одного возраста. Точность алгоритма Google, занявшего второе место, составила лишь 70,5%. Так что три российских программиста обошли в конкурсе добрую сотню крупных университетов и корпораций с большими бюджетами. С тех пор предложения о покупке разработки посыпались со всех сторон — от китайских казино до спецслужб нескольких стран. В августе 2017 года компания NTechLab, выросшая к этому времени в несколько раз и заручившаяся солидной клиентской базой (в числе которой компания «1С Битрикс» и правительство Москвы), снова оказалась в победителях. Ее алгоритм занял первое место в рейтинге Национального института стандартов и технологий Министерства торговли США — одного из наиболее авторитетных тестов, определяющих качество решений в области биометрии во всем мире.

Нейронные сети — это математические модели, структурно и функционально напоминающие человеческую нервную систему. Они состоят из большого количества отдельных вычислительных элементов — «нейронов», которые располагаются слоями

По образу и подобию
Алгоритм для распознавания лиц, разработанный в NTechLab, базируется на нейронных сетях — одном из множества направлений в области машинного обучения и искусственного интеллекта. Однако если в других областях (таких как марковские цепи, генетические алгоритмы и пр.) за последние десять лет ничего особенного не произошло, то нейросети начали переживать настоящий бум популярности. Они стали значительно превосходить по качеству работы другие алгоритмы и в некоторых задачах приблизились к уровню способностей человека.
Нейронные сети по своей сути не что иное, как математические модели, структурно и функционально напоминающие человеческую нервную систему. Они состоят из большого количества отдельных вычислительных элементов — «нейронов», которые располагаются несколькими слоями. В простых нейросетях подобных уровней три–пять, в глубоких может быть более сотни (к примеру, компания Microsoft «сплела» нейросеть из 152 слоев). Входные данные, попадающие в сеть, последовательно обрабатываются каждым из слоев и на выходе выдают определенный результат. Как и в человеческом мозге, нейроны могут тренироваться, обучаться, образовывать клубки связей и находить новые, более эффективные пути решения. Это позволяет выполнять задачу быстрее и качественнее, уменьшая число ошибок при каждой следующей операции.
«Машинное обучение очень похоже на обучение человека, — объясняет генеральный директор компании «Нейросети Ашманова» Станислав Ашманов. — Сначала глупому, неопытному алгоритму показывают примеры, а затем дают попробовать выполнить такое же действие. За ошибки его штрафуют, а за правильные ответы поощряют. Таким образом алгоритм меняет свои внутренние параметры — учится». Однако самые интересные и полезные сети — сверхглубокие, состоящие из большого количества слоев, — стандартными методами долгое время обучать не получалось. Полезный сигнал об ошибке или правильном ответе алгоритма не удавалось передать по всей сети. Поэтому качество работы таких сетей быстро деградировало по мере увеличения их размера и сложности задач. Ученые были готовы опустить руки, но в 2007 году канадский математик Джеффри Хинтон придумал, как эффективно обучать многослойные нейросети. А через несколько лет «дозрели» и технологии высокопроизводительных вычислений.
Нейросети всегда требовали значительных процессорных мощностей. Каждый из нейронов в сети выполняет простейшие операции со всеми данными или их кусочком: например, перемножает два вектора. И хотя эти операции простые, их очень много. «До определенного момента необходимых мощностей для работы сверхглубоких сетей не было ни у исследователей, ни у бизнеса, —
продолжает Ашманов. — Однако в 2010-х годах появились GPU-видеокарты для работы на серверах. Они действуют как графические ускорители и идеально приспособлены для параллельного выполнения огромного количества простых операций».

Корм для алгоритмов
Наконец, прорыву в нейросетях поспособствовали «большие данные». Дело в том, что нейронным сетям для обучения приходится «скармливать» огромный объем информации. Если с нуля обучать сеть распознавать простейшие объекты, скажем, на изображениях, потребуется как минимум тысяча примеров для получения самых элементарных результатов. А добиться высокой точности можно лишь после серьезной тренировки нейросети на выборках в сотни тысяч объектов. Где взять столько данных? Благодаря интернету собирать их стало значительно проще. Да и проникновение в жизнь людей техники —  смартфонов, компьютеров, видеокамер и датчиков —  на порядки увеличило число данных, генерируемых ежесекундно. Ашманов перечисляет: «Есть поисковики и социальные сети, откуда можно выкачивать информацию. Есть открытые данные, которые может использовать любой желающий. Есть, наконец, специализированные сервисы, такие как «Яндекс.Толока» и Amazon Mechanical Turk, где информация собирается при помощи краудсорсинга: заказчики поручают людям-исполнителям задачи по разметке данных за небольшое вознаграждение. А уже потом этими данными «кормят» нейросети».
Появление новых технологий обучения, мощных доступных компьютеров и больших наборов данных позволило нейронным сетям совершить качественный скачок в решении специфических задач. Одной из них стало распознавание объектов — поэтому не удивительно, что NTechLab строит свой бизнес именно в этой области. «Ни один другой алгоритм сегодня не может соревноваться с нейронными сетями в задачах компьютерного зрения», — объясняет Вадим Полулях, сотрудник лаборатории нейронных систем и глубокого обучения МФТИ. Бум нейросетей, не утихающий до сих пор, начался именно с того, что сеть AlexNet в 2012 году выиграла соревнование по классификации изображений ImageNet. (Кстати, создала победившую сеть команда ученых из Торонтского университета под руководством уже упомянутого профессора Джеффа Хинтона). А в 2015-м результат был улучшен настолько, что нейросеть впервые стала распознавать изображения быстрее и точнее человека.

Ловцы на сеть
Компьютерным зрением практическое применение нейросетей далеко не ограничивается. Нейронные сети используют для прогнозирования, распознавания изображений и речи, анализа телеметрии, принятия решений. К 2022 году, согласно исследованию маркетингового агентства Stratistics MRC, глобальный рынок решений на основе нейронных сетей вырастет почти в пять раз — с $9,5 млрд (по результатам 2016-го) до $46,4 млрд.
«Нейросети применяются в лингвистике, медицине, биологии, сельском хозяйстве, транспорте, компьютерной безопасности и, разумеется, играх», — перечисляет Влад Шершульский, директор программ технологического сотрудничества Microsoft в России. «Если «скормить» в сеть достаточно релевантную выборку качественных данных, то ей можно поручить вообще практически любую задачу, которую сегодня выполняет человек», — говорит Михаил Иванов из NTechLab. Уже сейчас этот метод машинного обучения использует большинство интернет-порталов, чтобы блокировать запрещенный контент без участия администратора. Поисковые системы и роботы-ассистенты вроде Siri и Alexa распознают голосовые запросы. Системы предсказательного обслуживания выявляют неполадки в оборудовании на производстве. Обучаемые системы видеонаблюдения в аэропортах распознают спрятанное оружие. В банках нейросети помогают оценивать кредитные риски. В трейдинге — отслеживать тренды, оказывающие влияние на биржевые котировки.
В России, стране инженеров и математиков, нейросети находят самое любопытное применение. К примеру, стартап Nest Lab из Уфы с помощью машинного обучения помогает добывать больше нефти на месторождениях. Робот анализирует архив данных и рекомендует, как оптимальнее изменить режим работы на действующих скважинах или когда вводить новые. А московская компания Logistix, специализирующаяся на автоматизации работы складов, снабжает работников фитнес-браслетами и отслеживает их пульс, не допуская чрезмерных перегрузов и уставания. Стартап Guaranacam в 2015 году развернул пилотный проект на базе торгового центра «МЕГА Белая Дача»: анализируя через облачную платформу Microsoft Azure данные с видеокамер в молле, он отслеживал покупательское поведение и оценивал эффективность выкладки товаров.
Впрочем, более заметным для человеческого глаза является использование нейросетей в области развлечений. Так, в 2016 году наделало много шуму мобильное приложение Prisma, созданное специалистами по машинному обучению Mail.ru Group. Оно заставляло нейросеть обрабатывать изображения — загружаемые пользователем фотографии — в стиле работ известных художников, от Пабло Пикассо до Роя Лихтенштейна. В свою очередь, сотрудники «Яндекса» Иван Ямщиков и Алексей Тихонов «скормили» нейросетям тексты песен лидера рок-группы «Гражданская оборона» Егора Летова, а также американской Nirvana, после чего сеть сочинила собственные песни в стилистике каждого исполнителя. Зарубежных примеров ярких, хотя и слабо монетизируемых проектов с участием нейронных сетей тоже в избытке. К примеру, инженер компании Oculus Кейси Родармор научил нейросеть рисовать граффити в стиле 80-х. Аспирант Массачусетского технологического института Брэдли Хейс заставил нейросеть писать в Twitter посты в духе Дональда Трампа. А японский инженер Макото Койке на ферме своих родителей натренировал нейронную сеть на базе открытого алгоритма Google TensorFlow сортировать огурцы по размеру и степени гладкости.
Особняком стоят проекты, связанные с играми. Игры (как традиционные, так и компьютерные) — благодатная почва для обучения нейросетей: в них понятные правила и предсказуемые комбинации, которые могут привести к победе. В начале 2016 года система глубокого машинного обучения AlphaGo от Google одержала серию побед над одним из сильнейших игроков мира в го Ли Седолем. А в августе 2017-го бот компании OpenAI победил несколько профессиональных игроков в видеоигру Dota 2 в рамках международного чемпионата. На обучение программы у разработчиков ушло всего около двух недель.

Не даром
И все же на некоторых экспериментах, прежде всего популяризаторских, удалось заработать. Например, приложение белорусских разработчиков MSQRD, позволяющее накладывать забавные фильтры на лица пользователей в режиме реального времени, в 2016 году было куплено Facebook за неназванную сумму. Это лишь одна из несметного числа сделок с участием технологических гигантов и крупных промышленных корпораций, которые в последнее время развязали настоящую охоту за перспективными стартапами в области искусственного интеллекта. По данным CBInsights, с 2012 по 2017 год на рынке произошло свыше 250 поглощений частных компаний с такими разработками. Одну из самых крупных сделок заключила корпорация Ford. В начале 2017 года она вложила миллиард долларов в стартап Argo AI, специализирующийся на системах беспилотного вождения. Google за последние пять лет приобрела аж 12 компаний, связанных с нейросетями и машинным обучением. Среди них примечательна британская DeepMind Technologies, купленная в 2014 году за $600 млн: она пытается научить нейросеть выявлять по снимкам онкобольных те области, которые следует подвергать облучению или, напротив, защищать от него во время радиотерапии. От Google не отстают Apple, Microsoft, Intel, Baidu, Salesforce, Twitter: все они потратили не один миллион долларов на инвестиции в нейросети. «Для стартапа сегодня главное — оригинальность, — подытоживает Влад Шершульский. — Для большой компании — возможность повысить качество принимаемых решений и снизить издержки».
Анализ сделок на венчурном рынке ясно дает понять: успех ждет те стартапы, которые способны разработать на основе нейросетей полноценный продукт с понятной выгодой. Наиболее востребованы сегодня сервисы, предназначенные для повышения эффективности бизнес-процессов и качества услуг. А яркие, развлекательные B2C-приложения, вызывающие «вау-эффект» у публики, либо так и не находят способов коммерциализации, либо становятся одной из функций «большого» продукта. Например, компания NTechLab привлекла к себе внимание общественности, запустив онлайн-сервис для поиска людей по фотографии в соцсети «ВКонтакте». Увидев симпатичную девушку в метро и украдкой ее сфотографировав, юноша может мгновенно отыскать ее страницу и попытаться завязать знакомство. Однако зарабатывает NTechLab на другом — продавая бизнесу решение FindFace.Pro на базе усовершенствованной версии того же алгоритма, который способен в режиме реального времени распознавать людей из базы в 1 миллиард фотографий. Оно предназначено для идентификации людей в сфере общественной и корпоративной безопасности, защиты от мошенничества, связанного с кражей личности, в кредитных учреждениях или казино, сегментирования аудитории и анализа эффективности процессов в розничной торговле и др.

Сетепрядильная фабрика
— Наступает очень важное время для бизнеса, связанного с нейросетями, — подчеркивает значимость момента Михаил Иванов, генеральный директор NTechLab. — Технологии нейронных сетей давно известны и описаны, создать алгоритм на их базе несложно, а порог входа в эту отрасль — как инвестиционный, так и технологический — невысок. Поэтому в конкурентную гонку ввязалось множество игроков. Однако до создания хорошего и качественного продукта доходят единицы. Скорее всего, именно в ближайшие год–два на этом рынке определятся свои лидеры и аутсайдеры.
Станислав Ашманов считает, что внедрение уже доступных технологий на базе нейросетей в существующие продукты тормозит дефицит специалистов. «Бизнес на самом деле и не представляет, сколько уже есть готовых технологий и решенных задач! — говорит он. — Ему имеет смысл хотя бы поверхностно разобраться, что на данный момент уже можно поручать нейросетям, и попробовать приложить эти возможности к своим задачам». С ним соглашается Вадим Полулях из МФТИ: «С нейросетями обращаться не сложнее, чем с любыми другими ИТ-проектами: нужно взять готовые инструменты и библиотеки, немного «подпилить напильником» и на их основе сделать продукт».
Главная проблема, стоящая перед разработчиками нейросетей, —
кадры. Вполне вероятно, выращивать их придется самостоятельно. «Яндекс», к примеру, еще в 2007 году запустил Школу анализа данных — бесплатные двухгодичные курсы для подготовки специалистов в сфере «больших данных» и машинного обучения. «Нейросетям Ашманова» приходится учить машинному обучению практически с нуля людей с хорошими «математическими мозгами» — в частности выпускников мехмата МГУ. Впрочем, эта компания, как и многие на рынке, вышла из академической среды: ее основала группа аспирантов РАН, которые в 2015 году стали заниматься разработкой алгоритмов на заказ (среди текущих проектов — определение усталости водителей по видео, распознавание и подсчет насекомых на фотографиях, анализ медицинских данных на базе ЭКГ и ФПГ и др.). Михаил Иванов рассказывает, что команду NTechLab собирали «по крупицам» по всей стране, и считает это главным конкурентным преимуществом. Только лучшие инженеры-математики, по его словам, могут правильно и быстро обучить нейронную сеть.
Масштабных решений проблемы нехватки специалистов пока нет. Лаборатории машинного обучения сегодня имеются лишь в нескольких сильнейших технических вузах страны. Так, в МФТИ идет работа над проектом iPavlov: он позволит создать своего чатбота (робота-собеседника, имитирующего человеческое общение) всем, кто этого захочет. «Сейчас мы разрабатываем бота для Сбербанка, который помогает оператору общаться с клиентами, —
рассказывает Вадим Полулях. — В идеале стремимся к тому, чтобы полностью освободить человека от переписки с клиентами, хотя пока до этого еще далеко».
Другая трудность, помимо дефицита кадров, кроется в необходимости сбора и разметки обучающих данных. «Для небольших компаний это может стать существенным барьером на пути к нейросетям, — указывает Станислав Ашманов. — Собирать данные очень дорого, это кропотливый труд. Мы сейчас у себя в компании исследуем, как обучать сети на неразмеченных или только частично размеченных данных». До тех пор же на выручку приходят краудсорсинговые сервисы вроде «Яндекс.Толоки».

Романтизм.net
По мере роста сложности и ответственности решаемых задач требования к быстродействию нейросетей будут только расти. Не случайно сегодня самая горячая тема — аппаратное ускорение нейросетевых вычислений. «Молодые амбициозные стартапы соревнуются с признанными ИТ-гигантами в создании все более производительных микропроцессоров для эффективного моделирования нейронных сетей, — говорит Влад Шершульский из Microsoft. — Это очень напоминает романтическую эпоху семидесятых годов прошлого века, когда конкурировало множество архитектур универсальных микропроцессоров».
Нынешнее время действительно можно считать «новым романтизмом» для математиков и программистов. При этом «голубой океан» возможностей в сфере нейросетей и вообще машинного обучения пока открыт для освоения. Однако уже через пять–семь лет ландшафт, пока подводный, изменится коренным образом, а технологии эволюционируют так стремительно, что сегодня сложно вообразить его очертания. По словам Влада Шершульского, следующим шагом станет появление «естественного интерфейса»: компьютеры станут общаться с нами почти как люди и будут понимать не только инструкции в виде речи или рукописного ввода, но и намерения, намеки и эмоции. Качество рассуждений и решений систем на основе нейросетей и машинного обучения вырастет в разы. Это позволит автономным транспортным и промышленным устройствам взять на себя значительную часть не только монотонного, но и креативного человеческого труда. Бизнесу это позволит значительно повысить эффективность и предсказуемость процессов. Гражданам — значительно улучшит качество жизни сфере здравоохранения, общественной безопасности, транспорта… Однако людям придется за это платить — переучиваться. Ведь многие профессии, даже те, что считаются исключительно «человеческими» и «творческими», через пять–десять лет начнут постепенно переходить к роботам и нейросетям.