«Каждая отрасль считает себя «царем горы» в big data, и все по-своему правы»

11 апреля 2017 в 23:41
785 просмотров
article3658.jpg

Основатели oneFactor, экс-менеджеры «Мегафона» Роман Постников и Михаил Дубин рассказали, как работает big data в России и за счет чего рынок ждет кратный рост.

«Большим данным» становится тесно в пределах тяжелых корпоративных структур телеком-операторов и крупных интернет-игроков, и они выделяются в самостоятельные компании, чтобы работать для отраслей финансов, ритейла и транспорта. Проект экс-менеджеров «Мегафона» oneFactor выделился из оператора в 2015 году, и точку безубыточности, по данным самой компании, прошел раньше бизнес-плана. Гендиректор oneFactor Роман Постников и один из акционеров компании Михаил Дубин рассказали, как именно работает big data в России и за счет чего рынок ждет кратный рост.

— oneFactor выделили из оператора «Мегафон» чуть более года назад. До этого компания была подразделением «Мегафона». Почему было принято решение развиваться дальше вне оператора, который владеет «большими данными» абонентов?

— Михаил Дубин (М.Д.): Пять лет назад, когда в «Мегафоне» создавали компанию MegaLabs (разработчик дополнительных сервисов оператора), было выбрано пять ключевых направлений, инновационных бизнесов, для развития. Один из них — работа с «большими данными», не только операторскими, и их монетизация для всего рынка. В ходе работы мы поняли, что внешний рынок еще не развит в том масштабе, который был бы интересен для бизнеса. Зато имелось огромное количество задач внутри «Мегафона», которые необходимо было решать. Как только это поняли, команду переместили в «Мегафон», чтобы она сфокусировалась на основном бизнесе, чем она и занималась длительное время.

В начале 2015 года внешний рынок начал оживать. Стал понятен его потенциал. В деньгах он все еще был меньше, чем можно было заработать внутри. Но если не начать концентрироваться на внешнем рынке 100% времени, то и серьезный бизнес так никогда не вырастет в силу того, что цели внутреннего подразделения всегда будут про внутренний бизнес. Кроме того, обычно крупная организация старается минимизировать риски. А инновационный вид деятельности — это априори риск.

— Вы привлекали инвестиции от основного акционера «Мегафона» — USM Алишера Усманова и партнеров. Сколько было привлечено и какая доля у USM?
— М.Д.: Мы публично не раскрываем размер инвестиций. У USM нет доли. Владеет ей менеджмент, а USM выступает как финансовый инвестор. В данный момент дополнительные деньги мы не ищем.

— Вы говорите, что в 2015 году рынок «больших данных» ожил. Что стало катализатором?

— Роман Постников (Р.П.): Рынок «больших данных» — слишком общая концепция. Не понятно, что «большие данные» дают для экономики, для конечного клиента. В 2016 году стали выкристаллизовываться определенные направления, которые конкретизировали общее название. Это системы принятия решений, распознавания изображений — компьютерное зрение, управления разными видами транспорта. Все это компоненты того, что раньше называлось «большими данными».

Мы сейчас не говорим, что занимаемся большими данными, потому что индустрия перестала так говорить. Мы занимаемся автоматизацией интеллектуального труда, это роботизация мозга для компаний любого размера, от ларька у дома до крупной организации.

Если раньше под роботизацией подразумевалась в первую очередь автоматизация механических действий, например, замена сотрудников, которые собирали машину на конвейере руками, то сейчас глобальный тренд — роботизация интеллектуальных процессов. Происходит замена людей системами, которые помогают принимать решения, оптимизировать бизнес-процессы, сокращать издержки. Наша миссия — автоматизация интеллектуального труда.

— Рынок автоматизации интеллектуального труда можно оценить?

— Р.П.: Мы недавно подводили итоги года, у нас немаленькая доля. По нашим оценкам, на конец 2016 года больше 75% всех решений по работе с клиентами в рамках розничных кредитных договоров российские банки принимали с учетом рекомендаций oneFactor. Банковский сектор — более чувствительный к новым технологиям, он быстрее их адаптирует. Речь идет о рекомендациях, давать или не давать кредит, какой должен быть кредитный лимит, дать ли какой-то дополнительный продукт, вторую кредитную карту и так далее. При этом наша система сама обучается, учитывая ошибки предыдущих решений.

Раньше этим занимались андеррайтеры. Сейчас в этом секторе рынка процесс принятия решений практически полностью автоматизирован. Это один из ключевых результатов нашей деятельности за 2016 год.

— Вы имеете в виду, что 75% банков являются вашими клиентами?
— Р.П.: Мы анализируем не по количеству банков, а по количеству всех решений, которые принимал банковский сектор и сегмент микрокредитования в течение года. Если посмотреть общее количество розничных кредитов в 2016 году, то 75% решений об их выдаче принимали банки-пользователи рекомендательных сервисов на основе технологий машинного обучения.

Кроме того, в 2016 году в сегменте рекомендательных систем oneFactor по нашим оценкам заработал 60% выручки всего сектора. В эти цифры не входит таргетирование рекламы при помощи big data, так как это не относится к системам искусственного интеллекта, помогающим в принятии решений. Нам удалось занять такую долю всего за год работы, так как по факту мы были первыми, кто создал качественный продукт для автоматизации решений. Все остальные к этому только приходят.

— Есть ли оценка экономии затрат заказчиков, использующих ваши решения?

— Р.П.: В управлении рисками для банков и страховых компаний наши сервисы позволяют дополнительно сократить убытки на 12-15%, даже когда используются продвинутые системы анализа рисков от мировых лидеров рынка, таких как SAS и Experian.

— Вы упомянули, что у компании был потенциал заработка внутри «Мегафона» больше, чем за его пределами. Как это объяснить?
— М.Д.: Правильнее говорить о команде, а не о компании. Когда команда, аналогичная нашей, является подразделением большой структуры, то потенциал того, что можно заработать на данных внутри своего же бизнеса, то есть улучшить свои же показатели, это 90% из 100%. Но это не означает, что перед нами стояла проблема выбора работать внутри на задачи «Мегафона» или на внешнем рынке — сейчас мы работаем в обоих направлениях, будучи отдельной компанией.

— oneFactor в 2016 году был прибыльным?

— М.Д.: Да, мы прошли точку безубыточности на квартал раньше запланированного бизнес-плана.

— Какой прогноз доходов в 2017 году?
— М.Д.: Планируем увеличить выручку более чем в три раза по сравнению с прошлым годом. Сейчас мы наблюдаем органический рост рынка. По нашим оценкам, в 2017 году в денежном выражении рынок автоматизации интеллектуального труда вырастет больше, чем на 50%. В трехлетнем горизонте среднегодовой рост будет составлять от 2,5 до 3 раз.

— Какие услуги по автоматизации интеллектуального труда будут увеличивать рынок?
— Р.П.: Поскольку автоматизация процесса принятия решений — универсальное решение с точки зрения сфер применения, здесь вопрос, какой сектор рынка будет более восприимчив к инновациям. По факту лидер сейчас — это финтех. Для него оптимизация очень быстро дает результаты.

Сейчас интерес в оптимизации процессов принятия решений проявляет ритейл. Это достаточно неожиданно, потому что ритейл — сектор рынка с большой долей материальной деятельности. Это физическое осуществление процесса продажи, торговые точки, логистика. Здесь много процессов, которые, в отличие от банковской деятельности, сложно виртуализировать.

Большой спрос есть и со стороны транспортных компаний, например, в вопросах управления маршрутным расписанием или планирования цен. Транспортный сектор в России консолидируется, количество компаний становится меньше, но есть желание автоматизировать процессы для того, чтобы либо сохранить долю рынка, либо не дать ей упасть. Это два сектора, которые на наш взгляд будут развиваться в 2017 году как с точки зрения объема денег, так и с точки зрения интереса к подобного рода технологиям.

— Когда вы говорите про транспортную отрасль, вы имеете в виду в основном авиаперевозки?
— Р.П.: Нет, в целом. Структура рынка начинает меняться не только у авиаперевозчиков, но и в автобусных или железнодорожных перевозках. Транспортным сектором я также называю такси. За последние два года индустрия транспорта, в том числе городского, сильно поменялась и будет меняться дальше.

— Вы перечисляли основные направления работы и не упомянули взаимодействие с операторами связи. Но вы наверняка работаете с «Мегафоном»?

— Р.П.: «Мегафон» пользуется рядом платформ, которые мы продолжаем поддерживать и развивать. У них есть, например, система, которая занимается предсказательной аналитикой оттока с точки зрения удержания клиента: когда определяются какие-то параметры тарифных или специальных предложений на основе обратной связи от клиента — доволен или недоволен. Когда у вас больше 10 миллионов клиентов, вы не можете настроить индивидуальные взаимоотношения с пользователем продукта так, как если бы вы были маленькой организацией. Если у тебя все клиенты будут абсолютно одинаковы, тогда лояльность будет ниже. Те системы, которые мы делаем для «Мегафона», позволяют делать эти отношения чуть более персонализированными. В остальном лучше спросить у них самих.

— М.Д.: Можно сокращать отток, работать с индивидуальным ценообразованием, делая персонифицированные предложения, оптимизировать процессы обслуживания различными способами, ну и конечно, заниматься сетью, CAPEX и качеством.

— Р.П.: Мы делаем достаточно универсальную вещь, предоставляя коробочное решение. Есть понятия «узкий искусственный интеллект» и «широкий искусственный интеллект». Мы делаем «узкий», ровно как и вся индустрия. Он так называется, потому что мы автоматизируем конкретные процессы. Например, определяем зоны сетей, которые настроены неоптимальным образом, с целью улучшения качества связи. Вот конкретная задача — конкретный ответ. Поэтому интеллект «узкий». Он обучен решать только эту задачу. Человек, конечно, более универсален. Пока это так, но тем не менее это уже большой-большой шаг вперед, потому что таких областей сейчас становится все больше и больше.

— Вас не воспринимают как компанию, аффилированную с «Мегафоном»? Не смущает ли МТС или «Вымпелком», что вы просите поделиться с ними данными?
— М.Д.: Конечно, мы общаемся со всеми на рынке. Но операторы не являются основным участником рынка, на котором работает oneFactor, и операторские данные — далеко не единственный источник для аналитики. Мы также используем web-данные, данные компаний финансового сектора и ряда других индустрий.

— Операторы как раз утверждают, что их информация о пользователях гораздо более глубокая, чем у интернет-компаний.

— М.Д.: Это философский вопрос. Если мы посмотрим на рынок, то есть какое-то количество отраслей, каждая из которых считает себя царем горы с точки зрения данных, — web, телеком, финансы, ритейл, — и каждый по-своему прав и не прав одновременно. Потому что все зависит от задачи. Для определения оценки рисков нужны одни данные, для построения маршрутов нужны другие данные, для таргетирования рекламы в интернете нужен третий тип данных. Более того, у данных есть особенность — одни данные через другие можно объяснить, поэтому степень уникальности данных тоже не всегда правдива.

— У вас есть какие-то экзотичные клиенты, не операторы, не банки, а кто-то менее очевидный?
— Р.П: Конечно, есть. Мы просто поименно не можем назвать. Например, один из производителей полупроводниковых чипов для оборудования.

— А госзаказчики?
— Р.П.: Есть, например, опосредовано правительство Москвы. При построении транспортных моделей и модели генерального плана, которая определяет емкость вылетных магистралей и достаточную связанность между районами, используются рекомендации на основе наших сервисов.

К примеру, есть вылетная магистраль — Калужское шоссе. Когда присоединяли Новую Москву, была достаточно простая задача — посчитать, сколько людей там действительно живет и понять, достаточна ли транспортная емкость вылетных магистралей. Оказалось, что стандартный источник информации для принятия подобных решений, которым руководствуются институты генерального планирования любой государственной организации, это Росстат, перепись населения. В Москве перепись более-менее точная, а в области с этим проблема — погрешность по численности населения в Новой Москве, чуть ли не больше, чем в два раза. К нам обратились с задачей определить, какая должна быть емкость транспортной магистрали, транспортная связанность, чтобы эффективно присоединить новую территорию к московской инфраструктуре, и как именно эффективно расположить магистраль. На основе нашего георекомендательного сервиса и аналитики было принято решение, как нужно реконструировать Калужское шоссе.

— Все-таки когда вы это объясняете, не понятно, как конкретно выстраивается цепочка работы с данными.
— Р.П.: Есть простая и понятная вещь — нагрузка на базовую станцию (радиооборудование мобильных операторов). Когда вы едете и разговариваете, связь не прерывается, потому что сеть плавно переключает группы телефонов, перемещающихся от одной базовой станции к другой. Исходные данные — транспортный поток, который можно регистрировать при помощи мобильных телефонов. Это сырье, которое обрабатывается алгоритмически, чтобы понять как часто и какое количество людей ездит из дома на работу. Очевидно, они и будут основными потребителями той самой вылетной магистрали.

В процессе анализа есть распределение — человек пользуется общественным транспортом или автомобилем. Дальше делается прогноз: население через 20 лет будет такое, количество автомобилистов — вот такое, маятниковая миграция составит столько-то человек. Дальше есть нормативы, ГОСТы и СНИПы, которые говорят, какое количество полос и какие развязки должны быть построены.

— М.Д.: Если говорить про сегмент, связанный с развитием городов, управлением и оптимизацией инфраструктуры, на услуги анализа такого типа данных есть определенный спрос. Реализация проектов частно-государственного партнерства без подобных услуг достаточно проблематична.

— Р.П.: Например, раскрытие данных перемещения такси, проект Movement о котором недавно заявил Uber (сбор данных для анализа картины трафика и принятия решений о развитии городской инфраструктуры). Но и с этим сервисом есть проблема — он никак не показывает количество людей, которые ездят на метро, автобусе или трамвае.

— Вы открещиваетесь от рекламной отрасли, но у вас есть проект таргетирования наружной digital-рекламы.

— М.Д.: Мы не очень хотим идти в какие-то традиционные рекламные вещи. Происходит естественная смена поколений. Меняются доходы населения, распределяясь в пользу более молодого аудиторного сегмента. Меняется способ потребления информации, так как нынешние поколения Y и Z выросли в эпоху digital, и они «визуалы». Цифровая наружка нам показалась менее традиционной, там идет процесс замены конструкции со статических на digital, что дает рекламным носителям «вторую жизнь». Можно таргетировать конкретные сообщения под поток проходящей и проезжающей аудитории — в зависимости от возраста, рода деятельности и так далее. Это уникальный продукт, не имеющий аналогов не только на российском рынке, но и за рубежом. Мы делали ряд пилотов осенью, сейчас запустили его в коммерческое тестирование.

— Как работает технология? Так же — на основе данных мобильных базовых станций?

— М.Д.: Речь идет про одну базовую технологию, как в примере с Калужским шоссе. Традиционный подход к медиа-измерениям для рекламных щитов такой: раз в год подходит человек со счетчиком и считает в рамках своего понимания, кто что посмотрел. А мы можем с помощью тех источников и алгоритмов, которые у нас есть, давать реальный охват. В ходе тестов мы видели, как сильно растет охват аудитории. При сохранении тех же рейтингов (TRP, target rating point — суммарный рейтинг для целевой группы) охват рекламного сообщения увеличивается на 10-35%. Можно сокращать время показа с тем же самым охватом, экономя медиабюджет, и показывать большее количество роликов. Причем для узких целевых аудиторий прирост охвата сумасшедший. Сильно больше 50%.

— Возвращаясь к рынку big data — его сейчас хотят регулировать. Говорят, проекты нормативных актов появятся уже в этом году. Есть ли смысл начинать регулирование, если рынок окончательно не сформирован?
— М.Д.: Мы ездили по миру, общались с разными регуляторами, смотрели, какие есть законодательные концепции. Рынок слишком молодой, и попытки отрегулировать то, чего пока нет, скорее приведут к тому, что не будет развиваться не только этот рынок, но и отрасли, которые от этого напрямую зависят.

Мне в данном случае импонирует китайская модель, когда есть саморегулируемая организация. Участники рынка сами собрались и договорились о правилах игры. Там также участвует регулятор, который определяет, что такое красная линия, что точно зло, чего точно нельзя. А дальше подход регулятора сводится к тому, чтобы подождать некоторое время — 10 лет — пока сложатся правила работы рынка, чтобы потом законодательно их закрепить. Эта концепция кажется единственно возможной, если мы не хотим остаться на обочине истории с точки зрения развития большого количества отраслей. Неправильно говорить, что это регулирование только большого количества единичек и нулей. Это гораздо больше — от строительства городов до автоматизации производств.

Если говорить об идеальной модели, нам кажется правильным, когда собственник данных — это физическое лицо, и дальше в зависимости от того, согласен человек на раскрытие определенной информации или нет, должна отличаться цена за услугу, которую он получает.

— То есть пользователь должен еще и заплатить, чтобы его персональные данные не раскрывали?
— Р.П.: Речь не про раскрытие персональных данных, а про согласие на их обработку, деперсонализацию и использование в аналитических целях. Это выбор. Если мы говорим о поисковиках, то там индексируется почта, определяется тематика переписки, поисковых запросов. Там можно понять все, что угодно, начиная от того, беременны вы или нет, встречаетесь ли с кем-то и собираетесь ли покупать автомобиль. Модель монетизации данных должна предусматривать право выбора. Кто-то толерантен к использованию его данных, кто-то скажет «нет, я не хочу этого». Ну тогда нужно говорить о том, что есть одна валюта в виде денег, а есть другая валюта в виде данных. Если не хочешь расплачиваться данными, тогда сервис должен быть платным. Это нормально — право выбора просто должно быть. Сейчас де факто этого выбора нет.

— Значит, по-вашему, в законодательстве нужно закрепить свободу выбора при раскрытии данных? И одновременно вы хотите, чтобы отрасль не сильно зарегулировали?
— М.Д.: Я думаю, что свободе выбора предстоит еще долгий путь, потому что он связан не столько с регулированием, сколько с образованием.

— С воспитанием пользователя?
— М.Д.: Да, это скорее даже поколенческий момент, нежели зависящий от законодательства. Это мое мнение. Если говорить, что можно сделать здесь и сейчас, мне кажется, имеет смысл посмотреть на саморегулирование и им заняться.

— Сейчас этой инициативой занимается рабочая группа в администрации президента. Участники обсуждения говорят о новом термине «большие пользовательские данные». Вы принимаете участие в этом обсуждении?
— М.Д.: Насколько я знаю, есть несколько площадок, которые сейчас так или иначе этим занимаются. В работе некоторых из них мы принимаем участие, в каких-то нет.

— Как очищаются данные, которые анализирует oneFactor?
— Р.П. Мы анализируем только агрегированные и анонимные данные. Например, в случае с геоинформацией, мы анализируем нагрузку на базовые станции в виде количества человек, которые переместились из одной точки в другую. То есть не конкретного пользователя мобильного телефона, двигающегося по конкретному маршруту, а общее количество людей, создающих нагрузку на базовые станции.

— Технологии, которые вы развиваете, заменяют умственный труд человека. До каких пор можно заменять человека при принятии решения? Все равно ведь субъективный фактор должен остаться.
— М.Д.: Мы создали рекомендательный сервис, то есть клиент имеет возможность сам скорректировать решение — соглашаться или не соглашаться с нашей рекомендацией. Можно ли до каких-то пор заменить человека в принципе — это вопрос философский.

— Скольким людям ваши решения стоили карьеры?
— М.Д.: Технологическая революция — это большой вызов для системы образования. Нужно иметь возможность обучать и перепрофилировать существующих сотрудников, готовить будущие кадры. Я бы не оценивал, какому количеству людей наше решение стоит работы, нет. Скорее, можно оценить, скольким людям можно будет изменить жизнь к лучшему. Оценка — примерно 40% работникам такие решения поменяют характер работы в течение 20 лет. Это не означает увольнение людей. Речь про изменение специализации и трансформацию рынка труда.

На фото: гендиректор oneFactor Роман Постников и акционер компании Михаил Дубин

Источник: «Интерфакс»