Читать онлайн Большие данные, цифровизация и машинное обучение для собственников и топ-менеджеров, Или как зарабатывать больше с помощью информации бесплатно
Введение
Выйти на самоокупаемость в XXI веке – непростая задача для любой компании, если она не использует большие данные, цифровизацию и машинное обучение в своей повседневной деятельности. Не говоря уже о том, что без этих инструментов невозможно увеличить прибыль и оптимизировать бизнес-процессы. Основная причина – перенасыщенный предложением рынок, на котором борьба идет за доли процента прибыли. А при таком масштабе привычные методы ведения бизнеса становятся бесполезными, и приходится прибегать к помощи вычислительной техники.
Изучив это руководство, вы поймете:
• Для чего бизнесу нужны «большие данные». Почему невозможно начать собирать их без цифровизации компании. Зачем создавать информационные панели для собственников и топ-менеджеров.
• Как устроено машинное обучение, каким образом оно связано с большими данными, какие задачи решает, за счет чего увеличивает прибыль и снижает издержки.
Несмотря на то, что тема, затронутая в этой книге, так или иначе касается программирования, вы не встретите здесь примеров программного кода. Я лишь схематично расскажу, что и за чем следует, чтобы у вас появилось хотя бы общее представление о предмете. Основное же внимание при изложении материала будет уделено тому, чтобы познакомить с особенностями сбора больших данных, автоматизации процессов, визуализации результатов и контроля жизненных показателей бизнеса сквозь призму больших данных руководителей и топ-менеджеров и мотивировать их на внедрение новых инструментов в своих компаниях. Фактически эта книга – научпоп о цифровизации, машинном обучении и уже упомянутых больших данных.
Также в данном руководстве вы найдете информацию, касающуюся управления компанией. Но речь не идет о традиционном управлении коллективом или командой. Здесь описывается способ построения такой системы взаимодействия с сотрудниками, чтобы свести контакты между людьми к минимуму. Этот тип организации рабочего процесса, без сомнения, придется по душе интровертам, которые мечтают о том, чтобы их компания работала сама по себе: без звонков, писем, долгих уговоров и лишних усилий. Благодаря предлагаемому способу вся информация и рабочие задачи оказываются в единой системе, облегчая управление всеми происходящими процессами и контроль за ними. Да, и без такой системы крайне сложно начать собирать большие данные и проводить машинное обучение. Поэтому шаги по ее внедрению будут подробно описаны в первой части книги, которую вы держите в руках.
В дополнение к этому руководству был создан сайт RealBigData.ru. Он является демонстрационным, представляя «информационную панель компании», речь о которой пойдет дальше. В отдельных главах в качестве поясняющих материалов к тексту будут встречаться изображения с этого сайта, но на нем также размещены уникальные рекомендации, которых нет в книге: например, информация о том, на какие показатели компаний чаще всего обращают внимание профессиональные инвесторы. Поэтому обязательно посетите сайт и опробуйте предлагаемую систему – не упускайте возможность получить по-настоящему ценные знания!
Для кого и о чем эта книга
Цель данного руководства – заинтересовать предпринимателей в цифровизации бизнеса и использовании больших данных для увеличения прибыли и снижения издержек.
Эта книга в первую очередь рассчитана на мудрых руководителей зрелого возраста. Поскольку в основном у руля большого числа отечественных компаний находятся именно такие собственники и топ-менеджеры. Часто они не позволяют использовать новые подходы к управлению организацией и производственным циклом, небезосновательно утверждая, что бумажный документооборот надежнее электронного. С одной стороны, это действительно так. И в идеале было бы неплохо хранить бумажные копии всех документов фирмы где-нибудь в бункере на северном полюсе на случай ядерной войны. Но с другой стороны, цифровизация позволяет заметно увеличить чистую прибыль и повысить общий уровень управляемости компании. Поэтому руководителям с многолетним стажем все же стоит сделать над собой усилие ради достижения, по сути, главной цели любого бизнеса – получения прибыли, и начать полноценно, со знанием дела пользоваться компьютером, интернетом и всеми технологиями, которые позволяют сделать рабочий процесс более легким и эффективным.
Несмотря на очевидные плюсы, многие опытные управленцы боятся шагнуть в неизвестность. Поэтому основной задачей этого руководства как раз и является подробное аргументированное объяснение важности квалифицированного использования электронных вычислительных машин с целью получения большей выгоды. В том числе в данной книге будут рассмотрены следующие вопросы:
• Большие данные. Необходимость сбора информации, способы ее хранения и обработки.
• Визуализация данных. Построение графиков и вычисление основных бизнес-показателей в режиме реального времени.
• Машинное обучение. Способы создания моделей машинного обучения на больших данных и их использование для прогнозирования результатов бизнес-процессов.
• Цифровизация производства. Сбор больших данных как при производстве товара (или услуги), так и при контроле качества готового изделия.
• Организация работы сотрудников. От необходимости их перевода на «удаленку» до создания портала (веб-сайта) предприятия для служебного использования.
Все эти темы будут обильно сдобрены примерами успешного использования больших данных как применительно к ежедневной аналитике, так и для прогнозирования редких процессов. При этом в данном руководстве я намеренно старался избегать сложных технических терминов, изложив материал языком, доступным обычному пользователю персонального компьютера. А яркие наглядные примеры позволят вам осознать важность сбора, обработки и анализа всех возможных больших данных, даже если у вас за плечами нет специальных знаний и навыков.
Профессионал же в области машинного обучения, больших данных и их анализа после прочтения следующего абзаца, скорее всего, захочет предать автора анафеме за упрощение терминологии и отступление от строгих математических канонов. Но неопытных новичков это, напротив, должно успокоить: в данной книге точность терминологии принесена в жертву доступности текста. Поверьте, так легче начинать «с нуля» читать о том, о чем никогда раньше не слышал, а возможно, даже и не хотел слышать.
Вследствие упрощения языка этого руководства от читателя потребуется запомнить синонимы некоторых определений. Например, в тексте будут встречаться разные наименования для «алгоритмов машинного обучения»: от сокращенного «алгоритм» до более длинного «искусственный интеллект» или «машинный интеллект». При этом «компьютер» может называться «сервером» или просто «машиной» (не путать с автомобилем). Также на протяжении всей книги красной нитью проводится мысль о том, что надо бережно подходить к большим данным, сохраняя все, что только возможно, для того чтобы в будущем на их основе проводить «тренировку», «обучение» компьютера. Так вот, это в буквальном смысле «тренировка», во время которой машина выясняет, в какой степени взаимосвязаны тысячи разных параметров. После окончания такого обучения компьютер сохраняет сделанные выводы для дальнейшего их использования. Эта сохраненная логика называется «моделью машинного обучения» (иногда в тексте – «алгоритмом»). У такой модели можно попросить «предсказать» результат процесса, о котором она узнала в рамках обучения.
Если вам ясно не все, о чем говорится в предыдущем абзаце, не переживайте. Руководство, собственно, и предназначено для того, чтобы после его изучения вам стала понятнее данная область человеческой деятельности. Для этого все механизмы и процессы не только подробно описаны в книге теоретически, но и проиллюстрированы многочисленными примерами их практического использования в бизнесе.
Источники данных
Автор данной книги является предпринимателем в области информационных технологий с многолетним опытом создания и продвижения собственных проектов (более 10 штук). Поэтому иногда в тексте вы будете встречать цифры и факты без пояснительной сноски на исследовательские статьи-источники. Эта информация была получена из личного опыта автора этой книги, что нисколько не умаляет ее значимость и даже напротив: ее стоит воспринимать как актуальное и реальное положение дел в IT-бизнесе на территории России в 2023 году.
Порядок и план изложения материала
В разных главах этой книги десятки раз будет возникать одна и та же цепочка из трех элементов: «цифровизация» – «большие данные» – «машинное обучение». Но структуру изложения правильнее назвать «спиралевидной». Потому что на каждом последующем витке обсуждения будут рассматриваться новые вопросы, тонкости и особенности всех трех составляющих. Таким образом, читатель сможет последовательно, по нарастающей вникнуть в различные аспекты и без лишнего напряжения овладеть этими темами на хорошем уровне. Главную же мысль данного руководства, которая и описывает вышеуказанную спираль, можно сформулировать так: «Машинное обучение позволяет заработать больше. Но чтобы обучить машину, нужны большие данные. А чтобы собрать большие данные, нужна единая информационная система компании и цифровизация всего трудового процесса».
В первой части книги мы поговорим о цифровизации некоторых процессов компании, а точнее разных ее отделений. Затем разберем способ объединения разрозненных систем. Все эти шаги позволят собирать и накапливать большие данные, о которых речь пойдет в середине руководства.
Если же читатель уже провел цифровизацию всех отделений своей компании, создал единую информационную систему и начал накапливать большие данные, ему стоит сразу обратить внимание на последнюю треть этой книги. Начиная с глав «Примеры успеха» и «Примеры неудач» и далее описаны разнообразные способы использования больших данных и машинного обучения. Приведенные истории взяты из совершенно разных отраслей предпринимательской деятельности: от свинофермы до аэропорта. В них обязательно найдутся идеи и для вашего бизнеса.
Почему машинное обучение стало полезным
С момента появления людей на планете и до двадцатого века нашей эры человечество накопило примерно два терабайта информации в виде печатных книг, рукописных свитков, скрижалей, изображений на стенах пещер и т. п. Но в настоящее время (2023 год) мы создаем подобный объем информации за долю секунды (более 300 экзобайт в день). При этом с каждым днем скорость накопления данных резко увеличивается. Почти 90 % всей существующей информации появилось за последние 2 года. А общее количество данных, накопленных человечеством, достигает уже 120 зетабайт[1].
Весь этот объем надо не только хранить, но и обрабатывать. А алгоритмы классической математики плохо работают в подобных масштабах. Предвосхищая текущее положение дел, еще в период между 1943 и 1965 годом у человечества начали появляться новые методы обработки данных, основанные на машинном обучении. Тогда же были сформулированы основные положения, описывающие, что собой представляют нейронные сети, глубокое обучение и искусственный интеллект в целом. Но путь от теории к практике оказался долгим и тернистым, потому что вычислительная электроника на момент появления первых идей находилась в зачаточном состоянии и была неспособна потягаться даже с современным калькулятором. В результате в области прикладных исследований возникла небольшая пауза.
Через пару десятков лет, в период между 1970 и 1989 годами произошел качественный скачок в развитии баз данных и электроники. Что позволило систематизировать и обрабатывать информацию в той форме, объемах и с такой скоростью, которые требовались для начала использования машинного обучения в промышленных масштабах.
Современный вычислительный сервер (производства 2023 года) из верхнего ценового сегмента, который стоит как автомобиль, легко займет первую строчку в рейтинге 500 самых мощных суперкомпьютеров мира 2000 года. При этом его энергопотребление в три раза ниже, чем у обычного чайника или пылесоса. Благодаря этому любая компания, даже не имеющая большого штата системных администраторов, электриков и программистов, может создавать свои модели машинного обучения, обрабатывая огромные массивы данных. Более того, энтузиасты уже умудряются использовать вычислительные мощности кофеварок, микроволновок и роботов-полотеров для непрерывного анализа информации.
Можно смело сказать, что машинное обучение плотно вошло в нашу жизнь и никуда теперь не исчезнет. С каждым годом все больше компаний будут пользоваться его плодами, обгоняя конкурентов. Поэтому читателю лучше отвергнуть все мысли о том, что это лишь временное явление и не стоит торопиться приступать к изучению новой науки. Прочитав эту книгу, каждый может выйти на достойный уровень понимания всех причин, последствий и способов применения машинного обучения и больших данных в бизнесе.
Битва за хлебные крошки
С начала века бизнес претерпел существенные изменения, вызванные третьей промышленной революцией (информатизацией), развитием каналов продаж и рекламы. При этом доходы его непрерывно падают из-за растущей конкуренции на рынке. Если раньше наценка 50 % считалась вполне привычным делом, то сейчас 3–5 % – это уже большая удача. И если получается сохранить часть пирога выручки после оплаты себестоимости, бизнес выходит на самоокупаемость. А в некоторых случаях даже становится успешным. И, как это ни парадоксально, чем крупнее компания и сложнее ее бизнес-процессы, тем точнее выражение «битва за хлебные крошки» описывает процесс увеличения выручки. Справедливости ради отметим, что у состоявшегося бизнеса доли процента от прибыли могут составлять десятки или даже сотни миллионов рублей. Поэтому, если не бороться буквально за каждую копейку себестоимости, считая ее мелочью, недостойной внимания, потери прибыли могут быть колоссальными.
Итак, сегодня битва идет за проценты прибыли, которые могут решить судьбу всей компании. Эта борьба ведется с помощью автоматизации всех рабочих процессов и за счет снижения издержек в каждом отделении. Ввиду этого набор сотрудников уже давно проводится с пристрастием. Сегодня никто не нанимает «девочку для продаж по телефону» – разумнее отдать ее зарплату программисту, который автоматизирует весь процесс и принесет компании во много раз больше пользы. Поэтому можно без преувеличения сказать, что основными солдатами в бою за повышение прибыли являются специалисты, которые, жонглируя большими данными, позволяют эффективно повышать рентабельность бизнеса за счет обработки огромных массивов информации, их анализа и внедрения следующих из этого процедур, способствующих улучшению работы компании.
Спрос на таких специалистов появляется не только из-за потребностей бизнеса, но и вследствие роста информационной грамотности населения. Для примера сравним розничную торговлю, осуществляемую через интернет-магазины в начале века и сейчас. Если раньше достаточно было продавать товары на одном собственном сайте компании, то теперь необходимо размещать их еще и на «чужих» площадках («Яндекс.Маркет», Ozon, Wildberries и т. п.), использовать агрегаторы и даже социальные сети, которые тоже стали точками продаж. Некоторые сервисы предлагают бизнесменам услуги по созданию таких автоматических выгрузок, однако они не могут удовлетворить индивидуальные запросы клиентов с помощью имеющихся функций. Ведь между компаниями царит жесткая конкуренция в погоне за увеличением процента прибыли. То есть за максимальное привлечение клиентов. Поэтому бизнесу приходится брать дело в свои руки, нанимать штатных программистов и специалистов по большим данным. Их работа с торговыми площадками и соцсетями в «ручном режиме» позволяет достичь более тонкой настройки, а также снизить издержки на доработку стандартного программного обеспечения, что в конечном итоге приводит к увеличению прибыли.
Зарплаты у программистов довольно высокие. Поэтому небольшим компаниям, которые только выходят на современный переполненный конкурентами рынок, может показаться, что достичь самоокупаемости в такой среде практически невозможно. Однако в действительности, хотя у крупных корпораций и есть сотни программистов, которые могут переиграть любого конкурента, процесс их «раскачки» занимает довольно продолжительное время. Небольшие «маневренные» фирмы способны быстрее подстроиться под течения рынка, держа нос по ветру. Они вполне вольготно могут существовать и развиваться в своей нише, куда большие игроки еще не добрались из-за неповоротливости их бюрократической машины. Но когда небольшая компания хорошо себя чувствует, она волей-неволей начинает расти ради получения еще большей прибыли. И со временем переходит в другую конкурентную лигу. Круг замыкается: хочешь жить спокойно – будь маленьким и слабым, хочешь жить сытно и по-царски – качай мышцу. Поэтому идеальной стратегией для фирм любого размера будет постепенный набор программистов с самого начала своего существования. Иначе можно просто потерять бизнес, если спохватиться слишком поздно.
Если вы разделяете такой подход к делу, который требует бо́льших затрат на своих программистов, но в ответ дает вам полную свободу и гибкость по извлечению прибыли из бизнес-процессов, эта книга для вас. Однако даже если вы его не разделяете и склонны нанимать на работу сторонних специалистов, эта книга и для вас тоже, потому что позволит при найме делать осознанный выбор. Повторюсь: здесь вы найдете описание всего процесса сбора, аналитики и обработки больших данных.
Зачем нужно собирать информацию
В прошлом разделе было сказано, что существование бизнеса в условиях современного перенасыщенного рынка практически невозможно без штатных программистов. Фирмы со старым подходом к делу, с бумажным документооборотом, будут медленно вымирать, проигрывая в конкурентной борьбе тем, кто стремится к минимизации потерь прибыли.
Теперь углубимся в причины этих потерь. Для чего сначала поверхностно коснемся темы больших данных и машинного обучения, чтобы вникнуть в суть, изучить терминологию и наметить конечные цели, которые подробнее обсудим в заключительной части книги. Но прежде сделаем небольшое отступление и уточним, что «программисты», речь о которых шла раньше, бывают разные. Они трудятся в различных областях и направлениях, решая соответствующие профессиональные задачи. Если работа программиста каким-то образом связана с данными (информацией), его называют «специалистом по данным». К этой категории относятся:
• Инженеры по данным, которые создают огромные хранилища, вмещающие сотни терабайт информации. Они же пишут программы по сбору и конвертации этих данных в более удобные форматы, чтобы другие сотрудники могли ими пользоваться.
• Аналитики данных, которые занимаются построением и анализом графиков и диаграмм по уже собранным данным, чтобы лучше понимать бизнес-процессы и увеличивать прибыль компании.
• Специалисты по машинному обучению, которые могут создавать и обучать на собранных данных системы для предсказания каких-либо значимых для бизнеса параметров и их величин.
Иногда в тексте вместо общего названия «программисты» вам встретится более конкретное «специалист по данным». А какое именно направление имеется в виду, вы поймете из контекста.
Большие данные
Английское словосочетание Big Data дословно переводится как «большие данные». По сути – это подробная информация о предмете. К примеру, большие данные для торгового центра включают в себя сведения о чеках покупателей, о количестве посетителей и даже о температуре внутри здания в течение всего дня. При этом данные не ограничиваются стенами торгового центра, в них могут быть добавлены заметки о количестве людей, пользующихся ближайшей станцией метро. Или даже информация о частоте стрижки городскими службами расположенных в радиусе ста метров от торгового центра кустов. Эти с виду бесполезные данные, скрупулезно собираемые в течение продолжительного периода времени, и называются «большими данными».
При этом они представляют собой не только числа. Это могут быть:
• Текстовые отзывы клиентов и их обращения в службу поддержки.
• Комментарии в социальных сетях.
• Записи телефонных разговоров с клиентом.
• Фотографии – от аватаров клиентов до снимков товаров.
• Видео с камер наблюдения.
Вся эта информация может легко занимать десятки терабайт. И чем старше фирма, тем больше у нее накоплено данных для проведения ценных исследований: в современном мире намного дороже удалять старую информацию, чем хранить ее вечно. Это как раз тот случай, когда «своя ноша не тянет».
Из-за непрерывно поступающих данных компании стараются минимизировать объемы хранящейся информации для снижения расходов на электронные носители. Для этого, например, аудио- и видеозаписи с помощью специальных алгоритмов переводятся в более компактный вид. Из аудиофайлов выделяют речь. Из видеозаписей, например с камер наблюдения, можно получить данные о количестве находящихся в магазине посетителей. Поэтому если преобразовывают формат, то нет нужды хранить само исходное видео или аудио. Более того, даже обычная текстовая информация, которая и так занимает немного места, отлично сжимается благодаря современным алгоритмам. Это сильно уменьшает занятый объем хранилища компании. Однако, несмотря на затраты, сейчас даже у небольших предприятий, далеких от информационных технологий, можно найти в кладовке работающий сервер, забитый несколькими терабайтами данных.
Непосвященному человеку куча устаревшей информации на серверах компании может показаться мусором. Но на самом деле это нефть 21 века. Огромные массивы накопленных данных используются для предсказания будущего, в котором бизнес сможет развиваться лучше и заработать больше. Делаются такие прогнозы не напрямую человеком, а посредством компьютера, в который вложены специальные математические алгоритмы. Даже если на график, на котором отображено ежедневное изменение тысячи параметров за последний год, посмотрит хорошо подготовленный специалист, он увидит лишь забор из линий. А компьютер, машина, не напрягаясь сможет сделать верный вывод о влиянии этих параметров на чистую прибыль компании. Но если бы данные вообще не были собраны, то и никакого вывода сделать было бы нельзя. Именно для этого всевозможная информация и хранится в компании, потому что без нее невозможно натренировать машинный интеллект, сделать с его помощью прогноз на будущее и получить выгоду для бизнеса.
Далеко не все данные, которые попадают на серверы компании, представлены в удобном для использования виде. Поэтому «склады» этих данных разделяют на несколько типов, между которыми непрерывно перекачивается информация, изменяя свою форму (или, говоря профессиональным языком, формат). Первый склад называется «озеро данных» (с английского ”Data Lake”). В него попадает вообще все, во всех возможных форматах. Там могут находиться файлы текстовых документов PDF или DOC вперемешку с JPEG-изображениями и MP4-видеофайлами. Как можно догадаться, если бессистемно поставлять подобные потоки информации в хранилище и не определить заранее, как и куда сохранять, то озеро данных очень быстро превратится в болото. Чтобы этого не произошло, нужен специальный программист, он же «инженер по данным». А если быть совсем точным, «директор по данным» (с английского ”Chief Data Officer”). Он следит как за порядком на этом «водохранилище», так и за правами доступа к нему. Весь процесс называется «управление данными» (с английского ”Data Governance”).
Итак, озеро данных – это первый «склад», куда попадает информация. После чего начинается процесс ее трансформации в более удобные формы для последующего размещения в следующем складе под названием «хранилище данных» (с английского ”Data Warehouse”). Сам процесс преобразования информации и ее перемещения между «складами» называется ETL (англ. термин ”Extract, Transform, Load” – дословно «извлечение, преобразование, загрузка»). И в конце, когда данные оказываются в хранилище в удобной для чтения форме, с ними уже могут начинать работать другие специалисты. На основе этих данных строят графики, их анализируют, на них тренируют модели машинного обучения, а также используют их для построения статистики и бизнес-отчетов.
Обычно ETL-процессы автоматизируются специальными программами, которые пишут инженеры по данным. К примеру, каждый квартал компания скачивает публичный бухгалтерский отчет конкурентов в PDF-формате. Делается это для того, чтобы держать руку на пульсе, следить за рынком. Очевидно, что в такой ситуации невозможно попросить конкурента выкладывать информацию в более удобном формате. Поэтому инженер по данным пишет программу, которая сначала скачивает PDF-файл в «озеро данных», потом достает пару-тройку нужных значений из него и сохраняет в «хранилище». После чего обновляет графики, которые строятся по этим данным. И в конце удаляет исходный PDF-файл из озера. Подобная программа срабатывает по расписанию, автоматически, непрерывно доставляя свежую информацию руководству и аналитикам. А в хранилище не остается больших ненужных файлов, все преобразуется в максимально компактный и удобный вид.
Машинное обучение
Итак, мы определились как со способом хранения данных, так и с причиной их преобразования в более удобный и компактный формат. Но остались вопросы: какова цель хранения данных, почему их не стоит удалять по прошествии длительного времени, зачем их бесконечно копить? Кратко на эти вопросы можно ответить так: собранные «большие данные» нужны для обучения машин. После прохождения такого обучения компьютеры способны прогнозировать параметры спроса, предлагать меры по улучшению продуктов и услуг, а также выдвигать идеи для построения новых стратегий по продажам. Наличие подобных обученных машин ведет к увеличению прибыли, снижению издержек производства, улучшению бизнес-процессов, и, как следствие всего этого, компания начинает теснить своих конкурентов.
Попробуем понять принцип машинного обучения с помощью небольшого примера. Предположим, в компьютер загрузили фотографии собаки. Затем машине сказали: «Это фотографии собаки». Компьютер запомнит такой образ собаки и само слово. Для контроля этих знаний надо провести экзамен – загрузить в машину фото другой собаки. И компьютер, используя созданную во время обучения логическую модель, скажет: «С вероятностью 95 % это похоже на собаку». Если тренирующий машину специалист будет удовлетворен таким уровнем точности ответа, он завершит обучение и сохранит текущее состояние машины в файл, чтобы воспользоваться им при необходимости в будущем. В этом файле натренированной модели машинного обучения находится логика определения собак по изображению на фотографии. При этом данную модель можно улучшить в будущем, переобучить: сделать ее более точной, используя больше изображений.
Готовая модель с созданной в процессе обучения логикой сохраняется в файл, в память компьютера. Это делается специально, чтобы в следующий раз, когда понадобится прогноз, не приходилось проводить обучение с самого нуля. Обратите внимание, что тренировка машины похожа на процесс обучения человека: чтобы получить качественное образование, необходимо выполнить как можно больше контрольных, пройти много тестов и сдать кучу экзаменов. В случае с изображениями собаки, для достижения более-менее уверенного распознавания потребуется показать машине тысячи фотографий с этими и другими животными. Такой процесс обучения может растянуться на несколько дней даже на мощных компьютерах. А вот само предсказание с помощью готовой модели занимает считанные доли секунды. И может осуществляться на ограниченных вычислительных ресурсах, даже на мобильных телефонах. При этом файл модели редко превышает размер в пару сотен мегабайт.
Часто можно услышать еще такие термины как «нейронное программирование» и «глубокое обучение» (с английского ”Deep Learning”). По сути, это способы построения логики, которые находятся под «капотом» у модели машинного обучения. Конечному пользователю готовой модели абсолютно все равно, как проводилось обучение: будь то «нейронное программирование», «дерево решений» или что-то связанное с «глубоким обучением». Главное, чтобы это была действительно обученная (натренированная) модель с хорошей предсказательной силой (высокой вероятностью верного ответа). А выбор методов по ее построению и тренировке – это задача специалистов. Ведь с точки зрения тех, кто использует готовые модели, все работает одинаково. Это как с автомобилями – они такие разные, но у всех у них есть педаль газа и тормоза. Поэтому, если услышите термины «нейронное программирование» и «глубокое обучение», знайте, что это все то же «машинное обучение».
Кто использует машинное обучение в бизнесе
Чтобы оценить необходимость использования машинного обучения в бизнесе, достаточно взглянуть на лидеров рынка, которые в подавляющем большинстве уже активно его применяют[2] и, по данным консалтинговой компании McKinsey & Company, делают это практически во всех возможных областях (от ретейла и туризма до фармакологии и электрогенерации) и почти в 4 раза чаще, чем остальные фирмы. Судя по такой существенной разнице, машинное обучение является одним из основных инструментов, которыми должна уметь пользоваться организация, если она стремится выбиться в лидеры.
По данным аналитиков, после внедрения машинного обучения у компаний в среднем себестоимость производства снижается на 10–20 %, а выручка растет на 5–10 % в зависимости от сферы деятельности. Это невероятная выгода. Поэтому почти 70 % лидеров рынка говорят о том, что машинное обучение является частью их стратегии и у них составлены многолетние корпоративные планы по его дальнейшему развитию.
Бытует мнение, что при внедрении машинного обучения придется нанимать много сотрудников для поддержания работы созданных систем. Но по статистике лишь 30 % компаний придется увеличить штат на 3 %. И только у 5 % – он вырастет на 10 %. При этом в фирмах, связанных с тяжелой промышленностью, общее количество сотрудников, наоборот, уменьшится на 3–10 %.
Цель цифровизации и сбора больших данных
Распознавание собак на фотографиях – это отличная функция. Но вряд ли с ее помощью можно создать несколько успешных бизнес-продуктов, которые принесут реальную прибыль. Поэтому давайте оставим этот пример и зададимся более глобальным вопросом: «Как за счет больших данных и машинного обучения увеличить прибыль компании или по крайней мере вывести ее на самоокупаемость?» В этом вопросе речь идет о двух совершенно разных состояниях бизнеса. Но они оба могут быть скорректированы, с одной стороны, благодаря аналитике и ее инструментам, с другой – за счет возможности предсказания будущего на основе больших данных. Разберем все по порядку.
Как заработать больше
Рассмотрим аналитический процесс (анализ больших бизнес-данных) с точки зрения обычного человека. В качестве примера возьмем продажи питьевых йогуртов. Для проведения анализа люди используют графики. Например, график зависимости средней прибыли компании от количества бутылок йогурта в одной проданной упаковке:
На таком графике любой человек с легкостью может найти самый высокий показатель и сделать вывод: «Если класть в упаковку по 5 йогуртов, чистая прибыль будет максимальной и составит 160 рублей за одну такую проданную упаковку». И это верное заключение, с одной лишь оговоркой. Двухмерный график строится тогда, когда все остальные параметры зафиксированы. Например, этот график справедлив при значении объема бутылки в 100 мл. Но как он поведет себя, если построить его исходя из разных объемов емкости? Давайте попробуем изобразить трехмерный вариант такого графика.
С изменением объема одной бутылки изменяется и чистая прибыль. Поэтому для получения максимальной выгоды надо найти на трехмерном графике наивысшую точку и определить уже два параметра: количество бутылок в упаковке и объем одной бутылки.
Рекомендую прямо сейчас зайти на сайт RealBigData.ru, который был создан специально для демонстрации идей, изложенных в этой книге. Там представлен этот трехмерный график в интерактивном формате, его можно «покрутить» и найти параметры точки максимума (координаты появляются при наведении курсора мыши).
Как можно заметить на трехмерном графике, вершина имеет значение в 230 рублей и находится в координатах «5 бутылок, 130 мл объема». Добавив лишь одну ось к предыдущему графику, мы смогли найти такие параметры товара, которые дали на 21 % больше прибыли! Чувствуете силу данных? Попробуем улучшить результат, увеличив количество осей…
На трехмерном графике любой из нас без особого труда может чисто визуально найти максимум. Такой несложный алгоритм поиска наивысшей прибыли может дать хорошие результаты. Но если на график добавить еще одну ось, то человеку будет уже очень трудно справиться с поставленной задачей по поиску параметров, определяющих максимум. Потому что он не может представить четырехмерное пространство. Получается, что такой визуальный способ не является ни универсальным, ни точным из-за невозможности с его помощью рассмотреть все переменные одновременно. Это приводит к тому, что питьевые йогурты будут продаваться не с максимально возможной прибылью. А в условиях конкурентного рынка недостающие проценты прибыли могут привести к банкротству. Какой вывод? С этого момента лучше прибегнуть к помощи компьютера.
Теперь попробуем провести анализ приведенных графиков с точки зрения машины. Компьютер не сможет изучать графики визуально, как это делаем мы, потому что у него нет глаз. Он поведет себя как незрячий человек, ощупает всю поверхность графика и таким образом разыщет максимум. На первый взгляд такой способ выглядит трудозатратным. Но представьте, что нужно предсказать чистую прибыль не по двум параметрам (количество бутылок и их объем), а по десяти:
1. Количество бутылок.
2. Объем одной бутылки.
3. Температура бутылки.
4. Толщина стенки бутылки.
5. Прочность крышки.
6. Время суток, когда была совершена продажа.
7. Размер скидки.
8. Возраст покупателя.
9. Пол покупателя.
10. Наличие шляпы на голове покупателя.
Для проведения анализа по этим данным придется строить не двух- или трехмерный график, а одиннадцатимерный (10 параметров + 1 ось – чистая прибыль как предсказываемая величина), представляющий собой одиннадцать перпендикулярных друг другу осей, выходящих из одной точки. Обычный смертный не может ни нарисовать такой график, ни визуально найти на нем максимум. А вот компьютеру даже не придется менять его подход: незрячая машина последовательно ощупает все оси, методично переберет все значения, сравнит результаты всех возможных комбинаций и в итоге выдаст ответ, при каких параметрах будет получена максимальная прибыль. Но для этого нужны большие данные, которые надо специально и тщательно собирать. И чем ответственнее компания подходит к этому процессу, а также к обработке данных, тем больше увеличит свою прибыль, повысит качество предлагаемого товара или услуги и тем сильнее снизит издержки в результате использования машинного интеллекта.
У вас могут возникнуть вопросы: «Погодите, каким образом связаны одиннадцатимерный график, на котором представлены различные параметры йогурта, и машинное обучение? В предыдущем примере компьютер обучали, показывая ему фотографии собак, а теперь кто, кого, чему и как учит? Как на этом сделать прибыль?» Чтобы ответить на них, надо разобрать данные, касающиеся параметров йогурта подробнее. Компания методично собирала эти данные, экспериментируя с размерами упаковки и продавая разные ее варианты в различных магазинах разным покупателям и в разное время. Несложно догадаться, что фирма не смогла бы проверить все возможные комбинации полученных данных, то есть перебрать все значения параметров, чтобы как можно точнее описать «изгибы» одиннадцатимерного графика и определить максимальные значения прибыли. В результате у них получился график с «пропусками», то есть с областями, в которых отсутствовали данные. К примеру, компании совсем не удалось получить информацию о продаже йогурта вечером покупателю в шляпе. Это не значит, что такой продажи не было или не могло бы быть. Просто именно для этого сочетания значений параметров нет данных. И как же в таком случае быть? Вот тут-то и вступает в дело «машинное обучение» или «искусственный интеллект».
Натренированную на данных машину можно попросить предсказать значение прибыли в точке пропуска на графике, то есть в области, для которой данные еще не были получены экспериментальным путем. В нашем случае запрос к машине на предсказание будет звучать так: «Сколько бы заработала компания, если бы продала йогурт покупателю в шляпе вечером?» В ответ компьютер выдаст нам точное число, полученное из имеющихся в распоряжении данных. Это произойдет невзирая на то, что в действительности подобная ситуация еще никогда не случалась. Так компания сэкономит значительные средства на проведении реальных экспериментов с разными типами упаковок йогурта и не только.
Заполнение машиной пропущенных значений на одиннадцатимерном графике отчасти можно сравнить с ремонтом лоскутного одеяла с помощью заплаток. Сначала изучают края дыры, определяют, какой формы заплатка требуется. Затем «пробел» латают. После этого график можно считать более-менее полным. Однако нужно понимать, что если дырки в графике слишком большие, то есть реальных данных очень мало, то предсказания будут неточными. Это как невозможно подобрать нужный лоскут для ремонта, если дыра огромного размера, иначе будет нарушен рисунок. В таком случае, увы, придется покупать новое одеяло. Поэтому никогда не выкидывайте данные, накапливайте их для обучения компьютеров. Чем больше данных, тем меньше потребность в заплатках. А значит, точнее предсказания.
Возможно, иллюстрация с йогуртом показалась кому-то из читателей несколько надуманной. Приведу реальный пример, касающийся больших данных, чтобы доказать, что это совсем не так. Обратимся к открытому соревнованию Concrete compressive strength[3], в рамках которого специалисты по данным должны были определить состав самого твердого бетона. Участникам предоставили частичную информацию, в которой содержались сведения относительно прочности образцов в зависимости от соотношения различных компонентов и параметров. Всего было шестнадцать переменных:
1. Количество цемента.
2. Количество доменного шлака.
3. Количество золы.
4. Количество воды.
5. Количество «суперпластификатора».
6. Плотность пластификатора.
7. Количество крупного заполнителя.
8. Количество мелкого заполнителя.
9. Количество компонента MixtureMeasurement9.
10. Количество компонента SSL9000.
11. Значение параметра O2_purityscore.
12. Количество компонента F192.
13. Оценка по шкале TysonScore.
14. Площадь бетона.
15. Возраст бетона.
16. Влажность бетона.
Производитель бетона собирал данные, изучая имеющиеся у него образцы, и пытался найти такое соотношение ингредиентов, при котором прочность была бы максимальной. Очевидно, что если бы компания решила действовать путем «перебора» всех возможных соотношений, то у нее не хватило бы ни денег, ни времени (продолжительности жизни сотрудников), чтобы протестировать все возможные комбинации. Для решения именно таких задач и предназначено машинное обучение. Созданный на основе собранных данных алгоритм способен предсказывать значения для «пробелов», благодаря чему можно получить результаты тех экспериментов, которые еще не проводились в реальности, то есть спрогнозировать будущее. К примеру, если компания-производитель бетона спросит: «Какова будет прочность, если использовать в два раза больше золы?», то машина ответит что-то вроде: «Прочность упадет на 26.7 %». Так фирма может проводить миллионы экспериментов в день, не тратя на это ни копейки. Действуя подобным образом, рано или поздно компания обязательно найдет лучшее соотношение компонентов для создания самого прочного и дешевого бетона.
Как вывести компанию из убытков
В предыдущих главах мы выяснили, как можно увеличить прибыль, используя большие данные и машинное обучение для предсказания результатов экспериментов. Но для того чтобы эти большие данные вообще появились и сохранялись в процессе каждого бизнес-процесса, необходимо специальным образом организовать все информационные потоки в компании. Самое время перейти к обсуждению масштабной и фундаментально важной для больших данных темы – цифровизации как комплекса действий, направленных на перевод львиной доли или всех процессов в организации с бумажных носителей в «цифру». Простыми словами, как всю ту информацию, которую раньше сотрудники компании записывали на бумаге, перенести в компьютеры.
На первый взгляд кажется, что цифровизация поможет «заработать больше» компаниям лишь в том случае, если они и так хорошо себя чувствуют и находятся «на плаву». Но это неверно. Благодаря цифровизации можно вытянуть убыточный бизнес на уровень самоокупаемости. К сожалению, многие руководители и топ-менеджеры за ежедневной рутиной и миллионом сиюминутных дел не видят этой возможности. При этом их конкурентами являются компании с молодыми собственниками, которые буквально весь бизнес строят в цифре, в принципе не используя бумажные документы. Они делают это с момента создания своей компании, потому что знают, что иначе не смогут минимизировать расходы и выйти на самоокупаемость. Современные фирмы поступают таким образом даже в том случае, если у них нет конкурентов на рынке и на текущий момент они являются монополистами. Эта цифровизация внедряется совершенно осознанно, методично и последовательно, если необходимо, то даже насаждается насильно, вопреки воле некоторых менеджеров и сотрудников. Потому что если не сделать этого сразу, в дальнейшем, когда на рынок придут конкуренты и начнут забирать часть прибыли, а дела у компании, соответственно, станут хуже, уже невозможно будет быстро переучить всех и перейти на «цифру».
Процесс цифровизации старых закостенелых компаний весьма болезненный, но при этом довольно прозрачный и понятный с простой последовательностью действий:
1. Находим ту работу, которую можно автоматизировать или роботизировать.
2. Пишем программу, делаем робота.
3. Переводим сотрудника, который раньше выполнял эту работу, на новую должность или, увы, расстаемся с ним.
Несмотря на то, что программы и роботы стоят недешево, им не нужна ежемесячная заработная плата. Они будут славно трудиться до тех пор, пока есть электричество и хотя бы один надзиратель-оператор, который изредка будет проверять их успехи.
Благодаря этой схеме высвобождаются финансы, которые раньше уходили на зарплаты сотрудникам. При этом не надо увольнять всех сразу, процесс довольно сильно растянут во времени. Цифровизация осуществляется небольшими порциями и на самых востребованных направлениях – тех, где она высвободит наибольшее количество денег. Она может не иметь четких рамок и часто привязывается к тем финансам, которые получилось сэкономить на предыдущем витке. Этот процесс напоминает снежный ком: чем больше машин внедряем в помощь человеку, тем больше экономим денег, тем больше машин сможем внедрить в будущем.
Основная проблема цифровизации с точки зрения финансов заключается лишь в том, что услуги программиста или специалиста по электронике стоят денег. И потребуется накопить стартовую сумму даже для проведения разовых работ (не говоря уже про периодические), которые зачастую просто необходимы.
Для наглядности рассмотрим несколько компаний, работающих в разных сферах. Их объединяет одно – полное отсутствие цифровизации и, как следствие, убыточность. При этом ситуацию можно «перевернуть», выявив и устранив имеющиеся болевые точки. Все описанные далее предложения реальны и эффективны. Вы можете использовать эти идеи для внедрения цифровизации в своей компании.
Гаражный кооператив
Каждое предприятие уникально. И цифровизация у всех проходит по-разному, затрагивая бизнес-процессы разного порядка. Конечно, выгода непосредственно зависит от глубины проработки, но то, что этот процесс окажет на компанию общее положительное влияние, это факт. Главное, что с каждым новым этапом выгода будет расти и уже никогда не даст задний ход.
В качестве первого примера рассмотрим расположенный в родном городе автора этой книги гаражный кооператив, членом которого он является. Упомянутый кооператив насчитывает несколько сотен гаражей. Каждые полгода бухгалтерия присылает своим клиентам платежки за услуги. До 2021 года они представляли собой специальные бумажные квитанции, в которых от руки заполнялись данные владельца, указывалась сумма задолженности и другая информация, после чего бухгалтер выдавала готовые документы каждому члену кооператива лично в руки, для этого планово приглашая всех по списку на персональную встречу.
На первый взгляд кажется, что это просто каменный век какой-то и оптимизация производственных процессов отсутствует у них напрочь. Однако это не так. Достаточно взглянуть на квитанцию. На маленькой бумажке напечатано слово «Квитанция», есть поля «ФИО», «Дата» и т. п. То есть данные слова бухгалтеру не надо писать от руки, что уже немного экономит его время и силы. Можно даже предположить, что кооперативу потребовалось бы нанять отдельного человека для этой работы, если бы названия полей не были напечатаны заранее. Ведь в кооперативе сотни гаражей, а значит, заполнение вручную нескольких дополнительных граф – это существенные временные затраты, требующие введения дополнительной штатной единицы. Таким образом, с одной стороны, кооперативом все же управляют довольно сознательные люди, которые ценят время как ресурс, но, с другой стороны, это далеко не все преобразования, которые можно провести. Что же дальше?
Совсем недавно бухгалтерия гаражного кооператива, после долгих споров и дебатов заинтересованных сторон и согласования со всеми директорами, все-таки удовлетворила дерзкую просьбу автора этой книги и начала присылать мне фотографии квитанций в мессенджере. Подобное решение избавляет меня от необходимости посещения бухгалтерии, а кооператив, в свою очередь, быстрее получает оплату. И это уже огромный шаг на пути к цифровизации, на который учреждение не потратило ни копейки.
Благодаря интернету бухгалтер за считанные секунды передает мне квитанцию. Ему теперь не надо тратить время на то, чтобы позвонить мне, согласовать время моего визита и, наконец, встретиться со мной. Я всегда увижу отправленное сообщение и произведу оплату. То есть одно небольшое решение избавило организацию от целого вороха проблем, связанных с выдачей квитанций. Уверен, что кооператив войдет во вкус и через несколько лет уже в принудительном порядке будет отправлять фото квитанций всем клиентам. Но давайте оценим всю выгоду, которую получит компания в результате такого решения. Очевидно, что, во-первых, можно будет уволить человека, который занимается обзвоном клиентов с целью согласования встречи для передачи квитанции. Поскольку кооператив насчитывает несколько сотен гаражей, наверняка один сотрудник постоянно «сидит» на телефоне, тренируя свой голосовой аппарат. Уволив бесполезного работника, организация сможет ежемесячно направлять его зарплату на что-то стоящее, например:
• Купить 2–3 камеры для системы видеонаблюдения.
• Развивать систему пожаротушения.
• Проводить модернизацию системы подачи воды.
• Осуществлять ремонт дороги.
Вы, конечно, можете возразить мне, что деньги, сэкономленные на зарплате одного сотрудника, – совсем небольшая сумма. Это верно. Однако не забывайте, что первый этап цифровизации производственного процесса был осуществлен совершенно бесплатно благодаря использованию популярных в народе мессенджеров. Затрат на реализацию идеи вообще не было. А в итоге кооператив получил свободные средства, которые, накапливаясь из месяца в месяц, потихоньку превращаются в существенную сумму.
Из зарплаты уволенного сотрудника логично сделать ежемесячно пополняемый фонд, средства из которого тратились бы только на проведение дальнейшей информатизации производства, точнее, на зарплату программиста, который писал бы на заказ необходимые программы. Речь идет не о ежемесячной выплате, а о сдельной оплате труда за конкретные проекты. Так как фонд пополняется постоянно, со временем денег хватит на проведение следующих этапов цифровизации. Надо лишь подождать, пока они накопятся. А мы тем временем давайте подумаем, что еще можно оптимизировать в гаражном кооперативе.
Первое, что бросается в глаза, – мне присылают фотографии бумажных квитанций, на которых от руки написаны ФИО и сумма задолженности. Очевидно, что эту работу способна выполнять машина. Вполне возможно написать программу, которая будет получать из бухгалтерии сумму задолженности и составлять документ в формате квитанции, заполняя нужные ФИО и сумму. С такой программой бухгалтеру вообще не нужно будет ничего писать от руки, достаточно лишь нажать на кнопку и распечатать квитанцию.
Конечно, за разработку подобной программы придется заплатить. Но это нужно будет сделать только один раз. И, кроме того, деньги на это пойдут из ежемесячно пополняемого фонда, созданного заранее. Если такая программа стоит больше, чем поступление за один месяц, нужно просто подождать несколько месяцев, чтобы скопить необходимую сумму. Главное, что программа пишется один раз и не требует постоянной зарплаты, в отличие от сотрудника. И рано или поздно, когда она заработает, кооператив начнет экономить. Бухгалтер больше не будет писать что-либо от руки, а значит, сохранит энергию и время для другой работы. Возможно, даже удастся сократить его рабочий день и перевести на полставки. Наверняка ежедневное заполнение квитанций для сотен клиентов гаражного кооператива занимало не один час, причем бессмысленного, не требующего высокой квалификации труда. Теперь же бухгалтер может просто распечатать все квитанции и тратить время только на их фотографирование и отправку в мессенджер.
А если вспомнить о том, что в нашей стране уже достаточно развитое законодательство, которое разрешает передавать клиенту чек в электронном виде, мы придем к тому, что бумажки вообще не надо печатать! То есть бухгалтер может отправлять квитанции клиентам в электронном виде на их почту или в мессенджер. В итоге не нужно ничего печатать, закупать листы, чернила для принтера, ремонтировать оргтехнику. Все эти лишние ежемесячные расходы превращаются в деньги фонда по цифровизации компании. Причем будут поступать в него с той же регулярностью, с которой происходит закупка этих расходных материалов. К примеру, если бухгалтерия кооператива приобретает картридж для принтера каждый месяц, то теперь эта сумма будет уходить в фонд цифровизации.
Следующим шагом станет полное освобождение бухгалтера и всех остальных причастных от рутины по рассылке квитанций. Для этого кооперативу снова придется подождать некоторое время, чтобы накопить необходимую сумму и заказать вторую небольшую программу по автоматической рассылке квитанций всем клиентам в мессенджеры. С этого момента вся работа бухгалтера сведется к нажатию одной-единственной кнопки с надписью: «Отправить квитанции всем клиентам». Остальные процессы будут происходить автоматически. Клиенты получат квитанции напрямую от бухгалтерии. Никому не придется ни заполнять платежные документы от руки, ни печатать их, ни обзванивать всех членов организации, ни встречаться с ними, для того чтобы отдать квитанции, ни закупать чернила и бумагу для принтера каждый месяц. Таким образом, после нескольких волн автоматизации у гаражного кооператива уже есть две программы, которые выполняют все те же функции, которые до этого реализовывали сразу несколько сотрудников: одна формирует квитанции, вторая рассылает их клиентам. Теперь можно смело проводить вторую волну увольнений, а зарплату уволенных ежемесячно отправлять в фонд дальнейшей цифровизации.
Вдумайтесь, цифровизации подвергся лишь один процесс раздачи квитанций, а компания уже вздохнула с некоторым облегчением, осознав объем высвободившихся денежных средств. В целом, даже на этом можно остановиться. Потому что лучшее – враг хорошего. Но ради эксперимента попробуем порассуждать, какой могла бы быть дальнейшая цифровизация кооператива, если в качестве окончательной цели – финального аккорда – поставить себе перевод всей компании в «компьютер». Для этого необходимо будет сделать нечто более серьезное, чем написать пару небольших и недорогих программ. Здесь требуется полноценный сайт в интернете с функцией личного кабинета клиента. Войдя в него, члены кооператива смогут узнать о своей задолженности и самостоятельно совершить оплату. При этом сайт автоматически проверит и зафиксирует факт оплаты, снимая эту часть работы с главного бухгалтера. Сразу стоит отметить, что все написанные ранее программы – по формированию и рассылке квитанций – не пропадут, а будут задействованы в работе этого сайта. Поэтому цена подобного личного кабинета окажется вполне вменяемой по сравнению с остальными затратами.
Первым «пострадавшим» от внедрения новой системы станет помощник бухгалтера, единственная реальная задача которого сегодня – проверять факт оплаты счета в банке. Каждый день этот сотрудник лишь звонит в банк (или заходит на его сайт), уточняя, пришла ли оплата от определенного клиента. Ранее описанная схема действия цифровизации сработает и в этом случае:
• Будет написана программа, которая заменит человека.
• Сотрудника уволят.
• Зарплата бывшего сотрудника начнет ежемесячно поступать в фонд дальнейшей цифровизации.
Таким образом, возникает непрерывный цикл цифровизации, при каждом витке которого компания высвобождает все больше и больше денег без ощутимых затрат, а баланс фонда ежемесячно растет заметными темпами.
Очевидно, что после череды достижений, когда руководство кооператива увидит реальную финансовую выгоду от цифровизации, оно загорится желанием получить еще больше и наверняка попросит заняться бухгалтерией плотнее. В этот момент придется нанять одного программиста на постоянную работу, используя для этих целей ежемесячно пополняемый фонд цифровизации, который сформировался из зарплат уволенных сотрудников. Перед новым специалистом будет стоять, хоть и непростая, но вполне реальная задача – связать сайт кооператива и всю бухгалтерию, что займет у него несколько месяцев работы.
Но это не значит, что по окончании данного проекта с программистом придется расстаться, наоборот, его ни в коем случае нельзя отпускать! Потому что на этой стадии цифровизации компании необходим штатный специалист, который знает систему изнутри. Поэтому стоит перевести его на постоянную должность в бухгалтерию. Идеальный вариант – это когда в небольшой бухгалтерии работают только один бухгалтер и один программист. Первый планирует, что и как нужно автоматизировать, второй реализует это. И если у них все получается и они представляют собой по-настоящему слаженную команду, со временем система оказывается до такой степени автоматизированной, когда, например, даже годовые отчеты для налоговой формируются и отправляются самостоятельно, что этап информатизации всего кооператива можно считать законченным. И тогда наступает подходящий момент для обсуждения с этими специалистами вопроса об их частичной занятости.
Всю описанную выше работу по цифровизации реально провести буквально за один-два года, спустя которые можно будет лишь удивиться и порадоваться сумме, продолжающей накапливаться в фонде цифровизации. Ведь чем более раздутой была бухгалтерия, чем больше сотрудников в ней работало, тем сильнее будет расти фонд. Потому что все, кроме главного бухгалтера и одного программиста, подпадут под сокращение.
Остается только подвести итоги. Положение дел до цифровизации:
• Бумажная бухгалтерия.
• Сотрудники, которые занимаются ерундой: непрерывно пишут бумажки от руки, звонят клиентам, вручную проверяют поступления на счет в банке.
• Существенные траты на расходные материалы: бумага, чернила, орг. техника и т. п.
• Необходимость проведения большого количества персональных встреч с клиентами в офисе.
Что компания получит после проведения полной цифровизации:
• Фонд, который ежемесячно пополняется за счет зарплат уволенных сотрудников:
– ◦ заполнителей квитанций от руки;
– ◦ специалиста по телефонным переговорам с клиентами;
– ◦ специалиста по телефонным переговорам с банком по поводу установления фактов оплаты;
– ◦ и за счет отсутствия затрат на расходные материалы: бумагу, чернила, орг. технику и т. п.
• Полностью автоматизированную систему выставления счетов, которая будет работать, даже если уволить всех сотрудников, а именно сможет сама:
– ◦ выставлять счета;
– ◦ принимать оплату картой;
– ◦ проверять факт оплаты;
– ◦ отправлять отчеты в налоговую;
– ◦ предоставлять клиентам доступ к личному кабинету на сайте, благодаря чему те смогут внести текущие данные счетчиков энергии и воды, а также посмотреть задолженности, с целью учета и проведения автоматических расчетов.
• Сокращение численности сотрудников бухгалтерии до двух человек – главного бухгалтера и программиста – и, как следствие, свободные деньги, которые пойдут на дальнейшее развитие кооператива.
Полученная в результате цифровизации система является дешевой, гибкой, легко управляемой и устойчивой к кризисам. При этом на каждом этапе ее реализации административная нагрузка на коллектив только снижается, ведь людей становится меньше. А первоначальные затраты для запуска процесса равны нулю.
Можно поспорить насчет полной стоимости создания подобной системы. Но в любом случае, согласно описанному выше плану, в качестве источника финансирования использовался зарплатный фонд уволенных сотрудников, поэтому месяцем раньше или позже, но система все равно будет создана при таком подходе, как только накопится сумма, необходимая для написания программы. А работать эти программы будут бесконечно долго.
Сокращение издержек – это отличная мотивация для проведения цифровизации всей компании. Но не стоит забывать и об основной цели преобразования всех бизнес-процессов в цифровой вид – создании фундамента для сбора больших данных. Ведь если не будет больших данных, то не будет и машинного обучения, которое принесет еще больше выгоды, чем цифровизация.
Столовая
Пример с гаражным кооперативом довольно простой. Этот тип бизнеса не содержит каких-либо сложных технологических процессов. Любой программист среднего уровня справится с задачей цифровизации такой компании. Поэтому немного усложним задачу – рассмотрим вариант, в котором уже присутствует машинное обучение. Вспомним про распознавание изображений собак на фотографиях, а в нашем новом примере тот же алгоритм будет использован для распознавания объектов видеокамерой, что приведет к ускорению одного из главных бизнес-процессов в несколько раз и, как следствие, скажется на прибыли компании. Итак, перейдем непосредственно к примеру.
Действие происходило в недалеком прошлом в одном из крупнейших высших учебных заведений Москвы, в котором постоянно учится порядка 10 тысяч человек (когда-то студентом этого вуза был и автор данной книги). Чтобы обеспечить энергией такую толпу, на территории университета построен и функционирует отдельный специальный корпус – здание, в котором находится четыре основных столовых. Но даже при таком, казалось бы, достаточном количестве точек общепита вполне можно остаться голодным во время большого перерыва (с 12 до 13 часов дня). Виной тому – очереди, в которых придется отстоять примерно 30–35 минут, чтобы получить свою порцию. В расписании же студентам на обед отведено всего ~50 минут! Эти очереди в больших столовых могут доходить до нескольких десятков метров, напоминая гигантских голодных змей, хвосты которых теряются где-то в коридоре. Любой студент способен, окинув опытным взглядом такую очередь, сразу определить, будет он сегодня с обедом или нет. Поэтому многие отказываются от идеи перекусить, даже не заходя в столовые, когда видят хвост «рептилии» в коридоре.
На первый взгляд кажется, что это золотая жила – бизнес, спрос на который всегда будет превышать предложение. А на практике оказывается, что и здесь бывают проблемы с прибылью. Но существует способ, с помощью которого можно спасти такой «общепитовский» бизнес, решить имеющиеся проблемы, не прибегая к кардинальным мерам по сокращению штата сотрудников, ухудшению качества еды или размеров порций. Есть очевидное проблемное место, которое требует автоматизации, если целью является значительное увеличение прибыли и сокращение издержек.
Речь, конечно, о слишком долгом ожидании в очереди. Студентам приходится тратить на это до 80 % всего перерыва, чтобы потом за оставшиеся считанные минуты быстро забросить в себя еду и бегом добраться до аудитории, где, скорее всего, уже началась лекция. Понятно, что подобные, довольно экстремальные условия серьезно влияют на количество посетителей столовой. Но управляющий не замечает упущенной прибыли, потому что смотрит исключительно на цифры в отчетах и видит постоянную выручку, которая практически не меняется из месяца в месяц. Ориентируясь на эти данные, он делает логичный с его точки зрения вывод: «все отлично, продолжаем работать, клиентам нравится».
То есть для управляющего важно, чтобы выручка не падала, именно поэтому он следит за отчетностью и показателями. Но если мы говорим о росте прибыли, необходимо смотреть не только в бумаги, но и вокруг, обращая внимание на реальные проблемы. Так, выручка стоит на месте, потому что на кассе в каждой столовой сидит только один человек. А очередь – это результат того, что единственный кассир вручную пробивает каждое блюдо, которое видит на подносе у студента, причем в старый кассовый аппарат заносится стоимость блюда с точностью до копейки. То есть в среднем, бедный продавец должен нажать примерно полсотни кнопок, чтобы выдать один чек. А после этого студенты оплачивают еду наличными деньгами, несмотря на то, что вся стипендия приходит на карту, так как раритетный аппарат не принимает карты. Соответственно, кассиру приходится иметь дело еще и с наличными: точно считать, выдавать сдачу и при необходимости бегать разменивать большие купюры. Продолжительность этого процесса сильно зависит от скорости реакции кассира, его моторики, опыта.
Весь этот ад отчетливо видит каждый студент, который стоит в очереди, но не управляющий, который смотрит лишь в цифры, которые говорят ему, что выручка не падает, хотя и не растет. К слову, именно из-за такой вот нелепицы в фирмах и существует отдел «создания и построения компании», который специально отделен от «административного» (поговорим об этом подробно в следующих главах). Оптимизацией и цифровизацией процессов должны заниматься не управляющие, а другие люди, наделенные большими полномочиями и имеющие соответствующую подготовку в области независимого анализа действующих бизнес-процессов. Иначе ничего не получится.
Опишем пошагово задачу и способ проведения цифровизации бизнес-процессов в столовой, по аналогии с тем, как сделали это с гаражным кооперативом.
• Исходные данные: традиционная столовая, где надо встать в очередь, взять поднос, набрать на него еды, подойти к кассиру, оплатить еду.
• Цель цифровизации: увеличить скорость движения очереди, чтобы выросло число обслуживаемых клиентов и, как следствие, ежедневная прибыль.
• Бюджет цифровизации: ноль (как и в случае с гаражным кооперативом). Исходим из того, что свободных денег нет совсем, то есть мы не можем сделать перепланировку в столовой и посадить второго кассира, например.
Немного изучив проблему и стартовые условия, можно прийти к выводу о необходимости построения системы, которая бы работала вместе с кассиром, ускоряя его действия в несколько раз. Эта система сама должна формировать чек, «видя» еду на подносе клиента. А продавцу останется лишь бегло проверять данные и нажимать не на пятьдесят разных кнопок, а только на одну с надписью: «Напечатать чек». И конечно, оплата должна производиться по карте, а не наличными деньгами, что еще больше сократит время обслуживания. Подобный программно-аппаратный комплекс значительно ускорит очередь. Таким образом, необходимо построить систему, при которой кассир бы весь день только смотрел на монитор с результатами распознавания заказа и ему оставалось бы просто подтвердить состав чека и проследить, чтобы клиент заплатил.
Для работы такой системы-помощника кассиру потребуется алгоритм распознавания объектов на фото и видео, вариации которого уже давно есть в публичном доступе в интернете. Их точность распознавания достигает 95–98 % при скорости обработки несколько десятков изображений в секунду. Эти алгоритмы могут анализировать и потоковое видео с камеры. То есть клиенту не надо будет даже делать стоп-кадр подноса – все будет распознано на ходу.
Подобные алгоритмы, размещенные в публичном доступе, часто имеют открытую лицензию, то есть автор разрешает использовать их бесплатно даже в коммерческих целях. С их помощью подобный проект с распознаванием еды на подносе видеокамерой может сделать даже школьник, обладающий средними знаниями в программировании. В этой книге, чуть дальше, вас ждет глава, в которой собрана информация о популярных бесплатных алгоритмах машинного обучения. В том числе и несколько вариантов для распознавания предметов на фото и в потоковом видео.
Давайте перейдем к проработке этапов цифровизации столовой. Они будут примерно такими же, как и в случае с гаражным кооперативом. Во-первых, необходимо приобрести новый кассовый аппарат с возможностью безналичной оплаты с помощью карты. Я не предлагаю «купить» его. Многие банки сейчас выдают оборудование в аренду под определенный процент с сумм, поступающих с карт. А так как всем студентам и преподавателям стипендия и зарплата, соответственно, приходит именно на карту, то можно смело ввести запрет на прием наличных денег. Благодаря безналичной оплате ускорится обработка заказов, вырастет количество продаж, и затраты на аренду кассы будут компенсированы возросшей прибылью.
При отказе от бумажных денег отпадает необходимость их инкассации до отделения банка. По закону это необходимо делать каждую неделю, нельзя оставлять наличные в кассе на выходные. Поэтому обычно нанимают профессиональных инкассаторов, которым, естественно, надо платить за оказываемые услуги. Установка новой кассы и отказ от наличных позволяют отказаться от этих услуг. Получается, как и в случае с гаражным кооперативом, образуется фонд для дальнейшей цифровизации компании, в который каждый месяц будут поступать суммы, которые прежде выплачивались инкассаторам. Дальше остается только ждать, пока накопится сумма достаточная для разработки первых программ для автоматизации бизнес-процессов.
Обратите внимание, что бесплатное получение нового кассового аппарата и переход на исключительно безналичную оплату приносят материальную выгоду уже с первой недели. Конечно, придется потрудиться, обучая кассиров и бухгалтеров новым правилам. Возможно, потребуется сократить часть сотрудников в результате увеличения производительности работы всего комплекса. Ведь после внедрения данных нововведений очередь будет двигаться быстрее.
Итак, для модернизации столовых нужен программно-аппаратный комплекс, позволяющий распознавать еду на подносе. Звучит угрожающе, но по факту речь идет об обычной веб-камере, подключенной к компьютеру и кассовому аппарату. Цель такого комплекса – автоматически выписывать чек, фиксируя и анализируя то, что находится на подносе клиента. Рассмотрим его составляющие пошагово.
Чтобы компьютер «видел» еду на подносе, ему необходимо купить «глаза» – веб-камеру. Это недорогое и популярное оборудование из обычного потребительского сегмента. Такие камеры покупают для домашних компьютеров, чтобы общаться с родственниками по видеосвязи. Также требуется смастерить крепление для этой камеры, чтобы она стояла рядом с кассиром и «видела» поднос с едой. Желательно расположить ее сверху, над подносом, чтобы она смотрела вертикально вниз, и в объективе был виден весь заказ, все позиции.
На роль компьютера подойдет любое офисное решение. Современные процессоры достаточно мощные, чтобы выдавать результаты предсказаний машинного обучения прямо в процессе на видеопотоке (10–30 кадров в секунду). Можно даже заменить компьютер мобильным телефоном или планшетом. Их вычислительной мощности вполне хватит. Лишь бы имелся порт для подключения камеры и кассы.
Таким образом, получится аппаратный комплекс из камеры, кассы и компьютера. После того, как соединили все вместе, можно начать обучать машину, чтобы в будущем она стала настоящим помощником кассира. На этом этапе необходимо сделать хоть какие-то фотографии блюд для тренировки и отладки системы.
В первый месяц работы системы процесс оформления заказа будет выглядеть как обычно. Кассир продолжит вручную пробивать каждый заказ. Единственное, что от него требуется, – привыкнуть к новому кассовому аппарату и безналичной оплате. В остальном все то же самое. Но этот период нужен, чтобы накопить достаточно изображений блюд и «больших данных» из чеков с целью обучения машины. Кассир незаметно для себя выступает в роли наставника искусственного интеллекта. Машина будет непрерывно наблюдать за тем, что он внес в чек, и тем, что находится на подносе клиента. Алгоритм будет пытаться самостоятельно предсказать результат – это период ошибок и догадок. Верные ответы ему подскажет кассир, даже не замечая, что кого-то учит.
Через месяц, когда система способна будет с высокой точностью распознавать блюда самостоятельно, можно начинать вносить изменения в работу кассира. С этих пор человеку не надо вручную считать стоимость заказа, нажимая на огромное количество разных кнопок. Потому что на экране компьютера будет автоматически появляться состав заказа и цена. Кассиру остается лишь проверить правильность результата и нажать кнопку «печать», чтобы выдать чек покупателю.
В результате применения данного комплекса весь процесс оформления заказа существенно ускорится. Что позволит увеличить количество обслуживаемых студентов и чистую прибыль предприятия.
Приведенный пример цифровизации путем создания рекомендательной системы один из самых дешевых в реализации. Для него нужна лишь веб-камера, посредственный компьютер и новая касса. Конечно, придется нанять программиста, который сможет соединить и настроить все компоненты системы. А также специалиста по машинному обучению, который создаст и натренирует модель. Но все это вполне реально сделать за вполне вменяемую сумму, не превышающую трех-четырех средних зарплат сотрудников этой столовой.
Нужных специалистов для создания такого аппаратно-программного комплекса можно найти на любом большом форуме фрилансеров. Требования к их квалификации не будут слишком высокими, потому что комплекс, о котором идет речь, не требует каких-то «космических» технологий и не является сложным продуктом с точки зрения программирования. К слову, столовая в университете может получить такую систему даже бесплатно, предложив создать ее учащимся с кафедры автоматики в качестве курсовой или дипломной работы. Останется только порадоваться за студентов, которым придумали тему диплома, представляющую собой общественно значимый проект, по-настоящему востребованный и актуальный в родном институте.
Если же у предприятия безлимитный бюджет, стоит сразу разработать и внедрить систему, аналогичную тем, что уже работают в больших сетях общепита нашей страны. Когда по всему залу ресторана расставлены сенсорные мониторы, на которых можно сделать заказ, после составления которого клиент получает номерок, далее ожидает, когда подойдет его очередь, и получает поднос со своим заказом. При этом в зале вообще нет линейных очередей. Такая организация работы максимально ускоряет процесс обслуживания. Но дюжина сенсорных мониторов и принтеров для номерков будут стоить намного дороже, чем комплекс, состоящий из одной веб-камеры, обычного офисного компьютера и современного кассового аппарата.
Какой должна быть цифровизация компании
В предыдущем разделе были рассмотрены два примера улучшения финансового состояния компаний с помощью цифровизации: гаражный кооператив и столовая в вузе. Предприятия из этих примеров находятся на грани рентабельности, поэтому даже небольшое уменьшение затрат с помощью цифровизации имеет для них существенное значение. Но останавливаться на этом нельзя, потому что конкуренты тоже непрерывно переводят свои процессы в цифру, снижая издержки и накапливая большие данные для машинного обучения. К сожалению, многие владельцы и менеджеры компаний с многолетней историей думают, что рынок статичен и до конца их жизни будет находиться в неизменном состоянии.
Вспомним 90-е годы в России. Тогда практически все ниши на рынке пустовали, конкурентов как таковых не было. В той ситуации любое предложение товара оборачивалось его продажей. Можно было прийти на центральную площадь города, поднять свой продукт над головой, и сразу находился покупатель. Потому что если на рынке нет конкурентов, то стоимость рекламы намного ниже стоимости товара. К примеру, чтобы реализовать продукт на пустом рынке, нужно потратить на маркетинг ~5 % его стоимости. Но когда появляются конкуренты, затраты на продажу товара возрастают в несколько раз или даже на несколько порядков. В таком случае единственным способом заработка остается продажа сопутствующих товаров, комплектующих, дополнений, услуг, сдача товара в аренду и т. д. Это нормальная ситуация для конкурентного, занятого рынка.
При этом сами рынки очень инертны. Если производитель нашел пустую нишу, то он быстро заполнит ее своей продукцией, практически не тратясь на рекламу. Отбить потом у него эту долю рынка практически невозможно. На это уйдут десятилетия, за которые продукт может потерять свою ценность.
Многие собственники и топ-менеджеры, ведущие свой бизнес со времен «пустого» рынка, воспринимают потребительский спрос как должное, а не то, что требует серьезных усилий по стимуляции. Потому что изначально они руководствовались девизом «мои штаны продают мои штаны». И это отлично работало. Но с развитием популярности товара рынок продаж становится перенасыщенным предложением в результате конкуренции. Тогда старый бизнес с консервативным подходом про «штаны» начинает проседать под натиском чужой рекламы, маркетинга и товаров, которые лучше удовлетворяют покупателей.
Поэтому руководителям, принимающим ключевые решения в компании, ни в коем случае нельзя упускать из виду момент перехода от пустого рынка к занятому. Для этого нужно отслеживать основные метрики: затраты на рекламу и маркетинг, размер среднего чека покупателя, количество посетителей стенда компании на областной выставке и т. д. Все эти большие данные должны поступать ответственным лицам буквально в режиме онлайн. То есть компании необходима система с кучей диаграмм и графиков, которые отражают актуальную информацию. Такие информационные панели делаются вручную программистами (в англоязычных компаниях такие панели называют Dashboard). Это большая работа по ежедневной обработке и визуализации данных. Но без нее любой собственник и топ-менеджер будет пребывать в уверенности, что дела на предприятии идут хорошо и компания должна продолжать двигаться в прежнем направлении, даже если на самом деле она находится на краю пропасти.
Далее центральной темой примерно до середины книги будет цифровизация отделений компаний и создание информационных панелей. И только в последней части этого издания мы вплотную приступим к обсуждению использования больших данных для машинного обучения. Причина такого порядка изложения материала в том, что при цифровизации и создании информационных панелей волей-неволей происходит сбор «больших данных», так как сохраняются все сведения по продажам, выработке часов сотрудниками, успехам менеджеров. Затем на этих больших данных проводится тренировка моделей машинного обучения для предсказания будущего. Но без фундамента в виде цифровизации ничего не получится, так как не будет самих данных.
Дойдя до середины этой книги, читатель сможет убедиться, что цифровизация является фундаментом для всего развития компании посредством больших данных и что этот фундамент сам по себе приносит отличную материальную выгоду даже без машинного обучения.
Почему не CRM?
Дочитав до этого места, опытные предприниматели и топ-менеджеры наверняка зададутся вопросом: «Почему надо создавать свою информационную систему и всякие панели? Чем вас не устраивает сервис имеющихся на рынке готовых программ по управлению взаимоотношениями с клиентами (сокращенно и по-английски) CRM?» И отчасти будут правы. Современные CRM обладают очень большим набором встроенных функций. И логично было бы арендовать к ним доступ и начать ими пользоваться, не нанимая программистов. Но здесь стоит обратить внимание на то, что чаще всего компании вообще не используют большинство встроенных в систему функций, ограничиваясь лишь базовыми: хранением информации о контактах, заказах и документах. Вдобавок можно оказаться обладателем импортной CRM, которая внезапно удалит[4] учетную запись компании по политическим причинам. Надо сказать, очень популярная проблема, с которой столкнулись отечественные компании в 2022 году.
Систему CRM с базовыми функциями контактов, заметок и задач может написать один программист буквально за пару месяцев работы. При этом она будет находиться на серверах компании, к ней всегда будет доступ, не надо будет платить за нее каждый месяц правообладателю под страхом удаления всех данных. И это далеко не самая большая проблема и причина создания своей CRM, разработанной своими программистами под конкретные нужды предприятия.
Самая большая проблема готовых CRM-сервисов в том, что предлагаемые ими ресурсы крайне ограничены. Например, невозможно найти такой, в котором объем хранилища исчислялся бы десятками терабайт. А между тем, такие хранилища могут содержать крайне полезную для компании информацию. К примеру, о географическом положении клиентов. Подобные большие данные критически важны для определения лучшего места для наружной рекламы, выгодного расположения для новой торговой точки. И еще много каких «нельзя» скрываются за фасадом покупной CRM.
Готовые CRM хоть и обладают значительным набором функций, но все эти возможности по тем или иным причинам оказываются невостребованными, когда появляются реальные задачи. Современным компаниям требуются серверы с хорошими объемами хранилищ, с тензорными или видеокартами, с высокопроизводительными процессорами. Ни один сервис не даст даже десятой доли этих ресурсов за вменяемую цену. Конечно, можно сделать свои вычислительные системы на стороне и заставить их связываться с CRM. Но зачем такие сложности, если за пару месяцев можно написать свою CRM с базовыми функциями?
Предположим, что вышеприведенные аргументы не возымели должного эффекта и компания решилась использовать покупную готовую CRM, а не делать свою систему. Для привнесения в общую картину информатизации предприятия дополнительных доводов в пользу создания собственных систем, рассмотрим проблемы, которые могут появиться в случае покупного программного обеспечения в зависимости от размера организации.
Малая организация
В небольшой компании, в которой еще нет ни одного программиста, использование CRM будет оправданно. Потому что информационная система не готова ни у одного отдела, а продажи уже надо запускать. В таком случае обычно заказывают самые дешевые тарифы известных CRM, которые сильно ограничены как по функциям, так и по количеству возможных учетных записей. То есть даже не все сотрудники могут пользоваться ими, приходится нескольким людям сидеть через одну учетную запись или определенным сотрудникам нести дополнительные обязанности за пополнение данных с различных рабочих мест.
Ежемесячная стоимость использования CRM не бьет по карману такой организации и позволяет провести хоть какую-то автоматизацию, усыпляя бдительность руководителя и топ-менеджера. Важно не пропустить момент, когда мини-CRM должна быть увеличена до разрастающихся нужд предприятия, и начать привлекать программистов, которые будут создавать дополнительно требующийся функционал. Иначе можно забыть о следующем шаге, о сборе больших данных, для чего, собственно, и проводится цифровизация.
Средняя организация
Большие проблемы появятся, как только компания начнет быстро расширяться. В этот момент типовое решение CRM перестанет удовлетворять запросам бизнеса, и его тоже потребуется наращивать. Например, закупить расширенные версии имеющейся системы CRM с дополнительными модулями, которые способны связываться с другими типовыми системами от известных производителей за дополнительную плату. Бухгалтер начнет слегка нервничать, видя новые цифры в ежемесячном счете на оплату. А многих руководителей начнет посещать мысль: «Может, пришла пора нанимать программистов и делать свое?»
Если организация успела дорасти до средних размеров (~50 человек), но так и не нашла хотя бы одного программиста, который мог бы начать создавать единую информационную систему, то дальше можно не мечтать о быстром росте компании. В такой фирме проблемы с CRM и другими сторонними системами будут накапливаться как снежный ком:
• Функций хоть и много, и они разные, но нет нужных для решения задач компании.
• Недостаточно уровней доступа, система авторизации не является гибкой.
• Недостаточная информативность (не хватает графиков, диаграмм, сводных таблиц и т. п.).
• Нет возможности анализа больших данных (терабайты) и машинного обучения на них.
• Нужно ежемесячно платить за каждую дополнительную функцию. А если откажешься, то производитель отключит программу и возникнет угроза потери имеющейся информации.
• Нет интеграции с сервисами других производителей. Поставщик ограничивает все функции только своей «экосистемой» продуктов, программы от стороннего поставщика подключить не получится.
• Нет возможности скопировать свои данные из системы, чтобы не потерять их. А весь доступ к системе предоставляется по модели «с подпиской». Купить раз и навсегда нельзя.
• Сервис CRM иностранный, и его в любой момент могут отключить по политическим соображениям, удалив все данные организации.
К сожалению, во многих растущих фирмах все перечисленные проблемы решаются закидыванием деньгами производителя CRM, выбранного компанией на начальной фазе развития. Такое решение перевалить проблему «на другого» рано или поздно приводит к остановке роста компании. А как только компания перестает расти, то она тут же начинает терять лучших инициативных сотрудников, которые не видят перспектив для развития и карьерного роста.
Крупная организация
Большой зрелой организации, которая уделяла достаточное внимание своей информационной системе, нет нужды использовать даже расширенные версии популярных CRM. Потому что у них уже есть подобная система в каждом отделе. Они ее уже выстрадали регулярной и планомерной работой многих специалистов компании по развитию собственной системы и убедились, что делать свое намного выгоднее и удобнее, чем купленное на стороне. При этом в организации уже трудится пара программистов, способных за считанные часы добавить новые функции, перестроить старые рабочие процессы или увеличить вместимость озера данных. Благодаря их деятельности все большие данные компании находятся в руках компании, что позволяет проводить серьезную аналитику и машинное обучение хоть каждый день.
Большие данные в компании
От темы CRM вернемся к большим данным. Ими же наполнена и самодельная CRM, сводку о состоянии которой видит руководитель компании на своей информационной панели каждый день. Давайте разберемся, как эти данные используются в разных отделах организации, как собираются и обрабатываются. Но сначала познакомимся с основными профессиями, которые связаны с большими данными.
В реальной жизни количество параметров, отслеживаемых/собираемых в рамках «больших данных», может достигать нескольких тысяч. Эти данные не ограничиваются стенами предприятия или даже границами города. К примеру, один из крупнейших банков нашей страны при выдаче ипотечного кредита использует сотни параметров. В том числе такую экзотику как «количество занятых одноместных номеров в трехзвездочных гостиницах в радиусе 500 метров от приобретаемой квартиры». Все значения этих параметров непрерывно отслеживаются и обновляются в автоматическом режиме. Для этого создаются специальные программы, которые, словно конвейер, неустанно доставляют информацию в озеро данных компании. При этом старые сведения не удаляются. К ним лишь добавляются новые. Из-за этого хранилища могут разрастаться до невероятных размеров (отсюда и название «большие данные»). Сбором, обработкой, сжатием и упорядочиванием данных занимаются инженеры данных (Data Engineer). Эти же специалисты конвертируют информацию в таблицы для дальнейшего ее анализа и построения графиков на ее основе.
После того как данные собраны и преобразованы в подходящий для анализа вид, в дело вступают аналитики данных (Data Analitycs). Они представляют информацию в виде наглядных графиков, в которых нуждается бизнес. Также аналитики ищут в данных полезные связи, новые способы их демонстрации, что позволило бы руководству лучше оценивать текущую ситуацию. Цель работы этих специалистов – найти пути получения прибыли из собранной информации. Аналитики думают только о деньгах. Они не умеют настраивать хранилища, управлять озером данных или круто программировать, поэтому инженеры по данным должны предоставлять им хорошо подготовленную информацию в удобной форме. Но именно аналитики знают, как из этих данных получить дополнительную маржу, как превратить данные в деньги.
Собранные большие данные позволяют буквально предсказывать будущее в результате учета значимых связей и зависимостей между отдельными компонентами данных, выявленных программными алгоритмами. Созданием инструментов для подобных прогнозов занимаются специалисты по машинному обучению (Machine Learning Engineer). Они могут заставить компьютер проанализировать тысячи собранных параметров с миллионами значений, чтобы предсказать практически любой экономический показатель. Имея достаточно данных и используя машинное обучение, профессионалы могут ответить на любые вопросы, касающиеся оптимизации продукта и максимизации прибыли.
Вспомните пример с ипотечным кредитом и странным параметром «количество занятых одноместных номеров в трехзвездочных гостиницах в радиусе 500 метров от приобретаемой квартиры». На наш обывательский взгляд, данный пункт вряд ли влияет на спрос жилья в районе. А собственник бизнеса или топ-менеджер никогда не попросит инженера по данным построить график зависимости прибыли от этого параметра на информационной панели в системе компании. Но с точки зрения машинного обучения данный фактор может внести существенный вклад в предсказания, потому что компьютер, в отличие от человека, способен уловить любую, даже еле заметную, связь в параметрах.
Все три профессии – аналитик, инженер по данным и специалист по машинному обучению – называют одним термином «специалисты по данным» (англ. ”Data Scientists”). Благодаря их слаженной работе руководство компании может в реальном времени наблюдать за всеми показателями, прогнозировать будущее и тестировать предложения по смене стратегии компании.
Как начать собирать большие данные
В каждой компании существует свой уникальный производственный процесс. Любая его стадия может быть описана определенными величинами в цифрах: количество выполненных операций, себестоимость использованных комплектующих, затраченное время и количество задействованных сотрудников и т. д. и т. п. Эти цифры необходимо собирать и хранить, чтобы в будущем найти между ними взаимосвязь. Обнаружив ее, можно будет разработать стратегию развития компании, выделить основные показатели и определить для них желаемые значения. Без количественной оценки конкретных параметров любое улучшение в компании будет казаться сотрудникам очередной бесполезной инициативой руководства. В такой ситуации топ-менеджер или собственник не сможет аргументированно доказать необходимость изменений.
Попробуем разобрать популярные методики сбора информации и организации деятельности в компаниях, которые уже работают полностью «в цифре». Допустим, ваше собственное предприятие разделено на несколько отделов по роду деятельности, в соответствии с современными канонами управления[5]:
• Административное отделение.
• Отделение создания и построения компании.
• Отделение распространения (маркетинг и рекламу рассмотрим отдельно).
• Финансовое отделение.
• Техническое отделение.
• Отделение квалификации и качества.
• Отделение по работе с клиентами и партнерами.
Конечно, в вашей компании деление может быть несколько иным, но в качестве примера рассмотрим именно такой вариант. Пройдемся по всем отделам, обсудим, как вообще можно провести их цифровизацию с нуля, чтобы начать собирать данные.
Сразу уточню, что, говоря о больших данных для бизнеса, почти всегда подразумевают их привязку к дате и времени. Например, если ведется статистика количества опубликованных рекламных материалов, то в собранной информации обязательно присутствует время. То есть сколько штук в какой день и час было опубликовано. Привязка ко времени критически важна для предсказания циклических процессов при машинном обучении. Поэтому почти все примеры собираемых данных, приведенные в этой книге, стоит дополнять пунктом «дата и время наступления события».
Административное отделение
Административное отделение определяет направление развития и общие цели компании. Работу по внедрению цифровизации и запуску сбора больших данных стоит начать с этого отделения, потому что зачастую именно управленцы (на разных уровнях) останавливают автоматизацию производства. Саботаж сотрудников происходит по нескольким причинам:
• Отсутствие базовых навыков в работе с персональным компьютером.
• Боязнь потерять свое рабочее место из-за автоматизации.
• Желание оставаться в зоне комфорта: действовать по ранее созданным шаблонам, а не изучать новые дисциплины.
• Боязнь потерять свою зарплату или проходящий через их руки денежный поток, часть которого они оставляют себе.
• Страх испортить отношения с сотрудником, которого приходится заставлять повышать квалификацию для автоматизации его работы.
Рассмотрим все причины по порядку, но начнем с конца – с повышения квалификации. Звучит странно, но многие люди все еще не умеют пользоваться электронной почтой и создавать текстовые документы. У них часто нет даже собственного электронного почтового ящика. Подобных сотрудников практически невозможно убедить в выгоде информатизации компании: он всегда писал на бумаге от руки и будет продолжать это делать. Таких специалистов нужно принудительно передавать в руки отдела повышения квалификации. А теперь представим, что подобного мнения придерживается не рядовой сотрудник, а топ-менеджер или собственник – никакой автоматизации вообще не будет.
Многие сотрудники компаний ежедневно совершают механические действия, чтобы создать видимость бурной деятельности. А по сути все их задачи можно автоматизировать таким образом, что план на день будет выполнен программой за несколько секунд. При этом даже если рядом с подобным сотрудником сядет исполнительный директор и покажет, как сделать всю работу на неделю за «один клик», работник не согласится действовать по примеру руководителя, аргументируя это классическим: «Мне так привычнее!». В такой ситуации только два пути:
• Вызвать «санитаров» из отдела повышения квалификации и поставить ультиматум: для продолжения работы в компании сотрудник обязан автоматизировать свою рутинную работу, в противном случае он будет уволен.
• Завалить работника таким количеством ежедневных рутинных задач, чтобы он валился с ног от усталости и просто физически не успевал все сделать. А потом напомнить ему про программу, которая может автоматически выполнить большую часть его обязанностей за какие-то несколько секунд.
Разумеется, есть и другие способы убеждения – все зависит от терпения руководителя, необходимости срочного исправления ситуации и степени желания осушить коллективное «болото». Но помните: автоматизация никогда не проходит безболезненно – это аксиома.
Коллектив всегда будет против того, что машины могут отнять у него рутину, которую сотрудники называют «работой». И если доля бунтарей, желающих оставить все по-старому, будет критической, то в компании вполне может вспыхнуть нечто аналогичное английскому «восстанию луддитов». Вряд ли люди будут крушить кувалдами офисные компьютеры и серверы, но саботаж парализует любое развитие, а значит, компания начнет постепенно умирать.
Все перечисленные фобии объединяет одна мысль, которая рано или поздно приходит на ум многим нанятым сотрудникам: «Буду сидеть смирно и получать зарплату за механические действия, не работая головой и не надрываясь от своих же инициатив». Каждый собственник и топ-менеджер самостоятельно решает, будет ли он переводить подобных ленивцев в состояние активного действия, заставлять людей повышать квалификацию и требовать от них изучения новых дисциплин или же оставит все как есть, ведь «уже и так работает». Но бывает и наоборот, когда идея цифровизации уже давно бродит внутри коллектива, но сотрудники боятся рассказать об этом начальству.
Однажды на форуме Reddit[6] один аноним пожаловался на то, что его мучают угрызения совести из-за того, что год назад, когда во время пандемии его перевели на удаленную работу, он автоматизировал весь свой рабочий процесс и теперь тратит 10 минут в день вместо 8 часов на тот же объем работы, что и прежде. Его задача – обрабатывать входящую электронную почту. Все остальное время он развлекается, смотрит сериалы, играет в видеоигры. При этом он получает одну из самых больших зарплат в стране, являясь сотрудником юридической фирмы. Конечно, благодаря автоматизации он работает крайне эффективно, обрабатывая каждый день тысячи входящих писем, ведь никто из коллег не смог бы сделать это быстрее. Но все-таки совесть терзает его за безделье.
Из этой истории стоит сделать вывод о том, что до сотрудников необходимо донести следующее: целью их работы является именно выполненное до конца дело, а не проступившие на лбу капли пота. Если неправильно сформулировать задачи и возможные методы их достижения, то вместо желания автоматизировать все возможные процессы, работяги начнут страдать, публикуя в социальных сетях истории о терзаниях своей совести.
Еще одним преимуществом тотальной цифровизации процессов в компании является то, что благодаря числовому выражению эффективности труда работников можно избавиться от «кумовства». По этому принципу работает компания Amazon, которая является крупнейшим мировым ретейлером. У этого гиганта процесс увольнения сотрудников настолько автоматизирован, что машина определяет кандидата самостоятельно, исходя из показателей его продуктивности[7]. Алгоритмы, основанные на машинном обучении, позволяют исключить человеческий фактор из принятия решения об увольнении. Неэффективный сотрудник будет сокращен, даже если его начальник – родственник, покрывающий все его действия.
Подобное отношение к своим работникам можно назвать жестоким. Но если их несколько сотен тысяч, то автоматизация любого процесса приводит к заметной материальной выгоде. Особенно если необходимо нанять сотрудников на сезонную работу и при этом сохранить высокое качество услуг. Достаточно лишь собрать все возможные показатели и определить наименее эффективных работников. Так и поступили в Amazon в отношении доставки товаров клиентам во время пандемии COVID-19. Компания не справлялась с потоком заказов, которые требовалось доставить до двери, поэтому начала активно нанимать новых сотрудников. Для этого было создано мобильное приложение, с помощью которого любой владелец автомобиля мог стать курьером. При этом приложение собирало данные о качестве их работы, его интересовало:
• Время, затраченное на доставку.
• Уложился ли курьер в обещанное временное окно доставки.
• Сфотографировал ли посылку у двери клиента.
• Смог ли замаскировать посылку у двери, как просил клиент, чтобы ее не украли.
• И еще много-много различной информации…
Приложение было скачано более 4 миллионов раз. Через него собирались большие данные по десяткам различных параметров, по которым ежедневно выносились вердикты при увольнении курьеров. Сокращенным просто блокировали доступ в приложение и не выдавали новые заказы на доставку.
С одной стороны, это жестокий способ увольнения сотрудников из компании. С другой, когда на предприятии работает 4 миллиона человек, то это наиболее эффективный метод работы всего административного аппарата. При этом даже не нужно задействовать сотрудников отдела кадров ни для найма, ни для увольнения. А все управление подразделением доставки состоит из нескольких программистов, специалистов по данным и менеджера.
Техническое отделение
Техническое отделение – это производственный цех на предприятии. Тут осуществляется вся работа.
Если компания предоставляет услуги или продукты, которые нельзя потрогать руками, к примеру, программное обеспечение, то весь рабочий процесс проходит в информационных системах, где без особых затрат можно создать систему учета выработок сотрудников. Но если предприятие выпускает материальные продукты, которые можно подержать в руках, то первое, чем должны озадачиться управленцы, это создание серийных номеров для выпускаемых единиц товара.
Маркировка каждой детали нужна на случай гарантийного обслуживания и для улучшения качества как отдельных деталей, так и составных продуктов. Деталям необходимо не только присваивать серийные номера, но и заносить дополнительные сведения в информационную базу предприятия, чтобы по каждому серийному номеру можно было восстановить любую информацию:
• Дату и время производства.
• Место производства, если цехов несколько.
• Серийный номер станка, на котором была изготовлена деталь.
• Серийный номер конечного изделия, в который вошла деталь.
• Сотрудника, изготовившего деталь.
• Температуру и влажность в цехе и на улице во время изготовления.
• Напряжение в электрической сети, давление воздуха в системе пневматического инструмента.
• Потребление сотрудником перловой каши столовой цеха в день производства…
Это выглядит как несколько безумный сбор информации обо всем, даже с посягательством на частную жизнь сотрудника. Но взгляните на это с точки зрения доходов компании. Допустим, клиент прислал бракованную деталь на замену. По ее номеру можно определить всю историю продукта и обстоятельства его изготовления. То есть, благодаря собранным в процессе производства данным, по одной гайке можно сказать, с какого автомобиля она была снята. Можно даже отказать клиенту в гарантийном ремонте, потому что гайка не от его купленного автомобиля.
С другой стороны, можно оптимизировать производство и сократить издержки, предсказав заранее, какие именно детали будут бракованными. Для этого необходимо использовать все собранные данные по бракованной детали (не ограничиваясь списком выше) для машинного обучения. В процессе тренировки модели нужно указать, что при такой комбинации значений параметров появляется бракованная деталь. А когда машина обучится, предприятие получит систему предсказаний брака, которая с точностью, близкой к 100 %, будет определять бракованное изделие и не допускать его до продажи. Но для этого надо собирать все возможные большие данные.
Посмотрите на последний пункт в списке (про перловую кашу). Даже в нем есть логика. Допустим, сотрудник пришел в цех после обеда, на котором полакомился перловой кашей. А у него непереносимость глютена[8], о которой он даже не подозревает. В итоге, из-за аллергена следующую половину дня его когнитивные способности будут снижены. Он станет медленным, невнимательным, забывчивым. Его мышцы будут слабее, чем обычно. Пострадает мелкая моторика рук. Это может привести к браку, к финансовым потерям компании. Определить же степень влияния рациона сотрудника на вероятность брака может только машина. И сделает это она настолько точно, что собственник и топ-менеджер моментально заменят перловку на пюрешку в столовой. Потому что компании невыгодно терять деньги и репутацию из-за брака как результата собственного гастрономического творчества.
Остается еще вопрос этики: как собрать все необходимые данные о производстве и сотрудниках так, чтобы они этого не замечали, чтобы им было безразлично, ведется ли учет каждого их движения или нет. Единственный способ осуществить это – сделать процесс полностью автоматическим, чтобы сотрудник не заносил данные в компьютер вручную и даже не писал цифры серийного номера на детали. Все это должна делать машина, и неважно, каким именно способом: выбивать цифры или выжигать лазером QR-код. Главное, чтобы все происходило автоматически.
Отделение квалификации и качества
Отделение квалификации и качества проверяет качество услуг и товаров, производимых компанией. Если оно низкое, то принимаются необходимые меры, к примеру, персонал отправляют на повышение квалификации. Указанное отделение непрерывно получает отзывы клиентов, собирает информацию об их впечатлениях от продукта или услуги. Затем на основе этих данных товары улучшаются, поступают на рынок и PDCA цикл Деминга (планирование-действие-проверка-корректировка) повторяется вновь.
В современных компаниях, которые давно провели цифровизацию, отзывы не собираются и не анализируются вручную, потому что это рутинная работа. Поручать ее человеку – это непростительно дорогое удовольствие. Тем более что программа может обрабатывать миллионы отзывов в сутки, тогда как рядовой сотрудник только десятки или сотни. А если отклики не приходят на определенный почтовый адрес или не принимаются через форму жалоб на сайте производителя, то собирать их приходится по всему интернету. Что еще больше говорит о необходимости в программном анализе информации.
Рассмотрим интересный случай, который произошел с крупной южнокорейской компанией Samsung. В нашей стране она в первую очередь знаменита своими сотовыми телефонами и бытовой техникой. Однако в действительности эта компания намного больше, чем мы себе представляем, и она производит очень широкий ассортимент товаров, среди которых есть даже крупнотоннажные грузовые корабли. При таком разнообразии продукции сбор отзывов и их систематизация представляют собой крайне трудоемкий процесс, которым в основном занимаются машины. То есть программа просматривает в интернете все страницы всех социальных сетей, чтобы определить, появились ли новые сообщения с упоминанием продуктов бренда. Несмотря на то, что мониторинг происходит автоматически, процесс этот все же довольно медленный, да и компьютер иногда пропускает нужные отзывы, если в них отсутствуют «правильные» контрольные слова.
Недавно Samsung зарегистрировала неблагозвучный для русского уха бренд Gnusmas[9], название которого представляет собой перевернутое Samsung. Возможно, производитель не знал, что в нашей стране это слово стало довольно популярным и используется в негативном ключе, в том числе в качестве нарицательного для отзывов о неудачных продуктах рассматриваемой нами компании. А теперь представьте, что произойдет, если Samsung официально попросит всех владельцев ее устройств использовать слово Gnusmas в качестве ругательства, чтобы выражать недовольство продуктами компании на просторах интернета. Очевидно, что с наличием контрольного слова поиск и обработка отзывов, оставленных во всемирной паутине, будут занимать намного меньше времени. Благодаря чему отдел качества сможет быстрее получать обратную связь от пользователей, и данные станут точнее. Наличие такого слова-метки в интернет-публикациях – бесценная находка для компании, позволяющая действительно улучшить выпускаемые ею продукты за счет анализа огромного количества реальных откликов.
К слову, обычно небольшие компании, у которых еще нет наработок в области искусственного интеллекта, используют сервисы «Google Alerts» или «Яндекс.Медиана» для обнаружения в интернете с помощью контрольных слов отзывов о своих товарах. Такие сервисы автоматически отправляют пользователю уведомление на почту, если в глобальной сети появляется заданное контрольное слово. То есть если у вашего товара достаточно уникальное название, можно настроить отслеживание прямо по нему и собирать обратную связь. Полученные отзывы необходимо классифицировать на положительные и отрицательные, определяя в каждом, какое преимущество или недостаток продукта озвучены как основные. В небольшой компании с этим может справиться один человек, но с ростом популярности продукта приходится создавать свой машинный интеллект для столь кропотливой и нудной работы. В любом случае без обработки и сбора больших данных по комментариям пользователей невозможно улучшить продукт и удовлетворить клиентов.
Отделение по работе с клиентами и партнерами
Именно в отделении по работе с клиентами и партнерами, в которое в том числе входит отдел по связям с общественностью, работают над тем, чтобы организация стала всемирно известной. И это действие напрямую влияет на стоимость привлечения новых клиентов.
Имидж создается различными способами: от публикаций в прессе до участия в общественных движениях, а иногда даже за счет обнародования некоторой закрытой информации с целью привлечения внимания партнеров и поиска клиентов-почитателей. Например, если компания собирает большие данные о своем продукте, то в публичный доступ может попасть часть уже обработанных сведений. Чтобы любители могли потренироваться в создании собственной системы для предсказаний, используя машинное обучение. Именно так и поступил «Сбербанк»[10], который выложил на соревновательную платформу Kaggle набор больших данных о недвижимости в России. Сейчас это один из самых популярных тренажеров, на котором учат будущих специалистов по данным на различных отечественных курсах по машинному обучению.
По опубликованному набору можно сразу понять, как профессионалы в банке относятся к большим данным. Достаточно взглянуть на количество параметров, рассматриваемых для каждой квартиры:
• Описание квартир – 14 параметров.
• Описание ближайшей недвижимости – 24 параметра.
• Макроэкономические факторы, касающиеся недвижимости, – 101 параметр.
• Дополнительное описание ближайшей недвижимости – 288 параметров.
Данные представлены в форме таблиц, где квартиры – это строчки, а их параметры – колонки. Подобный вид является обычным для больших данных. Именно такие таблицы затем передаются машине для обучения, цель которого – натренировать ее на предсказание цены квартиры в зависимости от значений параметров.
В опубликованном наборе данных часть параметров не зависит от времени: количество комнат, географическое положение дома, расстояние от квартиры до ближайшей атомной станции, музея и университета. Таких пунктов почти триста. То есть в таблицах будет три сотни колонок, описывающих каждую квартиру.
Стоит обратить внимание на то, что значения некоторых изменяющихся параметров могут записываться несколько раз в привязке ко времени. Например, уровень безработицы или рождаемости в стране в разные дни[11]:
В таких временных данных тоже содержится скрытая информация. Например, если пару лет назад резко снизилась безработица, а сейчас увеличилась рождаемость, то спрос на квартиры увеличится. Обычному человеку не под силу заметить такую тонкую взаимосвязь между всеми этими цифрами и предсказать их влияние на стоимость «однушки» на окраине столицы. А машина с легкостью определяет значимость и вклад каждого параметра в цену квартиры. После обучения она сможет предсказывать эту величину самостоятельно, принимая в расчет лишь значения параметров. Человек будет в буквальном смысле спрашивать машину: «Сколько, по твоему мнению, сейчас стоит квартира в 5 минутах ходьбы от атомной станции, в 10 минутах пешком от университета, если безработица сегодня составляет 5.6 %, а коэффициент рождаемости равен 2.3?» Натренированный алгоритм – результат машинного обучения – в ответ на такой вопрос выдаст конкретную стоимость квартиры.
Банк вряд ли многое потерял из-за публикации этой информации о недвижимости. Зато теперь во многих школах программирования по всему миру используют этот набор данных в качестве наглядной демонстрации для студентов возможностей машинного обучения.
С помощью больших данных можно привлечь интерес не только студентов, но и партнеров. Даже если компания не может напрямую делиться с ними собранной информацией, то всегда есть вариант создать предсказательный сервис, который будет использовать алгоритмы, обученные на этих данных. В таком случае партнерские системы отправляют запрос алгоритму и получают ответ в виде прогноза. Партнеры не видят всех таблиц данных, но, поверьте, они очень благодарны за доступ к подобному алгоритму (подробнее об этой схеме мы поговорим в разделе «Торговля большими данными»).
Таким образом, предоставив хотя бы ограниченный доступ к своим большим данным в каком угодно виде, можно улучшить имидж организации. Благодаря чему компания без финансовых вложений сможет снизить стоимость привлечения новых клиентов и удержания старых.
Отделение создания и построения компании
Отделение создания и построения компании выполняет функции найма и адаптации сотрудников. Оно анализирует организацию технологического процесса во всей компании с целью повысить эффективность каждого из отделов, комплектует подразделения сотрудниками, следя за тем, чтобы везде хватало рабочих рук. Именно отделение создания и построения компании часто отвечает за оборудование и связь между сотрудниками, а следовательно, и за формирование единой информационной системы предприятия (об этом в следующих главах).
В современных компаниях это отделение уже давно не использует бумажный документооборот, потому что найти хорошего сотрудника на сайте по поиску работы – это как найти иголку в стоге сена. Основная проблема в том, что на одного адекватного работника приходится сотня неподходящих. Точнее, статистика такова:
• 90 % кандидатов на работу вообще не отвечают на электронные письма.
• 5 % – не слышат, что им говорят на собеседовании, и не понимают, о чем их просят.
• 2 % – совсем неадекватные, агрессивные и т. п.
• 2 % – подходят на должность, компетентны, но их не устраивают условия.
• 1 % – подходят и согласны работать, отвечают требованиям, адекватны.
Из этой статистики видно, насколько несладко приходится специалистам по подбору кадров при создании и построении компании. Целых 90 % работы проделывается впустую. Поэтому в этой сфере уже давно применяются алгоритмы автоматического поиска сотрудников. Специальные программы анализируют тексты резюме кандидатов и выявляют среди них наиболее подходящие. После чего другая программа вступает в переписку с отобранными кандидатами. И если те отвечают хотя бы на несколько вопросов-предложений, то контакт передается оператору – реальному сотруднику отдела кадров.
Естественно, что для всего этого – написания и подготовки программы рассылки, получения и обработки резюме кандидатов – требуются программисты. Готовый продукт должен анализировать находящиеся в публичном доступе тексты резюме огромного количества соискателей на соответствие специальному шаблону. Конечно, точного совпадения ждать не стоит, но алгоритмы машинного обучения могут оценить, с какой вероятностью кандидат подходит на предлагаемую должность. Таким образом, на первой же стадии поиска происходит обработка больших данных.
После того как алгоритм определяет наиболее подходящих соискателей, их контакты сохраняются и им отправляется приветственное сообщение, к примеру: «Вы нам подходите… Скажите, вас это интересует?» В итоге после этапов поиска и первого вопроса будет отсеяно 90 % кандидатов. Потому что если в ответ на первый же вопрос соискатель молчит, то его можно смело удалять из контактов и продолжать поиски.
Из оставшихся кандидатов, откликнувшихся на приглашение побеседовать о возможном сотрудничестве, придется отсеять еще немалую часть претендентов. Здесь опять вступает в дело машина: существуют алгоритмы по распознаванию текста, вопросов и генерации ответов. То есть компьютер может задать соискателю несколько вопросов до того, как передать задачу – дальше вести этот диалог – оператору. Таким образом можно сократить количество оставшихся кандидатов вдвое. Программистам для разработки подобного алгоритма не надо даже создавать сложную нейронную сеть. Зачастую в первом же ответе на поставленные вопросы содержится контрольное слово или фраза, указывающие на отказ кандидата от сотрудничества: «к сожалению», «вынужден», «приношу» и т. п. Если подобные слова прозвучали, то лучше отбросить такую кандидатуру – этот человек сейчас не готов менять свое место работы.
В любом случае первичный поиск проводится автоматически со скоростью несколько тысяч резюме в день. Только представьте, сколько бы заплатила компания за эту работу, если бы для ее выполнения посадили «девочку на телефон», тратившую бы 90 % времени на «холодный обзвон» номеров, по которым не берут трубку, и на пустую переписку с соискателями, которые либо вовсе не отвечают, либо присылают отказ в первом же сообщении.
Итак, в случае с поиском новых сотрудников в роли больших данных выступает содержимое резюме кандидатов, анализируя которое машина сама определяет, насколько соискатель подходит на предлагаемую должность. Проводя первичный отсев кандидатов, мы значительно снижаем расходы фирмы на подбор персонала. А ведь найм сотрудников – это бесконечный непрерывный процесс, происходящий в каждой компании. Поэтому можно сделать однозначный вывод: цифровизация точно позволит этому отделению сэкономить значительные средства, повысить эффективность и скорость работы.
Контроль качества
Если в процедуре поиска сотрудников на первый взгляд сложно заметить влияние больших данных, то с контролем качества продукта или услуги все более-менее понятно. В этой области уже давно устоялись стандарты проверки, которые используют цифровые метрики. Например, если предприятие производит детали, то отдел контроля качества сравнивает их прочность с требуемой. И в случае, когда деталь ломается при меньшей нагрузке, чем планировалось, всю партию можно забраковать. Записи же об инциденте будут содержать всевозможную информацию: количество протестированных деталей, даты их выпуска, предельные нагрузки на них во время проверки и т. п., которая по результатам тестирования попадает в озеро данных компании. В дальнейшем эти сведения будут использовать для улучшения качества деталей, материала, производственного процесса. Таким образом, отдел контроля качества даже без приказа сверху самостоятельно собирает большие данные, на которых можно тренировать машину с целью получения рекомендаций относительно свойств деталей еще до того, как они будут физически созданы.
С другой стороны, существуют компании, в которых производственные процессы нельзя напрямую измерить цифрами. Например, невозможно сделать это применительно к бизнесу, который предоставляет услуги по прыжкам с парашютом, то есть обеспечивает получение клиентами свежих впечатлений.
Очевидно, что в момент свободного падения у неподготовленного человека происходит мощный выброс адреналина. А после приземления бессмысленно просить его оценить полет по десятибалльной шкале. Потому что в ответ вы рискуете услышать лишь междометия. Скорее всего, клиент даже не способен будет произнести ни одной цифры, просто потому что он их все забудет, или и вовсе не поймет, не услышит вопроса из-за перенесенного стресса.
Ситуация для бизнеса критическая. Но и тут можно многое придумать, используя большие данные. Давайте мысленно проведем эксперимент с подобной компанией. Поставим следующую цель: добиться того, чтобы впечатления от прыжка с парашютом были одинаковыми у всех категорий клиентов – и у новичков, и у опытных. Мы хотим, чтобы после полета количество эндорфина (гормона счастья) в крови каждого клиента было одинаковым при минимальных затратах со стороны компании. С учетом всего этого план по снижению издержек будет звучать так: впечатлительных клиентов выталкиваем за борт пораньше, на средних высотах, а спокойных только на большой высоте. В итоге у всех клиентов после прыжка будет одинаковый уровень эндорфина, а компания неплохо сэкономит на солярке и ремонте.
Для реализации этого плана соберем необходимые нам большие данные, проведя ряд экспериментов. Возьмем десяток спортсменов разного уровня подготовки. Сбросим их с парашютом в разные дни и с разной высоты. Затем сохраним все данные по каждому прыжку. Даже уровень эндорфина в крови, взятой из вены каждого участника. Так у нас появятся большие данные, в которых будет содержаться следующая информация:
• Способ заказа услуги, дата заказа, способ оплаты.
• Вес, рост, пол клиента.
• Дата и время взлета, прыжка, приземления.
• Высота и максимальная скорость при прыжке.
• Температура, давление, осадки, облачность, видимость на разных высотах.
• Скорость набора высоты при взлете.
• Ширина и долгота точки, в которой был совершен выход из самолета, и места, где состоялось приземление.
• Размер и тип парашюта.
• Показатели артериального давления, частоты пульса и сатурации (уровень кислорода) до, после и во время прыжка.
• Уровень эндорфина, адреналина и других гормонов (и всего, что можно измерить) в крови до и после прыжка.
•… и еще бесконечное множество параметров, которые только существуют, включая фазу луны, количество водоемов в 100 метрах от аэродрома, наличие повара в столовой летного училища.
Число собираемых параметров ограничивается лишь фантазией сотрудников компании, которые проводят эксперимент. Но важно, чтобы их было как можно больше. Потому что на собранных данных будет тренироваться модель машинного обучения, которая в дальнейшем сможет предсказывать уровень эндорфина в крови клиента.
Обратите внимание, что после окончания эксперимента и обучения машины прогнозированию, для собственно предсказания не требуется собирать абсолютно всю информацию о настоящих клиентах, то есть достаточно будет лишь измерить их рост, вес и пульс до прыжка (это можно сделать с помощью спортивного браслета с пульсометром), и машина попробует выдать прогноз по этому ограниченному набору данных. Конечно, чем больше параметров введено, тем выше точность предсказания, но и этого минимального пакета вполне достаточно для прогноза хотя бы примерного уровня эндорфина. И нет нужды брать у клиента кровь из вены.
Обычно предсказание по готовой, обученной модели происходит за доли секунды. Это означает, что система может работать буквально во время полета, снимая показания пульса клиента. И когда машина даст сигнал «дошел до кондиции», инструктору останется только настойчиво предложить клиенту насладиться процессом свободного падения прямо сейчас. А чем меньший вес перевозит самолет, тем меньше топлива он тратит, следовательно, компания снижает издержки. С такой моделью предсказаний «удовлетворенности» клиентов расходы на обслуживание воздушного судна снижаются довольно динамично.
Возможно, приведенный пример несколько экзотичен, но он точно иллюстрирует схему сбора и использования больших данных в коммерческих целях. Даже в сфере обслуживания можно получить достаточно числовых данных, чтобы иметь возможность влиять на степень удовлетворенности клиентов, предсказывать уровень испытываемого ими счастья и, как следствие, сокращать издержки.
Финансовое отделение
В современной компании финансовый отдел и так состоит из комплекса электронных систем. Мало кто пользуется бумажной бухгалтерией. У всех есть автоматизированные системы, в которых можно строить графики, диаграммы, делать сводные таблицы, смотреть развернутую статистику. К сожалению, во многих фирмах собственники и топ-менеджеры не работают с отчетами из данного отдела. Несмотря на то, что финансы – это кровь предприятия, а доход – это основная цель существования бизнеса, а бухгалтерские данные являются основным источником информации о будущем компании. Без них невозможно планировать закупки, прогнозировать рост и минимизировать потери от спада продаж.
Бухгалтерия
Финансовые показатели – одни из самых востребованных среди тех, на которые обращают внимание владельцы и топ-менеджеры успешных компаний. Поэтому стоит еще раз напомнить вам про систему, в которой эти показатели отображаются в реальном времени. «Информационная панель», «панель индикаторов» или «дешборд» (dashboard) – это веб-сайт, где можно посмотреть детальную статистику по каждому отделу компании, в том числе и по финансам. Чтобы было понятнее, о чем идет речь, стоит посетить сайт RealBigData.ru, сделанный специально для демонстрации различных идей, изложенных в этой книге. Внутренний раздел сайта является наглядным примером информационной панели компании. Там есть интерактивные графики, диаграммы, таблицы. Попробуйте поработать с ними и ощутить, насколько это мощный инструмент для управления компанией и ежедневного мониторинга работы каждого отделения.
Программисты организации создают информационные панели, настраивают их непрерывное обновление за счет сбора данных системами бухгалтерии. Если точнее, такие панели рождаются благодаря слаженной работе «инженеров по данным» и «аналитиков данных» и в результате запроса со стороны топ-менеджеров и собственников. Используя эти графики, руководство может мгновенно реагировать на изменения любых показателей бизнеса.
Первое, что можно увидеть на информационной панели, отражающей финансовое состояние компании, – это график прибыли за текущий год по месяцам. При этом обычно на таком графике также представлено сравнение текущего года с прошлым, чтобы можно было проследить динамику, и отмечена прогнозируемая часть графика прибыли, предсказанная алгоритмом, то есть возможные продажи до конца года, которые спрогнозировала машина, основываясь на ранее собранных больших данных.
Если углубляться в то, как именно делаются такие предсказания прибыли на будущие периоды, то кратко весь процесс можно описать так:
1. Специалисты по машинному обучению разбирают историю продаж компании на составные части, в том числе по годам, месяцам, неделям и дням.
2. В разбитых данных они находят различные периодические колебания: сезонные, дневные, недельные спады продаж, увеличение спроса в праздники и т. п.
3. На основе найденных периодических эффектов прогнозируются значения на будущее. Можно даже сделать предсказание на весь год или даже десять лет. При этом прогнозы непрерывно уточняются, используя ежедневно поступающие данные по продажам.
Стоит учитывать, что предсказания на короткие промежутки времени более точные, чем на большие. Но в любом случае благодаря прогнозам можно увидеть тенденцию, а значит, сделать вывод, верным ли путем идет компания или пора что-то быстро менять.
К сожалению, во многих компаниях, как это ни странно, именно собственники и топ-менеджеры являются самыми большими противниками использования информационных панелей для контроля финансовых результатов. Зачастую они считают, что такие системы нужны только серьезным и успешным компаниям. А для бизнеса с небольшими оборотами эти графики погоды не сделают. Обычно фирмы с подобными руководителями заканчивают быстро и плохо. Причина банкротства проста: контроль финансовых показателей организации должен начинаться практически с момента ее создания. Потом спешить построить графики будет уже поздно.
Оплата
Финансовое отделение компании отвечает за одну из самых главных функций – сбор денег с клиентов. От скорости и простоты совершения оплаты зависит и отзыв покупателя. Если заставлять его бегать по банкам с распечатанным счетом, он возненавидит фирму и обязательно поделится на просторах интернета тем, какой дискомфорт испытал. С другой стороны, если клиент легко обменяет свои деньги на товар, то негативных впечатлений от этой сделки получит гораздо меньше или не получит вовсе. Конечно, для достижения подобного результата недостаточно только цифровизации всей системы получения оплаты, необходимо провести обучение персонала, чтобы любой менеджер по работе с клиентами мог квалифицированно сопроводить процедуру купли-продажи.
В качестве отличного примера создания единой информационной системы для всей компании рассмотрим опыт отечественного холдинга Major. А точнее его подразделения, занимающегося легковыми автомобилями, Major Auto, клиентом которого является автор данной книги. Эта компания возникла еще в начале века, когда авторынок в России был не так сильно развит. В то время для совершения какой-либо операции по обслуживанию или покупке автомобиля необходимо было дождаться, пока сотрудник салона распечатает специально подготовленный договор, затем получить счет на оплату, далее пройти в кассу, оплатить счет и вернуться с оплаченным счетом обратно к сотруднику. Такой забег требовал от клиента много времени и сил.
Через два десятка лет весь этот процесс был упрощен до сканирования QR-кода с монитора сотрудника. То есть для оплаты услуги техобслуживания автомобиля клиент должен открыть приложение банка на своем мобильном телефоне, отсканировать QR-код с монитора сотрудника и нажать кнопку «оплатить». При этом не нужно даже вставать со стула, тем более что-либо печатать, бегать по кассам и возвращаться с чеками. Для собственника и топ-менеджера выгода от такого упрощения составляет десятки миллионов рублей в год, потому что раньше эти деньги тратились на бесполезную рабочую силу и дополнительные сервисы:
• На кассира.
• На кассовый аппарат, который надо регистрировать в налоговой и обслуживать (заправлять бумажными лентами и менять фискальный накопитель и т. п.).
• На оборудование специального бронированного помещения кассы: сейф, машина для подсчета денег, офисная техника, видеокамеры и серверы к ним.
• На инкассацию денег из каждой кассы каждого филиала компании до банка. По закону наличные деньги из кассы нужно перевозить в банк минимум один раз в неделю (в выходные касса должна быть пустой).
• На дополнительных бухгалтеров, которые проводят аудит и следят, чтобы кассиры ничего не украли.
Только представьте себе общие финансовые и организационные затраты на поддержание касс во всех отделениях компании. И необходимость во всем этом отпала, как только была создана единая информационная система. Теперь оплата за обслуживание автомобиля производится так же легко, как при совершении покупки в интернет-магазине, а информация обо всех финансовых операциях проходит через единую базу данных, позволяя вести статистику продаж с точностью до секунд.
Информация эта не разглашается, но с большой долей вероятности можно утверждать, что сейчас головной офис Major со множеством филиалов использует только один кассовый аппарат на всю компанию. И даже этот аппарат, скорее всего, является «онлайн-кассой». Подобные «онлайн-кассы» сейчас эксплуатирует большинство интернет-магазинов. Это кассы без принтера, которые подключены к интернету и физически размещены в сторонней компании. В них нет ни кнопок, ни мест для хранения денег, только разъем для подключения к интернету и блок шифрования (фискального накопителя). Эта касса не принадлежит компании, она сдается в аренду, что намного дешевле, чем иметь свой кассовый аппарат. Благодаря тому, что запросы на печать чеков отправляются на такую «онлайн-кассу» через интернет, все отделения компании могут пользоваться ею одновременно из любой точки мира, при этом она способна обработать хоть тысячу запросов в секунду.
Учитывая продвинутый подход к оплате, скорее всего, холдинг Major не только оптимизировал работу касс, но и начал собирать большие данные для более точного прогнозирования спроса на рынке. Ведь совершенно неразумно находиться у воды и не напиться. То есть при наличии централизованной системы оплаты, которая фиксирует всю информацию по сделкам сразу в цифровом виде, крайне заманчивым представляется использование машинного обучения для предсказания спроса, чтобы больше заработать на востребованном и сэкономить на ненужном. В таком случае можно лишь посочувствовать конкурентам, потому что «хлебных крошек» дополнительной прибыли им достанется совсем немного.
Склад
С каждым годом становится все более очевидным, что обычные торговые точки, где весь товар находится на витрине, практически изжили себя для большинства видов продукции. Сегодня все еще целесообразно пользоваться витринами только в небольших точках продажи продуктов питания для быстрого перекуса и в людных местах, например в центре города. Но все остальное наше общество вполне готово приобретать в интернет-магазинах, имеющих пункты выдачи товаров или услугу доставки до двери.
Еще каких-то двадцать с лишним лет назад, в начале века, люди в России даже не представляли, что товары можно заказывать через интернет с доставкой на дом. В то время создание интернет-магазина было необычным и даже убыточным решением. Потому что люди в массе своей чрезвычайно инертны. И это связано не только с приобретением новых товаров и использованием непривычных услуг, но и со способами оплаты. В то время наша налоговая сделала дерзкий шаг и предоставила людям возможность платить за квартиру через интернет не выходя из дома. Казалось бы, отличный способ сэкономить силы и время. Но большинство земляков по привычке еще лет десять продолжали штурмовать почтовые отделения, относя туда купюры, только что выданные им банкоматом за углом. В том числе и поэтому наша почтовая служба прославилась гигантскими очередями. Чтобы переломить эту всеобщую инертность, нужно было либо принять закон, запрещающий оплату наличными за квартиры через почтовые отделения, либо потратить миллиарды рублей на рекламу удобства совершения платежей через интернет. Государство сделало выбор в пользу первого варианта и ввело немало законов, стимулирующих электронные платежи, что заставило людей резко повысить свою цифровую грамотность.
Сегодня доля безналичных платежей в России составляет почти 80 %[12], и уже не нужно никому объяснять, что такое банковские карточки и как ими пользоваться. Но нежелание людей осваивать все новое продолжает сдерживать развитие бизнеса. То есть когда какая-то мысль еще не укоренилась в общественном сознании, то всегда будет не хватать потребителей для успешной стимуляции развития компаний в этой области. Другими словами, если начать сейчас производить космические корабли, которые могут добраться за пару часов до ближайшей звездной системы, их не будут покупать. Бизнес обанкротится, потому что люди еще не созрели, не осознали своей выгоды. Это как пытаться продать грузовик с двигателем внутреннего сгорания в Средние века. Никто его не купит, причем под самыми разными предлогами: он не ест сено, очень длинный и широкий, колеса чересчур круглые, слишком быстро передвигается, лобовое стекло может разбиться и т. п. Это происходит, потому что люди еще не свыклись с мыслью о необходимости иметь подобный продукт и не чувствуют потенциальной выгоды от его использования.
К счастью, в нашем обществе в течение последних нескольких лет ускоренными темпами зреет мысль о том, что покупать надо на сайте, а забирать товар в точке выдачи или заказывать доставку до двери. Поэтому резко набрали обороты компании, которые смогли организовать эффективный быстрый и автоматизированный складской учет. Например, у одного из крупнейших интернет-магазинов «ВсеИнструменты.ру» выручка увеличилась почти на 50 % за первые 9 месяцев 2021 года[13] и дальше по инерции еще практически на 54 % за 2022[14]. Скорее всего, такой взрывной рост был вызван пандемией, которая заставила россиян пользоваться интернет-магазинами. Но развитая сеть точек отгрузки товаров и возможность доставки до двери сделали этого ретейлера одним из лидеров рынка.
Сейчас точку выдачи товаров магазина «ВсеИнструменты.ру» можно найти даже в небольшом городке с населением менее 40 тысяч человек, в котором живет автор этой книги. И горожане в массе своей уже в совершенстве освоили процесс покупки через сайт. Поэтому создание развитой системы складирования и распределения стало крайне прибыльным делом для самой компании. Лидеры рынка сегодня не жалеют денег как на автоматизацию складов, так и на их постройку. Потому что толка от них заметно больше, чем от розничных точек продаж с витринами и демонстрационными залами.
С другой стороны, вместе с развитием систем складирования и распределения товаров, появляется потребность в ведении больших баз данных учета складских остатков. И тут же вырисовывается крайне заманчивая перспектива оптимизировать на основе этих больших данных распределение товаров по складам, чтобы удовлетворить весь имеющийся спрос и в то же время не перегружать склады. А если предприятие имеет дело со скоропортящимися продуктами, то выгоду от создания моделей машинного обучения для прогнозирования спроса трудно переоценить.
По оценкам экспертов[15], только в США компании, связанные с розничной продажей продуктов питания, способны сэкономить до 47 миллиардов долларов, оптимизировав поставки товаров на склады и в точки розничной продажи. Это возможно благодаря тому, что продукты не будут портиться на полках, если магазины будут предлагать покупателям ровно столько товара, сколько те способны приобрести.
Конечно, подобная оптимизация складов при помощи больших данных становится востребована по мере увеличения запасов. Небольшая компания с парой кладовок вряд ли хоть что-то выиграет от прогноза по распределению товаров между этими точками хранения. Но при увеличении размеров помещений и при большей удаленности их друг от друга, растет стоимость их содержания, включая затраты на топливо для грузовых машин. В этот момент сэкономленные с помощью оптимизации и предсказаний «хлебные крошки» становятся очень даже заметными.
В 1987 году компания Walmart занимала 9 % рынка розничных продаж[16]. Для нее основным «производством» являлся склад товаров. Чем быстрее и эффективнее он работает, тем более оперативно и оптимально происходит поиск и выдача хранящихся там товаров, тем больше прибыль компании. Руководство Walmart понимало это очень хорошо, поэтому много лет непрерывно вкладывалось в цифровизацию складов, и к 1990 году эффективность их работы была на 40 % выше, чем у конкурентов.
Walmart создала одну из первых систем складского управления. Для этого она закупала оборудование для печати штрихкодов, сканеры, сортировщики и разного рода конвейеры. Система создавалась буквально с нуля, ведь в «бородатых» 1980-х многие фирмы пользовались услугами хорошо развитых физически людей для работы на складах, а данные о хранящихся товарах записывались на бумаге, что, естественно, затягивало процесс поиска и получения товаров.
Успехи компании вдохновили конкурентов. Они поняли, что можно существенно увеличить чистую прибыль за счет цифровизации одного лишь склада. Но было уже поздно, ведь подобную систему надо создавать не один год. Поэтому идущая на всех парах Walmart по инерции смогла нарастить свою долю на рынке с 9 % до 27 % к 1995 году, увеличив при этом производительность труда на складах еще на 48 %. Далее рост компании замедлился, и к 1999 году она смогла дополнительно захватить лишь 1 % рынка. Но производительность поднялась еще на 20 %.
Таким образом, если посчитать сложный процент увеличения производительности труда на складах компании Walmart, можно прийти к выводу, что она увеличилась почти в два с половиной раза благодаря цифровизации. И, что немаловажно, теперь на складах могут работать все желающие, а не только физически развитые люди, за счет чего уменьшились затраты на зарплату сотрудникам, а сэкономленные деньги идут на развитие компании.
Отделение распространения
Отделение распространения отвечает за работу с потенциальными клиентами, анализирует возможный доход и планирует объемы продаж. Для продвижения товара оно проводит рекламные кампании в прессе и на различных интернет-ресурсах, организует презентационные мероприятия, работает с откликами клиентов.
У этого отделения, как и у бухгалтерии, уже давно есть собственные наработки в области автоматизации, то есть используемых программ. Сотрудникам данного подразделения необходимо каждый день связываться с клиентами, а значит, нужна централизованная база данных. В дополнение к ней специалисты отделения распространения уже давно освоили и вовсю используют информационные системы крупных рекламных и маркетинговых площадок: «Яндекс.Директ», MyTarget, все возможные социальные сети.