Криминалистический анализ данных при расследованиях банкротств
Анализ данных, или дата-аналитика, в последнее время играет большую роль в ведении бизнеса. Неудивительно, что при проведении расследований в сфере банкротства подобные методы используются все чаще. В общем случае работа аналитика заключается в ответе на поставленные перед ним вопросы. Криминалистический анализ данных не является исключением.
Расследования банкротств: задачи анализа данных
При расследовании обстоятельств потенциально преднамеренных банкротств чаще всего ставятся следующие задачи:
-
выявление путей вывода средств из организации;
-
анализ портфеля контрагентов с целью поиска признаков фирм-однодневок и аффилированных организаций;
-
обнаружение обстоятельств некоторых сделок;
-
определение круга ответственных лиц, авторизовавших ту или иную операцию;
-
сбор доказательств, подтверждающих неправомерные действия и/или злой умысел.
Для решения подобных задач анализируется вся доступная информация, которую условно подразделяется на две большие категории: структурированная (информация, содержащаяся в системах бухгалтерского, управленческого и прочего учета, которую можно представить в табличном, машиночитаемом виде) и неструктурированная (переписка сотрудников, документы в различных их представлениях, данные, содержащиеся на рабочих устройствах сотрудников или в общих рабочих папках организации).
При небольших расследованиях подобный анализ можно провести вручную, не используя дополнительные инструменты. Однако даже в таком случае это дело достаточно трудоемкое, особенно если учесть все возрастающий объем неструктурированных данных.
Отдельно стоит отметить, что информация, полученная в ходе подобного анализа, может быть представлена в виде электронных доказательств в суде – как при международных арбитражных разбирательствах, так и при разбирательствах в РФ.
Для решения обозначенных задач, а также для получения более быстрых результатов служат различные средства автоматизации, о которых мы и поговорим ниже.
Анализ структурированных данных
В контексте проведения независимых расследований обстоятельств потенциально преднамеренных банкротств под анализом структурированных данных чаще всего понимается анализ финансовой информации, полученной из различных учетных систем. В первую очередь – из систем финансового учета, которые позволяют определить наиболее значимых контрагентов и потенциальные пути вывода средств.
Для этого из систем бухгалтерского учета, банк-клиента и других систем выгружается релевантная информация, а затем проверяется полнота и точность полученных данных. После этого можно приступать непосредственно к анализу, который в большинстве случаев заключается в формировании выборок и группировке данных по заданным критериям. Однако анализ структурированной информации может включать в себя и более сложные виды – например, исследование риск-факторов, риск-оценка контрагентов или анализ геоинформационных сведений.
Самый распространенный вариант – анализ денежных потоков в организации и выявление контрагентов, получивших наибольшее количество выплат за определенный период. К этому можно добавить информацию о том, кто из сотрудников исследуемой компании занимался авторизацией таких выплат, когда эта авторизация была осуществлена и т.д. Для риск-оценки контрагентов можно использовать данные из открытых источников, в частности Федеральной налоговой службы. В зависимости от конкретного случая допустимо также использовать информацию профиля контрагента (сведения о руководителях и соучредителях, о ликвидации юридического лица, о дисквалифицированных лицах и лицах, которым запрещено занимать руководящие должности в судебном порядке), данные о финансовом состоянии компании-контрагента и пр.
Анализ структурированных данных является самым распространенным видом анализа информации и, следовательно, самым развитым. Для его проведения существуют как инструменты общего применения (начиная от Microsoft Excel и заканчивая продвинутыми системами анализа больших объемов данных), так и специализированные.
Практика показывает, что при расследовании потенциально преднамеренных банкротств, как правило, ограничиваются анализом структурированных данных. Причем самой простой его частью – анализом финансовой и бухгалтерской информации. Причин тому множество. Первая и главная заключается в том, что результаты требуется получить в максимально сжатые сроки и в рамках ограниченного бюджета. Кроме того, сотрудники исследуемой организации могут оказать серьезное противодействие, и далеко не вся информация будет доступной.
Анализ неструктурированных данных
Неструктурированной считается информация, не имеющая четко выраженной структуры, табличного представления и не предназначенная для непосредственной автоматизированной обработки и анализа. К этому типу относятся сообщения электронной почты или систем обмена мгновенными сообщениями (чаты), различные документы (в том числе в отсканированном виде или на бумажных носителях), аудио- и видеозаписи.
Неструктурированные данные могут служить источником ценных сведений, касающихся обстоятельств банкротства: порой условия сделок обсуждаются во внутрикорпоративной переписке, а отсканированные договоры с аффилированными контрагентами лежат в общей сетевой папке на корпоративном сервере.
Ручная обработка такой информация в рамках расследования возможна, однако обычно она выглядит как поиск иголки в стоге сена. А учитывая ограничения по срокам и бюджету, чаще всего ресурсов на нее не остается.
Тем не менее существуют средства, позволяющие ускорить (а следовательно, удешевить) процесс. В западной практике такие средства – eDiscovery/eReview – применяются довольно часто. Это набор мер и инструментов, предназначенных для анализа неструктурированных данных, которые получены из различных источников. Подобные инструменты используются не только при проведении внутренних и внешних расследований, но и при подготовке ответов на запросы регуляторов.
Системы eDiscovery позволяют загружать и совместно анализировать с их помощью большие объемы разрозненных неструктурированных данных. Они дают возможность осуществлять поиск по ключевым словам, содержащимся в документах и/или связанных с документами метаданных, фильтровать и группировать документы, производить их разметку (тегирование), составлять отчеты.
Например, в ходе расследования потенциально преднамеренного банкротства необходимо выяснить обстоятельства совершения определенных сделок с некоторыми контрагентами. Для этого данные из всех источников, содержащих релевантную информацию, загружаются в платформу eDiscovery.
В ходе первичной обработки выполняется извлечение, индексация и дедупликация осмысленного текста. На следующих этапах применяется набор ключевых слов для поиска во всем массиве информации. В случае установления обстоятельств сделок это будут названия и/или реквизиты контрагентов, имена подписантов и прочие ключевые слова, которые могут помочь идентифицировать нужные документы. Затем найденные системой файлы, содержащие ключевые слова, передаются аналитикам, которые определяют, действительно ли они относятся к интересующим сделкам. Аналогичный анализ осуществляется и внутри eDiscovery.
Современные системы eDiscovery позволяют дополнительно ускорить процесс с помощью алгоритмов машинного обучения. Для этого используются подходы человеко-машинного анализа (Technology Assisted Review, TAR). Алгоритмы машинного обучения призваны облегчить и ускорить работу аналитиков, просматривающих документы, обучаясь на тех файлах, которые уже признаны релевантными.
Рис. 1. Доля найденных релевантных документов в зависимости от затраченного времени при классическом подходе
Кроме того, в ходе проведения независимых расследований очень полезной бывает функциональность расширенной аналитики. Например, алгоритмы извлечения именованных сущностей могут быть использованы для определения всех лиц, организаций, сумм и т.д., упоминающихся в анализируемых документах.
|
|
Рис. 2. Доля найденных релевантных документов в зависимости от времени при использовании TAR
Дополнительное преимущество систем eDiscovery – возможность автоматизации процесса раскрытия информации. Например, с помощью функции автоматического редактирования можно скрыть персональные данные или сведения, составляющие коммерческую тайну и не предназначенные для раскрытия в рамках судебного разбирательства, оставив только релевантную информацию, относящуюся непосредственно к делу. Подобный подход позволяет значительно ускорить процесс предоставления материалов в рамках международных судебных разбирательств.
Отдельно стоит упомянуть задачи компьютерной криминалистики, которые тоже относятся к анализу неструктурированной информации. В ходе проведения независимых финансовых расследований могут возникнуть совершенно разные вопросы – например, кто из сотрудников исследуемой организации ответственен за авторизацию определенной транзакции или как осуществлялся платеж определенному контрагенту. В современном мире, где рабочая коммуникация ведется в основном с помощью электронных устройств, с очень большой долей вероятности корпоративные устройства содержат всю информацию, необходимую для получения ответов на поставленные вопросы.
Совмещенный анализ данных
В ряде случаев возникает необходимость в совместном анализе как структурированных, так и неструктурированных данных. В частности, когда необходимо сверить условия, указанные в договорах или иных документах, с информацией о платежах, полученной из систем бухгалтерского учета.
Подобный анализ также может быть выполнен в ручном режиме. Однако процесс можно ускорить, используя одновременно системы eDiscovery с применением средств расширенной аналитики и системы для анализа структурированных данных.
В системе eDiscovery производится извлечение так называемых именованных сущностей – например, наименования контрагентов и сумм, содержащихся в документах. Затем эта информация выгружается в виде табличного отчета и сверяется с данными из учетных систем.
Аналогичный подход используется и для анализа рисков, связанных с договорными обязательствами. После загрузки документов в платформу для анализа выполняется поиск файлов, содержащих (или не содержащих) определенные договорные пункты, извлечение наименований и реквизитов контрагентов, а также сумм, указанных в документах. Итоговая статистика служит для количественной оценки потенциальных рисков или убытков и дополняется риск-анализом контрагентов на основе открытых данных и финансовой историей взаимодействия с контрагентом.
В общем случае совмещенный анализ структурированной и неструктурированной информации может применяться для решения совершенно разных задач – не только в целях проведения независимых финансовых расследований, но и для анализа финансового состояния компании или управления рисками.
Визуализация и представление результатов
В независимых финансовых расследованиях зачастую очень важно правильное представление полученных результатов. Факты, которые сложно вычленить из объемных табличных данных, становятся очевидными, если продемонстрировать их в виде графиков.
Это же относится и к неструктурированным данным. Такие данные можно визуализировать, например, в виде графа связей, основанного на информации о переписке между субъектами, или временной шкалы, показывающей последовательность событий.
Правильно подобранное представление данных значительно упрощает их восприятие, что, в свою очередь, позволяет более четко обосновать свою позицию при предъявлении этой информации в суде в качестве доказательства.
Вместо заключения
В нашей практике мы постоянно решаем задачи, связанные с анализом информации для рассмотрения корпоративных споров и проведения расследований. Объем данных – будь то структурированная финансовая информация или разрозненные сведения, полученные из различных источников, – постоянно растет, и их эффективный анализ становится невозможным без использования специализированных инструментов и автоматизированных систем. Автоматизация анализа данных просто необходима для обеспечения принципа пропорциональности.
Современные средства автоматизации активно применяются в бизнесе, ускоряя процесс принятия решений и делая его более прозрачным. Все большее число компаний задействуют в своей работе облачные решения, системы поддержки принятия решений на основе искусственного интеллекта и системы автоматизации.
Зачастую использование подобных средств сильно упрощает и удешевляет процесс расследования. Например, если в исследуемой организации применяются облачные решения для обмена электронной почтой, с очень большой долей вероятности в облачном почтовом сервере уже реализована функциональность eDiscovery.
Аналогично и в случае с другими системами. Так, если в компании установлена система для автоматизированной риск-оценки контрагентов, в ходе расследования данные из нее могут быть извлечены.
В целом задача любого бизнеса заключается в увеличении прибыли и сокращении затрат. Прозрачные, грамотно выстроенные процессы с использованием средств автоматизации позволяют работать гораздо эффективнее. И если в организации такие процессы и средства отсутствуют, невольно возникает вопрос: может быть, руководству есть что скрывать?
старший менеджер практики eDiscovery, CSI Group