13 ноября 2023 12:29:04
Министр цифрового развития Максут Шадаев заявил о планах по созданию государственной фабрики больших данных. Собранные в Data Lake данные будут формироваться в Data Set и предоставляться разработчикам технологий для тренировки нейросетей. По словам Шадаева, будут использоваться как данные, которые уже есть у государства, так и те, которые государство будет получать от бизнеса по действующему законодательству. Это должно способствовать созданию конкурентоспособных сервисов, полезных с практической точки зрения. Чем может оказаться полезен этот проект и какими рисками будет сопровождаться его реализация, разбирались «Московские ведомости»
«Большие данные — это огромные объемы информации, которые обрабатываются и анализируются компьютерными системами для получения ценных знаний. Они бывают как структурированными, так и неструктурированными и могут включать в себя различные форматы, например, текст, числа, изображения, видео и т. д. Большие данные часто возникают из различных источников — соцсетей, мобильных устройств, интернета вещей. Их обработка включает в себя анализ этих данных, обнаружение тенденций и выявление паттернов. Это позволяет делать более осознанные и информированные решения в различных областях, таких как бизнес, наука, медицина, экономика и финансы», — рассказал в беседе с «Московскими ведомостями» ИТ-эксперт Александр Юдин.
В экономике, по словам Юдина, большие данные позволяют анализировать показатели из разных источников, выявлять тенденции, проводить прогнозы, определять потребности рынка, повышать эффективность процессов и обнаруживать новые возможности даже в условиях неопределенности.
«Благодаря большим данным экономика может получить более точные и надежные результаты. Для обычного человека внедрение в жизнь больших данных может означать повышение качества и безопасности своего существования. Качественный анализ данных с камер видеонаблюдения, например, позволяет выявить алгоритмы действий нарушителей, отследить логику преступлений и предотвратить новые правонарушения. То же касается и мошеннических схем, связанных с похищением денег с банковских карт. Еще одна возможность Big Data, которая уже реализована за границей — это оптимизация городской инфраструктуры — транспорта, энергоснабжения, водоснабжения. Анализ личных доходов, расходов и инвестиций на основе больших данных может помочь оптимизировать бюджет и прогнозировать будущие финансовые показатели», — рассказал эксперт.
Между тем, Big Data несут и определенные риски, отметил Александр Юдин.
«Сбор и хранение гигантских объемов данных повышают риск утечки конфиденциальной информации. Компании, работающие с большими данными, должны принимать меры для защиты данных и предотвращения несанкционированного доступа. Ещё одна проблема — качество и достоверность этих данных. Ошибка может исказить весь отчёт, на основе которого принимается решение. И, наконец, работа с большими данными требует специализированных навыков анализа, обработки и интерпретации данных. Недостаток квалифицированных специалистов может затруднять успешную реализацию проектов, связанных с большими данными», — подытожил ИТ-специалист.
Впрочем, в России уже имеются примеры успешного использования больших данных и основанного на них искусственного интеллекта на уровне целых регионов. Так, в Москве большие данные не первый год используются для оптимальной организации дорожного движения. Данные с дорог мегаполиса собираются посредством датчиков ГЛОНАСС, установленных на городском общественном транспорте, и сети камер фотовидеофиксации. Как рассказывал директор ГУП «МосгортрансНИИпроект» Александр Поляков, выводы, которые искусственный интеллект делает на основе этих данных, позволяют принимать как оперативные, так и долгосрочные управленческие решения по поводу развития дорожно-транспортной системы. Речь идёт о выявлении очагов аварийности и скопления транспорта с последующим принятием мер по корректировке работы светофоров, изменению схем движения и реконструкции дорожной сети. В том числе благодаря Big Data количество пробок на столичных дорогах стабильно снижается.
В Московской области в свою очередь сбором и анализом данных в самых разных сферах занимается сеть умных камер, интегрированных в систему «Безопасный регион». Изначально система создавалась для фиксации правонарушений и помощи в их расследовании. Однако постепенно возможности камер и область их применения расширились. Устройства видеонаблюдения выявляют нелегальные торговые точки и позволяют определить места, где торговля востребована среди граждан, помогают оптимизировать работу общественного транспорта, фиксируют нарушения в благоустройстве и уборке территорий и выполняют немало других функций. В Главном управлении региональной безопасности Московской области рассказывали и о других сферах, в которых система оказалась полезной.
Однако увеличение объёмов собираемых данных, как уже отмечалось выше, ведёт к дополнительным рискам утечки чувствительной информации и её попадания к третьим лицам, в том числе злоумышленникам. Управляющий компанией RTM Group Евгений Царёв рассказывал, что количество утечек персональных данных растёт с начала 2023 года, и этот рост в итоге может составить 50-150%. Такая негативная тенденция связана с тем, что многие компании не соблюдают стандартные принципы управления безопасностью. Свою роль играют устаревание имеющегося ИТ-оборудования, обновление которого ограничено из-за санкций, и необходимость переходить на отечественное ПО. По словам Царёва, на решение многих проблем может потребоваться не один год. Вкупе с наблюдающимся дефицитом специалистов по информационной безопасности эти проблемы сдерживают внедрение Big Data в России. Хотя в необходимости подобных технологий сомнений нет, невозможность быстро устранить перечисленные риски заставляет с большей осторожностью подходить к их практическому применению.