Контакты
Подписка
МЕНЮ
Контакты
Подписка

Эпоха Данных 2025

В рубрику "All-over-IP" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Эпоха Данных 2025

Мы стремительно врываемся в Эпоху Данных. От автономных автомобилей до человекоподобных роботов, от интеллектуальных персональных программных помощников до умных бытовых приборов – мир вокруг нас кардинально меняется, меняются привычные жизнь, образование, работа и отдых.
За 30 лет данные проникли во всех сферы, приближая новую цифровую реальность. Эта цифровая реальность, которую формирует совокупность всех данных, ежегодно создаваемых, получаемых и тиражируемых в мире, бурно разрастается. Мы называем ее глобальной инфосферой1. Всего лишь за 10 лет общество совершило переход от аналоговых технологий на "цифру". В следующее десятилетие потенциал данных сулит людям, государству и бизнесу фактически безграничные возможности.
Компания IDC подготовила исследовательский отчет, в котором подробно рассказала о трендах, которые будут влиять на жизнь и бизнес и определять рост глобальной инфосферы в период с 2017 по 2025 г.
Дэвид
Рейнзел
Директор по исследованиям рынка устройств хранения данных компании IDC
Джон
Ганц
Директор по научным исследованиям компании IDC
Джон
Риднинг
Вице-президент по исследованиям рынка жестких дисков компании IDC

По прогнозу IDC, к 2025 г. глобальная инфосфера достигнет 163 Збайт, или триллиона гигабайт. Это в 10 раз больше общего объема данных за 2016 г. (16,1 Збайт). Масштабные тенденции, связанные с наступающей эпохой больших данных, затрагивают практически все существующие компании.

1. Превращение данных из "фона" бизнес-деятельности в жизненно важный актив

К 2025 г. почти 20% всей информации в глобальной инфосфере получит критически важную роль в повседневной жизни, а примерно 10% этих данных будут "сверхкритичными".

2. Встроенные системы и Интернет вещей

Автономные устройства уступают место подключенным цифровым дивайсам, которые генерят огромные объемы данных. Те в свою очередь позволят улучшать работу систем и процессов так, как ранее было просто невообразимо. К 2025 г. среднестатистический житель Земли будет взаимодействовать с подключенными в сеть устройствами примерно 4800 раз в день: по одной процедуре взаимодействия каждые 18 секунд.

3. Мобильные данные и информация, получаемая в реальном времени

К 2025 г. более четверти всех данных будут представлять собой информацию, получаемую в реальном времени, причем свыше 95% составят данные, поступающие от устройств Интернета вещей.

4. Искусственный интеллект изменит экономический ландшафт

Потоки данных создают условия для развития целого пласта новых технологий, таких как машинное обучение, обработка естественного языка и искусственный интеллект (работают в составе когнитивных систем), что поможет превратить аналитику данных из ретроспективной практики в инструмент оперативных решений. По прогнозу IDC, доля глобальной инфосферы, подвергаемой анализу, к 2025 г. вырастет по сравнению с нынешней в 50 раз, достигнув 5,2 Збайт. Объем данных, анализируемых с применением когнитивных систем, вырастет в 100 раз и достигнет 1,4 Збайт в 2025 г.

5. Безопасность – критический важный принцип

Развитие больших данных сопряжено с новыми уязвимостями и рисками защиты информации. Существует пропасть между объемом генерируемых данных, которые нуждаются в защите, и данными, которые фактически защищены. И эта пропасть расширяется. К 2025 г. почти 90% данных глобальной инфосферы потребуют определенного уровня защиты, но эти требования будут удовлетворены менее чем для половины.

С ростом объема и разнообразия данных организациям следует сосредотачиваться на той информации, которая имеет наибольшее значение. Не все данные одинаково важны для бизнеса или потребителей. Преуспеют те организации, которые воспользуются данными, имеющими первостепенную важность, чтобы улучшить опыт своих клиентов при работе с тем или иным продуктом или сервисом, решать сложные задачи и экономить на масштабе.

Жизненно важный актив

Современное общество создает, использует и хранит такие объемы данных, которые по более ранним стандартам назвали бы огромными, а скорее невообразимыми. Тем не менее в ближайшие годы глобальная инфосфера продолжит расти и затмит показатели, которыми мы оперируем сегодня. Таков результат эволюции вычислительных систем, в которой выделяют три эпохи (рис. 1).


Роль данных эволюционирует. На это указывает объем информации, создаваемой и используемой с помощью различных вычислительных платформ:

  • коммерческие и облачные дата-центры;
  • корпоративные серверы, небольшие местные дата-центры;
  • оконечные устройства – ПК, телефоны, видеокамеры, подключенные автомобили, носимая электроника, датчики.

Объем данных, создаваемых оконечными устройствами, начал уменьшаться в 2012 г. Ожидается, что этот тренд сохранится (рис. 2). Последнее десятилетие из числа оконечных устройств наибольший вклад в глобальную инфосферу вносили персональные компьютеры, смартфоны и другие бытовые устройства. В дальнейшем главная роль в создании данных в сегменте оконечных устройств перейдет к встроенным системам, включая охранные видеокамеры, умные счетчики, торговые автоматы и пр. Между тем крупнейшими производителями данных являются коммерческие предприятия и, соответственно, дата-центры и корпоративные серверные системы.


Значительные изменения претерпевает и ландшафт области хранения данных (рис. 3). В период с 1980 до начала 2000-х гг. персональные компьютеры и развлекательная сфера доминировали на арене создания и потребления информации. Однако с развитием транспортных сетей все чаще пропадает необходимость хранить данные локально – на ПК или мобильных устройствах. В 2010 г. около 50% всего архива данных представлял собой развлекательный контент на DVD- и Blu-ray-дисках. С изменением приоритетов зрителей в пользу потоковых сервисов видео доля корпоративных систем хранения повышается, а доля устройств хранения развлекательного контента падает. Роль облачных хранилищ данных в корпоративном сегменте возрастает.


Смещение спроса в сторону облачных систем хранения и технологий мобильного доступа к данным стало результатом возросшей значимости (или критичности) данных в быту и бизнесе.


Все чаще данные разделяют на группы по уровню их критичности, о чем свидетельствуют такие факторы, как необходимость в обработке данных в реальном времени (с малой задержкой), серьезность последствий в случае недоступности данных. К 2025 г. около 20% данных в глобальной инфосфере могут стать критичными для жизни, а 10% будут сверхкритичными (см. табл.).

Встроенные системы и Интернет вещей

Встраиваемые компьютеры, на базе которых производится все больше оконечных устройств, являются источником огромного массива данных. На современного человека приходится в среднем одно умное устройство, данные от которого поступают в дата-центр. Через десять лет количество таких умных устройств на человека превысит четыре.

Несмотря на то что данные от встроенных систем представляют собой значительную ценность в отличие от данных, создаваемых при использовании электроники для развлечения, количество таких файлов будет достигать нескольких квинтильонов в год. Для сравнения: чтобы один квинтильон галлонов воды прошел через Ниагарский водопад, потребуется 210 тыс. лет.


Аналитики IDC группируют данные, формирующие глобальную инфосферу, по четырем основным категориям (рис. 4).

  1. Развлекательные. Изображения и видео, созданные или приобретаемые в целях развлечения.
  2. Изображения/видео неразвлекательного характера. Записи видеонаблюдения или рекламный контент.
  3. Данные для анализа производительности. Системные файлы на ПК и серверах, лог-файлы и метаданные.
  4. Данные от встроенных систем, M2M, Интернета вещей. Соотношение объемов создаваемых типов данных варьировалось во времени (рис. 5). Отмечается резкое снижение объема развлекательных данных и всплеск объема данных о производительности систем и особенно данных от встроенных систем.


К 2025 г. доля данных от встроенных систем будет составлять около 20% в объеме всех создаваемых данных, или три четверти от объема данных о производительности систем. Данные о производительности поступают от таких традиционных вычислительных платформ, как ПК, серверы, телефоны, планшетные компьютеры. К встроенным системам, генерящим данные, относятся:

  • камеры видеонаблюдения;
  • умные счетчики;
  • карты с чипом;
  • RFID-считыватели;
  • пульты заправки топливом;
  • системы автоматизации зданий;
  • умная сетевая инфраструктура;
  • машинное оборудование;
  • автомобили, лодки, самолеты, поезда;
  • торговые автоматы;
  • цифровые рекламные панели;
  • игровые автоматы, казино;
  • носимая электроника;
  • медицинские имплантанты;
  • игрушки.

Устройства Интернета вещей создают огромный объем информации, большинство из которой не представляет ценности для длительного хранения. Взять хотя бы камеры видеонаблюдения. Они производят очень насыщенный видеоконтент. Основная его часть – изображение с ничем не примечательным содержанием, которое нет смысла хранить, и одиночными инцидентами, которые должны быть доступны в будущем. Среди данных, получаемых от дорожных камер, для управления городского транспорта интерес представляют собой только видеосвидетельства нарушений или нештатные ситуации. Видео потока автомобилей, движущихся в рамках правил, хранить не нужно.

Данные продолжат создаваться в таких масштабах, что хранить весь их объем без разбора не будет представляться возможным. Например, чтобы обеспечить хранение всей инфосферы объемом 163 Збайт, которого она достигнет к 2025 г., потребуется примерно 16 млрд современных промышленных 12-терабайтных HDD. Для сравнения: за последние 20 лет было произведено 8 млрд HDD общей емкостью около 4 Збайт. Чтобы удовлетворить прогнозируемый спрос, в течение последующих четырех лет (2017–2020 гг.) продажи накопителей всех типов (жесткие диски HDD, флеш-память, ленточные накопители, оптические диски, память типа DRAM) в емкостном выражении должны превзойти продажи последних 10 лет (5,5 Збайт). А именно в период с 2017 до 2025 г. должно быть продано накопителей емкостью свыше 19 Збайт. Около 58% емкости придется на HDD и 30% – на флеш-память.

Мобильные данные и данные реального времени

Число людей, использующих устройства, подключенные к Интернету, выросло в пять раз в период с 2005 по 2015 г. За это время мобильный Интернет обогнал стационарный, в особенности в регионах со слабо развитой кабельной инфраструктурой или с ее отсутствием. К 2025 г. численность людей, владеющих подключенными устройствами, составит 75% от мирового населения, включая маленьких детей, пожилых, жителей развивающихся стран.


Мобильные данные (рис. 6) и данные реального времени (рис. 7) будут только нарастать.


Причем скорость прироста данных реального времени будет превышать темпы роста объема всех данных в 1,5 раза. Ключевую роль в этом сыграют устройства Интернета вещей (рис. 8).

Рост объема данных реального времени изменит потребности в типах памяти в будущем (рис. 9). Необходимость доступа к данным в реальном времени сделает сверхнизкую задержку и время отклика важнейшим параметром при выбора системы хранения корпоративного класса, а также оконечных устройств.


Доля информации в общем объеме глобальной инфосферы, которая обрабатывается, хранится и предоставляется людям публичными облачными дата-центрами, практически удвоится в период с 2016 по 2025 г. и составит 26%.


Облачные вычислительные мощности и хранилища будут обслуживать не только данные, создаваемые ИТ-системами, но и развлекательный контент, энергетическую телеметрию и телекоммуникации. Дата-центры корпоративного класса используют разные типы накопителей, включая HDD и NAND флеш-память, чтобы управлять потоками данных экономически эффективно (рис. 10).

Искусственный интеллект изменит экономический ландшафт

Взрывной рост и высокая доступность данных увеличивают ценность применения когнитивных систем, или систем искусственного интеллекта.

К 2025 г. две трети международных финансовых организаций будут использовать сторонние системы искусственного интеллекта, чтобы улучшить клиентский опыт за счет более адресного предложения финансовых продуктов и сервисов, а также для защиты от мошенничества. Сферы применения когнитивных систем распространяются на деловую среду и быт.

  • Беспилотные автомобили, которые уже можно увидеть на дорогах в некоторых странах, задействуют для движения телеметрию реального времени и технологии машинного обучения. Совершенствование этих когнитивных систем сократит время, необходимое на "обучение" беспилотных автомобилей самостоятельной езде.
  • Страховые компании, например AIG и Fukoku Mutual, заменяют часть своего штата сотрудников системами искусственного интеллекта, которые занимаются просмотром документов из госпиталей и больниц и распределяют страховые выплаты.
  • Чтобы развлечь своих клиентов, компания Disney Cruise Line использует технологию распознавания лиц для создания "магических картин". Проходящие пассажиры наблюдают анимированные сцены; для одних и тех же людей сценарии не повторяются.
  • Большинство платежных систем типа MasterCard применяют искусственный интеллект для обнаружения мошенничества. Технологии позволяют им засекать мошеннические транзакции со скоростью 40–60 миллисекунд.

Тегирование данных, особенно автоматическое, является важнейшим аспектом использования когнитивных систем. Процесс тегирования позволяет снабжать массивы данных идентификаторами для категоризации, описания, поиска данных и, в конечном итоге, сбора ценной информации. Технологии тегирования данных находятся на раннем этапе развития; требуются стандартизация, инвестиции в разработки, наращивание экспертизы.

Безопасность – критический важный принцип

До сих пор основными производителями данных в мире были потребители. К 2025 г. ситуация изменится: 60% информации будут генерировать коммерческие предприятия, доля которых в производстве данных составляла менее 30% в 2015 г. (Интересно, что до 1980 г. коммерческие организации создавали и управляли всем объемом данных.) Однако неважно, кем создаются данные, предприятиям придется управлять 97% глобальной инфосферы. Взять пользовательский контент для социальных сетей. Несмотря на то что именно люди публикуют посты, загружают видео и фото, в конечном счете социальная сеть должна хранить эти данные и управлять ими с помощью своей ИТ-инфраструктуры. Во владении предприятий оказывается растущий объем персональных данных, поэтому возрастает их ответственность в части защиты пользовательской информации от несанкционированного доступа.

Определенные типы данных не подразумевают серьезных требований по безопасности, включая фотографии со смартфонов, потоковое видео, публичный контент на Web-сайтах. Но большинство данных должны быть защищены: финансовые показатели компаний, персональные данные, медицинские сведения. К 2025 г. объем данных, требующих защиты, приблизится к 90%.

Это лишь начало

Данные имеют огромный потенциал нести положительные изменения в общество. Обладание данными не только повышает эффективность бизнеса, но и преобразует каждый аспект жизни человека.

Меняется востребованность типов данных:

  • от развлекательного контента к данным для анализа производительности;
  • от ориентированных на бизнес до гиперперсональных;
  • от структурированных к неструктурированным;
  • от выборочных к всеобъемлющим;
  • от архивов к данным реального времени;
  • от делающих жизнь комфортнее до жизненно важных.

По мере того как вычисления будут становиться все более распределенными, перемещаться в облако и устройства Интернета вещей, данные продолжат улучшать производственные процессы, бизнес-процессы и повседневную жизнь.

  • Поскольку данные превращаются в жизненно важный актив, приобретают критическое значение для бизнеса, все больше создаются мобильными устройствами и все более востребованы в реальном времени, дата-центрам и другим компаниям потребуется вырабатывать взвешенные подходы к повышению надежности хранения, доступности и защиты данных.
  • Смещение аналитики данных от ретроспективного анализа к анализу в реальном времени и прогнозному анализу изменит сам способ принятия решений – большинство решений будут приниматься на основе данных. Аналитика превратится в конкурентное преимущество.
  • Нельзя недооценивать вызовы информационной безопасности и риски несанкционированного доступа. Утечки данных могут быть чреваты потерей бизнеса, целевые атаки могут надолго останавливать бизнес-процессы, хакеры могут заполучить секретную коммерческую информацию. Руководство организаций, ИТ-департаменты и службы безопасности должны постоянно работать с сотрудниками, внушая им, что безопасность не ограничивается техническими решениями. В защиту корпоративных активов (физических и интеллектуальных) должны быть вовлечены все и каждый.
  • Интернет вещей будет стимулировать более тесное сотрудничество между руководителями предприятий, ИТ-департаментами (которые привыкли поддерживать работоспособность бэк-офиса и финансовых служб) и рабочими структурами (операционными залами, производственными цехами, электросетевой инфраструктурой и пр.), поскольку вся цифровая активность перемещается в IP-сети. Поскольку Интернет вещей в последующие десятилетия будет одним из фундаментальных технологических факторов повышения эффективности бизнеса, оптимальное использование данных от IoT-устройств превращается в один из ключевых драйверов коммерческого успеха уже сейчас.
  • Суммарно все эти тренды, движущие глобальную инфосферу к новым отметкам, выраженным в зеттабайтах, должны привести к тому, что цифровая трансформация бизнеса станет ключевой стратегий предприятий по всему миру. Опора на данные положительно повлияет на производительность предприятий, сроки выхода продуктов и услуг на рынок, внедрение новых бизнес-моделей и повышение доходов. Это также усилит взаимодействие организаций с поставщиками облачных сервисов и производителями специализированного софта. Выбор таких подрядчиков станет ответственностью руководства предприятий.

Глобальная инфосфера объемом 163 Збайт, ожидаемым к 2025 г., – это лишь начало. Десятилетие в технологиях может принести (и скорее всего принесет) неожиданные технологические прорывы, пользовательские сценарии и сервисы, меняющие жизнь благодаря доступности значимых данных.

Индустрия систем хранения данных не будет испытывать недостатка в клиентах, желающих сохранить драгоценные биты свои данных, которые будут пополнять глобальную инфосферу и бесконечно менять бизнес и жизнь по всему миру.

___________________________________________
1 Одним из первых в нашей стране, кто ввел понятие "инфосфера", был академик А.П. Ершов в 1988 г. в статье "Информатизация: от компьютерной грамотности учащихся к информационной культуре общества" (прим. ред.).

Опубликовано: Журнал "Системы безопасности" #3, 2017
Посещений: 5453

  Автор

 

Дэвид Рейнзел

Директор по исследованиям рынка устройств хранения данных компании IDC

Всего статей:  1

  Автор

 

Джон Ганц

Директор по научным исследованиям компании IDC

Всего статей:  1

  Автор

 

Джон Риднинг

Вице-президент по исследованиям рынка жестких дисков компании IDC

Всего статей:  1

В рубрику "All-over-IP" | К списку рубрик  |  К списку авторов  |  К списку публикаций