В рубрику "All-over-IP" | К списку рубрик | К списку авторов | К списку публикаций
Эпоха Данных 2025 |
По прогнозу IDC, к 2025 г. глобальная инфосфера достигнет 163 Збайт, или триллиона гигабайт. Это в 10 раз больше общего объема данных за 2016 г. (16,1 Збайт). Масштабные тенденции, связанные с наступающей эпохой больших данных, затрагивают практически все существующие компании.
К 2025 г. почти 20% всей информации в глобальной инфосфере получит критически важную роль в повседневной жизни, а примерно 10% этих данных будут "сверхкритичными".
Автономные устройства уступают место подключенным цифровым дивайсам, которые генерят огромные объемы данных. Те в свою очередь позволят улучшать работу систем и процессов так, как ранее было просто невообразимо. К 2025 г. среднестатистический житель Земли будет взаимодействовать с подключенными в сеть устройствами примерно 4800 раз в день: по одной процедуре взаимодействия каждые 18 секунд.
К 2025 г. более четверти всех данных будут представлять собой информацию, получаемую в реальном времени, причем свыше 95% составят данные, поступающие от устройств Интернета вещей.
Потоки данных создают условия для развития целого пласта новых технологий, таких как машинное обучение, обработка естественного языка и искусственный интеллект (работают в составе когнитивных систем), что поможет превратить аналитику данных из ретроспективной практики в инструмент оперативных решений. По прогнозу IDC, доля глобальной инфосферы, подвергаемой анализу, к 2025 г. вырастет по сравнению с нынешней в 50 раз, достигнув 5,2 Збайт. Объем данных, анализируемых с применением когнитивных систем, вырастет в 100 раз и достигнет 1,4 Збайт в 2025 г.
Развитие больших данных сопряжено с новыми уязвимостями и рисками защиты информации. Существует пропасть между объемом генерируемых данных, которые нуждаются в защите, и данными, которые фактически защищены. И эта пропасть расширяется. К 2025 г. почти 90% данных глобальной инфосферы потребуют определенного уровня защиты, но эти требования будут удовлетворены менее чем для половины.
С ростом объема и разнообразия данных организациям следует сосредотачиваться на той информации, которая имеет наибольшее значение. Не все данные одинаково важны для бизнеса или потребителей. Преуспеют те организации, которые воспользуются данными, имеющими первостепенную важность, чтобы улучшить опыт своих клиентов при работе с тем или иным продуктом или сервисом, решать сложные задачи и экономить на масштабе.
Современное общество создает, использует и хранит такие объемы данных, которые по более ранним стандартам назвали бы огромными, а скорее невообразимыми. Тем не менее в ближайшие годы глобальная инфосфера продолжит расти и затмит показатели, которыми мы оперируем сегодня. Таков результат эволюции вычислительных систем, в которой выделяют три эпохи (рис. 1).
Роль данных эволюционирует. На это указывает объем информации, создаваемой и используемой с помощью различных вычислительных платформ:
Объем данных, создаваемых оконечными устройствами, начал уменьшаться в 2012 г. Ожидается, что этот тренд сохранится (рис. 2). Последнее десятилетие из числа оконечных устройств наибольший вклад в глобальную инфосферу вносили персональные компьютеры, смартфоны и другие бытовые устройства. В дальнейшем главная роль в создании данных в сегменте оконечных устройств перейдет к встроенным системам, включая охранные видеокамеры, умные счетчики, торговые автоматы и пр. Между тем крупнейшими производителями данных являются коммерческие предприятия и, соответственно, дата-центры и корпоративные серверные системы.
Значительные изменения претерпевает и ландшафт области хранения данных (рис. 3). В период с 1980 до начала 2000-х гг. персональные компьютеры и развлекательная сфера доминировали на арене создания и потребления информации. Однако с развитием транспортных сетей все чаще пропадает необходимость хранить данные локально – на ПК или мобильных устройствах. В 2010 г. около 50% всего архива данных представлял собой развлекательный контент на DVD- и Blu-ray-дисках. С изменением приоритетов зрителей в пользу потоковых сервисов видео доля корпоративных систем хранения повышается, а доля устройств хранения развлекательного контента падает. Роль облачных хранилищ данных в корпоративном сегменте возрастает.
Смещение спроса в сторону облачных систем хранения и технологий мобильного доступа к данным стало результатом возросшей
значимости (или критичности) данных в быту и бизнесе.
Все чаще данные разделяют на группы по уровню их критичности, о чем свидетельствуют такие факторы, как необходимость в обработке данных в реальном времени (с малой задержкой), серьезность последствий в случае недоступности данных. К 2025 г. около 20% данных в глобальной инфосфере могут стать критичными для жизни, а 10% будут сверхкритичными (см. табл.).
Встраиваемые компьютеры, на базе которых производится все больше оконечных устройств, являются источником огромного массива данных. На современного человека приходится в среднем одно умное устройство, данные от которого поступают в дата-центр. Через десять лет количество таких умных устройств на человека превысит четыре.
Несмотря на то что данные от встроенных систем представляют собой значительную ценность в отличие от данных, создаваемых при использовании электроники для развлечения, количество таких файлов будет достигать нескольких квинтильонов в год. Для сравнения: чтобы один квинтильон галлонов воды прошел через Ниагарский водопад, потребуется 210 тыс. лет.
Аналитики IDC группируют данные, формирующие глобальную инфосферу, по четырем основным категориям (рис. 4).
К 2025 г. доля данных от встроенных систем будет составлять около 20% в объеме всех создаваемых данных, или три четверти от объема данных о производительности систем. Данные о производительности поступают от таких традиционных вычислительных платформ, как ПК, серверы, телефоны, планшетные компьютеры. К встроенным системам, генерящим данные, относятся:
Устройства Интернета вещей создают огромный объем информации, большинство из которой не представляет ценности для длительного хранения. Взять хотя бы камеры видеонаблюдения. Они производят очень насыщенный видеоконтент. Основная его часть – изображение с ничем не примечательным содержанием, которое нет смысла хранить, и одиночными инцидентами, которые должны быть доступны в будущем. Среди данных, получаемых от дорожных камер, для управления городского транспорта интерес представляют собой только видеосвидетельства нарушений или нештатные ситуации. Видео потока автомобилей, движущихся в рамках правил, хранить не нужно.
Данные продолжат создаваться в таких масштабах, что хранить весь их объем без разбора не будет представляться возможным. Например, чтобы обеспечить хранение всей инфосферы объемом 163 Збайт, которого она достигнет к 2025 г., потребуется примерно 16 млрд современных промышленных 12-терабайтных HDD. Для сравнения: за последние 20 лет было произведено 8 млрд HDD общей емкостью около 4 Збайт. Чтобы удовлетворить прогнозируемый спрос, в течение последующих четырех лет (2017–2020 гг.) продажи накопителей всех типов (жесткие диски HDD, флеш-память, ленточные накопители, оптические диски, память типа DRAM) в емкостном выражении должны превзойти продажи последних 10 лет (5,5 Збайт). А именно в период с 2017 до 2025 г. должно быть продано накопителей емкостью свыше 19 Збайт. Около 58% емкости придется на HDD и 30% – на флеш-память.
Число людей, использующих устройства, подключенные к Интернету, выросло в пять раз в период с 2005 по 2015 г. За это время мобильный Интернет обогнал стационарный, в особенности в регионах со слабо развитой кабельной инфраструктурой или с ее отсутствием. К 2025 г. численность людей, владеющих подключенными устройствами, составит 75% от мирового населения, включая маленьких детей, пожилых, жителей развивающихся стран.
Мобильные данные (рис. 6) и данные реального времени (рис. 7) будут только нарастать.
Причем скорость прироста данных реального времени будет превышать темпы роста объема всех данных в 1,5 раза. Ключевую роль в этом сыграют устройства Интернета вещей (рис. 8).
Рост объема данных реального времени изменит потребности в типах памяти в будущем (рис. 9). Необходимость доступа к данным в реальном времени сделает сверхнизкую задержку и время отклика важнейшим параметром при выбора системы хранения корпоративного класса, а также оконечных устройств.
Доля информации в общем объеме глобальной инфосферы, которая обрабатывается, хранится и предоставляется людям публичными облачными дата-центрами, практически удвоится в период с 2016 по 2025 г. и составит 26%.
Облачные вычислительные мощности и хранилища будут обслуживать не только данные, создаваемые ИТ-системами, но и развлекательный контент, энергетическую телеметрию и телекоммуникации. Дата-центры корпоративного класса используют разные типы накопителей, включая HDD и NAND флеш-память, чтобы управлять потоками данных экономически эффективно (рис. 10).
Взрывной рост и высокая доступность данных увеличивают ценность применения когнитивных систем, или систем искусственного интеллекта.
К 2025 г. две трети международных финансовых организаций будут использовать сторонние системы искусственного интеллекта, чтобы улучшить клиентский опыт за счет более адресного предложения финансовых продуктов и сервисов, а также для защиты от мошенничества. Сферы применения когнитивных систем распространяются на деловую среду и быт.
Тегирование данных, особенно автоматическое, является важнейшим аспектом использования когнитивных систем. Процесс тегирования позволяет снабжать массивы данных идентификаторами для категоризации, описания, поиска данных и, в конечном итоге, сбора ценной информации. Технологии тегирования данных находятся на раннем этапе развития; требуются стандартизация, инвестиции в разработки, наращивание экспертизы.
До сих пор основными производителями данных в мире были потребители. К 2025 г. ситуация изменится: 60% информации будут генерировать коммерческие предприятия, доля которых в производстве данных составляла менее 30% в 2015 г. (Интересно, что до 1980 г. коммерческие организации создавали и управляли всем объемом данных.) Однако неважно, кем создаются данные, предприятиям придется управлять 97% глобальной инфосферы. Взять пользовательский контент для социальных сетей. Несмотря на то что именно люди публикуют посты, загружают видео и фото, в конечном счете социальная сеть должна хранить эти данные и управлять ими с помощью своей ИТ-инфраструктуры. Во владении предприятий оказывается растущий объем персональных данных, поэтому возрастает их ответственность в части защиты пользовательской информации от несанкционированного доступа.
Определенные типы данных не подразумевают серьезных требований по безопасности, включая фотографии со смартфонов, потоковое видео, публичный контент на Web-сайтах. Но большинство данных должны быть защищены: финансовые показатели компаний, персональные данные, медицинские сведения. К 2025 г. объем данных, требующих защиты, приблизится к 90%.
Данные имеют огромный потенциал нести положительные изменения в общество. Обладание данными не только повышает эффективность бизнеса, но и преобразует каждый аспект жизни человека.
Меняется востребованность типов данных:
По мере того как вычисления будут становиться все более распределенными, перемещаться в облако и устройства Интернета вещей, данные продолжат улучшать производственные процессы, бизнес-процессы и повседневную жизнь.
Глобальная инфосфера объемом 163 Збайт, ожидаемым к 2025 г., – это лишь начало. Десятилетие в технологиях может принести (и скорее всего принесет) неожиданные технологические прорывы, пользовательские сценарии и сервисы, меняющие жизнь благодаря доступности значимых данных.
Индустрия систем хранения данных не будет испытывать недостатка в клиентах, желающих сохранить драгоценные биты свои данных, которые будут пополнять глобальную инфосферу и бесконечно менять бизнес и жизнь по всему миру.
Опубликовано: Журнал "Системы безопасности" #3, 2017
Посещений: 5986
Автор
| |||
Автор
| |||
Автор
| |||
В рубрику "All-over-IP" | К списку рубрик | К списку авторов | К списку публикаций