Данные, метаданные и этика Больших данных

Мы говорим о Больших данных как о чем-то понятном и само собой разумеющемся. Но что же представляют собой собственно данные и почему они стали настолько большими, что меняет течение жизни и заставляют задумываться даже философов?

Как можно предположить, понятие данных связано с технологическим прогрессом, точнее, с возможностями регистрации и представления информации. Информация была всегда, но население ранее не исчислялось миллиардами людей, ритм событий был спокойнее, а технических средств для записи, тиражирования, обработки и анализа информации было намного меньше, чем в последнее время.

На текущий момент, оказывается, возможно посчитать оцифрованный объем информации, который существует в мире – это называется глобальной сферой данных, и эта сфера продолжает расширяться с каждым годов в прогрессии. Объемы информации исчисляются зеттабайтами – астрономическими значениями байтов. И если в 2015 году объем информации составлял 6.5 зеттабайтов, то в 2018 году — уже 33 зеттабайта. Согласно исследованию «The Data Age 2025», проведенному компанией IDC, к 2025 году объем данных составит невероятную цифру 163 ЗБ.

Откуда же появляются данные, и, самое главное, чем обусловлен экспонентный рост их количества? Источниками данных во многом является развлекательный контент, и, очевидно, записи с камер видеонаблюдения. Цифровые технологии развиваются во всех направлениях человеческой деятельности — от науки до человеческого общения, и в связи с этим формируются огромные объемы данных от IoT-устройств и метаданных.

Метаданные — понятие звучит как постмодернистский философский термин — на самом деле вполне конкретное понятие: это данные о данных. Приведем конкретный пример: если вы отправляете письмо по электронной почте, текст, который вы печатаете — это данные, а электронные адреса отправителя и получателя, информация о серверах, статус сообщения и даже тема сообщения — как раз метаданные. И хотя содержание сообщения никому неизвестно (в идеале), множество информации «около» доступно для хранения, анализа и использования заинтересованными структурами.

IoT (интернет вещей) — это то, во что интегрирован почти каждый современный человек и все его девайсы (кроме компьютеров и смартфонов), которые имеют доступ в интернет и обмениваются данными об окружающем мире и, конечно, пользователе. Речь идет о об автомобилях, бытовой технике, различных медицинских датчиках и еще множестве полезных гаджетов, которые подключаются к интернету. С учетом того, что этот рынок продолжает активно развиваться, можно говорить о формировании экосистемы интернета вещей — огромной информационной сферы, которая содержит огромное количество данных. Интернет вещей существует на различных платформах, созданных лидерами цифрового рынка: Amazon, Microsoft, Cisco, Oracle и ряда других.

Где же могут храниться эти огромные и растущие количества данных? В 80-90-ые годы ХХ века, когда персональные компьютеры только начали завоевывать свое место под солнцем, данные пользователей хранились на дискетах, объём данных которых составлял 720 килобайт и 1,44 мегабайт (18 секторов). Далее появились компакт-диски с объемом памяти в сотни мегабайтов, затем компактные и мощные флеш-карты, и в настоящее время прогресс в области хранения данных продолжается. В последние годы растет объем данных, которые хранятся на публичных облачных серверах.

Цифровизация общественной жизни и многих экономических процессов способствуют увеличению генерации данных, с одной стороны, и при этом дальнейшее развитие и повышение эффективности в свою очередь обусловлено использованием технологий работы с Большими данными.

С учетом того, что Большие данные формируются по огромному количеству показателей в отношении каждой личности, и тренды демонстрируют только увеличение количества и качества этих записей в динамике, можно говорить о создании двойника нашего мира в цифровом пространстве. В связи с этим возникает множество вопросов, формирующих этику Больших данных: это и уважение к границам личности, возможность сохранения пространства, недоступного для вмешательства технологий, и прозрачность правил передачи данных заинтересованным сторонам.

Проблемами этики Больших данных занимаются и академические исследователи, и коммерческие компании, и специализированные центры, в частности, Центр этики Больших данных. Целью этой деятельности является формирование этичного будущего, в котором все проблемы использования Больших данных буду озвучены, отрефлексированы, и им будет найдены решения, и человек как личность сохранит возможность управлять данными о себе и не стать игрушкой или рабом технологий.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *