Зачем нужны базы данных
Если вы будете делать веб-приложение — например интернет-магазин, блог или игры, — почти наверняка вы столкнётесь с базой данных. Вот что это такое с точки зрения программирования, какие тут основные понятия и что с ними делать.
Данные
Вокруг нас всегда много разных данных, например:
- телефонные номера;
- дела на день;
- записи на бумажках, стикерах и в блокнотах;
- опубликованные мысли разных людей;
- фотографии в смартфоне;
- и всё остальное, что можно прочитать, увидеть или услышать.
Если это компьютерная игра, то данными будут типы и местоположения врагов, их уровень здоровья, уровень здоровья героя, тип героя, его положение, характеристики карты.
Если это приложение для работы с клиентом, то там будут храниться имя клиента, его заказы, номер телефона, уровень в программе лояльности.
Если это служба слежения за гражданами — фотография, имя, посещённые станции метро и улицы, место работы.
База данных и СУБД
Есть понятие базы данных — это набор данных, организованных каким-то способом. Например, если у вас в квартире есть гардеробная или кладовка, то всё это помещение со всем её содержимым может считаться базой (но не данных, а вещей или банок с огурцами, что не меняет сути).
Есть понятие системы управления базой данных (СУБД) — это когда семья села за стол и самого младшего отправляют в кладовку за огурцами, он приносит её и не разбивает по дороге. То есть СУБД — это какое-то средство для манипуляции данными в базе, например программа.
Для чего нужны
Вот основные задачи БД на примере гардеробной:
- Сохранить наши данные по запросу — чтобы вы могли открыть дверь, повесить куртку, закрыть дверь и больше не думать ни о куртке, ни о гардеробной.
- Изменить наши данные по запросу — чтобы можно было легко извлечь из гардеробной все дырявые носки и положить на их место целые.
- Найти эти данные по запросу — чтобы быстро найти приличный пиджак или парный носок.
- Не дать прочитать эти данные тем, кому не следует, а кому надо — дать. Например, младший брат может смотреть на ваши кроссовки, но не может их брать. А девушка (или парень) может положить свои вещи, но только на определённую полку.
- Поддерживать порядок и не дать захламиться — если вам было лень и вы просто кинули толстовку куда попало, чтобы гардеробная либо сама нашла, куда эту толстовку правильно положить, либо сказала: «Э БРАТ ЗАЧЕМ ЗАХЛАМЛЯЕШЬ ПОЛОЖИ НОРМАЛЬНО ДАВАЙ»
- Масштабироваться — чтобы вы могли просто вешать в гардеробную вещи и не думать об объёме полок.
- Не потерять данные — если квартира будет гореть, приличная гардеробная не должна даже нагреться. Или, если она всё-таки горит, чтобы где-то в защищённом подземном гараже была точная копия этой гардеробной со всеми актуальными вещами.
В чём преимущества
Базы данных и их системы управления заточены на работу с большим объёмом данных и от лица большого числа пользователей. Сейчас вы поймёте.
🤔 Представьте, что у вас есть экселька со списком клиентов. Это не база данных, это просто таблица. Чтобы прочитать или записать что-то в эту эксельку, вам нужно её открыть, сделать дело, сохранить.
❌ Допустим, экселька с клиентами лежит на сетевом диске. Вы открыли её и ковыряетесь в данных, вносите изменения. Пока вы это делаете, ваш коллега тоже её открыл и тоже вносит изменения. Потом вы сохранились и закрыли эксельку. Экселька перезаписалась вашими данными. Но у вашего коллеги эти данные не отобразились, он-то открыл её раньше. Теперь, когда он сохранит свою эксельку, его данные перезапишутся поверх ваших, а ваши данные пропадут. Это полный ахтунг: вся ваша работа потеряна.
❌ Или у вас в компании правило: экселька всегда на одной флешке, работаем только с неё. Сейчас флешка в вашем компьютере, вы с ней работаете. А вашему коллеге нужно с ней тоже поработать. Он говорит: «Дай». Вы ему «Отстань». Ну и слово за слово…
✅ Но можно организовать своего рода СУБД. Один ответственный сотрудник назначается главным по эксельке. Она открыта на его компьютере, а вы ему говорите: «Петруха, добавь в клиента такого-то вот такие данные». «Петруха, а шо, когда дедлайн по поставке для этих ребят из Воронежа?», «Петруха, питерские отказались, поставь там отказ».
Петруха — ваша система управления базой данных. А экселька — это его база данных.
Понятно, что Петруха медленный и не всегда многозадачный, но хотя бы он избавляет от проблемы рассинхрона версий и потери данных.
Скорость — ещё одно преимущество базы данных. База данных устроена так, что она легко и быстро находит, записывает, переписывает и снова находит данные. Всё потому, что СУБД всегда знает, что где лежит и по какому критерию искать. Там не будет случайных данных в случайном месте.
Скорость важна ещё и потому, что СУБД обычно обслуживает сразу много потоков: одновременно ей могут пользоваться десятки и сотни тысяч человек, поэтому ей некогда копаться. В хорошо сделанных БД всё молниеносно.
Сложность. Базы данных нужны в числе прочего для хранения сложно структурированных данных. Мы привыкли думать, что база данных — это такая таблица, где есть строки и столбцы. Но база данных при правильной организации может намного больше:
- Связывать одну единицу данных с множеством других. Например, если один человек совершил много заказов со множеством товаров внутри каждого, база данных способна хранить и обрабатывать такие связи.
- База может хранить дерево данных — вроде того, о котором мы писали недавно. Попробуй в реальной жизни похранить дерево!
- В базах могут жить ссылки на другие фрагменты и отделы базы.
Базу можно представить как таблицу, но лишь в самом упрощённом виде. Для более сложных задач базу можно представить как очень сложное дерево, или огромный склад упорядоченных коробок, или даже как огромный завод по фасовке данных.
База данных — это отдельный файл?
Чаще всего да, все данные СУБД хранит внутри одного большого файла. Но если данных много или сама база так устроена, то она может разбиваться на несколько файлов поменьше.
Но для пользователей нет разницы, как физически хранится база, это забота СУБД. Главное — уметь общаться с базой через СУБД.
Где их используют
Базы данных сейчас используются почти везде:
- На сайтах, чтобы хранить контент для страниц. Все статьи в «Коде» на самом деле хранятся в базе данных и извлекаются оттуда по вашему запросу.
- В смартфонах, чтобы хранить все ваши данные — фото, сообщения, заметки, контакты и музыку. Так как всего этого много, а доступ к этому должен быть молниеносный, используют разные виды СУБД.
- В почтовых сервисах, чтобы можно было найти нужное письмо. Там строятся сложные индексные массивы, по которым ваш почтовый клиент ищет данные.
- Везде, где есть личные кабинеты и регистрация, — чтобы запоминать пользователей и отличать их друг от друга.
- В соцсетях и блогах почти всё хранится в базах данных.
Если у вас в работе появляется много одинаковых или похожих данных, то самый надёжный способ не потерять ничего из них — поместить их в базу данных.
Как это работает
Возьмём простой пример реляционной базы данных (можно упрощённо сказать, что это база данных в виде таблицы).
Каждая запись в реляционной базе данных раскладывается в одну или несколько ячеек. Например, запись в телефонной книге может выглядеть так:
В нашем примере у базы есть поля — Имя, Фамилия, Телефон и Фото, в которых могут храниться данные. Одна строчка — одна запись с данными.
Если пользователю нужно будет найти телефон Михаила Максимова по фамилии, происходит следующее:
Запрос от пользователя: Выдай мне из базы «Контакты» все записи, где поле «Фамилия» равно «Максимов»
Ответ от базы данных: ЛОЛ КЕК Ты кто такой
Запрос пользователя: Я хозяин этой базы Админ Админыч, пароль •••••. Выдай мне из базы «Контакты» все записи, где поле «Фамилия» равно «Максимов»
Ответ от базы данных: Найдена одна запись: [Михаил, Максимов, +79057362163, вот фото]
Разные базы — разные правила
Внутри каждой базы данных и её управляющей системы свои строгие правила:
- какие данные могут храниться: текст, цифры, фото, видео или всё вместе;
- какие свойства есть у этих данных: дата записи, кто записал, кто может прочитать;
- что делать, если с базой хотят работать одновременно несколько человек: разрешать только одному или пусть все вместе работают.
Рабочая ситуация: допустим, вы работаете в банке и открыли карточку клиента, чтобы поменять ему кредитный лимит. В этот же момент другой сотрудник из соседнего офиса тоже хочет поменять лимит этому же клиенту, но уже на другую сумму. Как база отреагирует на такое? Должна ли она разрешать второму сотруднику открывать карточку или её нужно заблокировать, пока первый не закончит? А если она разрешит открыть карточку, то что будет, если двое сотрудников напишут там разный лимит — какой из них сохранять в итоге? СУБД задаёт эти правила и следит за их выполнением.
Что дальше
В следующей статье поговорим про MySQL — бурерождённую мать всех баз. Если разобраться, как она работает, то можно творить чудеса.
Как используются большие данные в бизнесе: примеры и сервисы
Big Data (большие данные) стали наступившим будущем. Одни определяют их как революцию, другие отводят им роль оптимизаторов бизнес-процессов. Но все сходятся в одном: большие данные важны. Встает главный вопрос — как можно эффективно применять большие данные в бизнесе?
Последние 10 лет происходит непрерывный рост числа компаний, использующих большие данные.
В 2011 г. большие данные уже использовались гигантами бизнеса — Hewlett-Packard, IBM, Microsoft.
В 2015 г. доля компаний, использующих большие данные, составляла 17% в мире.
Сегодня доля таких компаний — 50%.
И это неудивительно — сбор и анализ больших данных дает важные преимущества:
Информация поступает из разных источников, что делает ее достоверней;
Данные не анализируются вручную, что уменьшает количество ошибок и увеличивает объем информации, возможный для обработки;
У компании есть централизованный доступ к информации.
Российский рынок больших данных уступает своим масштабом западному, но 55,4% отечественных компаний уже начали инвестировать в аналитику Big Data. На практике мы видим не один пример успешной попытки интегрировать большие данные в бизнес. Например, Сбербанк с его ботами-операторами, заменяющими консультантов. Или гипермаркет Hoff, который на основе больших данных формирует персональные предложения клиентам.
С малым бизнесом и большими данными сложнее. Процесс интеграции больших данных в бизнес — удовольствие дорогое и сложное. Встает вопрос, способен ли малый бизнес на такие подвиги? Что говорят специалисты?
Малый бизнес может данные купить, интегрировать и экстраполировать в свои задачи. Например, есть сеть магазинов по продаже настольных игр «Мосигра». Каждая торговая точка продаж — отдельный малый бизнес. В своей работе они используют big data от торгового центра, где представлен магазин. На основе этих данных корректируют продажи и способы привлечении аудитории. У каждого ТЦ эти данные разные, что позволяет каждому магазину быть востребованным.
Есть смысл с самого старта бизнеса собирать максимальное количество данных, накопить как можно больше метрик. Когда бизнес начнет стагнировать, будет достаточно информации, чтобы понять, что происходит.
IT-директор компании Domino’s Pizza
Малый бизнес более динамичен, конкуренция в разы больше, чем «у больших». Сложность вызывает стоимость, которую малый бизнес не готов платить за собственную платформу. Поэтому вариант для небольших компаний — покупать сервисы, которые продают готовую аналитику.
Бизнес на персональных данных: как добиться успеха и не преступить закон?
«Данные – нефть цифровой экономики» — выражение, которое уже стало афоризмом. Действительно, в современном мире пользовательские данные превратились в один из наиболее ценных и востребованных ресурсов. Так, по данным компании PwC, в 2018 году мировая выручка от использования пользовательских данных достигнет $300 млрд. Что касается России, то по данным журнала РБК в 2017 году оборот рынка продажи и покупки персональных данных в России составил не менее 3,3 млрд рублей. Более того, эксперты прогнозируют дальнейший интенсивный рост этого рынка.
- Персональные данные
В то же время ни для кого не секрет, что такая информация активно обрабатывается во всемирной паутине, становится основой успеха множества бизнес-проектов (реклама, маркетинг, скоринг). А каких-нибудь однозначных критериев, позволяющих проводить границу между ПДн и Большими данными не выработано.
- Большие данные
- большой объем (Volume);
- большое разнообразие (Variety);
- высокая скорость накопления и обработки (Velocity);
- точность (Veracity);
- переменчивость (Variability);
- ценность (Value);
- визуализация (Visualization);
- жизнеспособность (Viability).
Управляющий партнер Центра цифровых прав Саркис Дарбинян, выступая на форуме BIG DATA 2018, так объясняет их природу: «Большие данные – это объемные потоки информации разнородных данных, которые постоянно генерируются пользователями электронных устройств и онлайн-сервисов либо техническими устройствами, а также обрабатываются в режиме реального времени».
В России до настоящего времени нет единого понимания и подхода к регулированию Больших данных. Кроме того, продолжаются дискуссии о том, кому должны принадлежать Большие данные и как, используя их, не нарушать права на различные категории охраняемых законом данных (ПДн, коммерческой тайной, конфиденциальной информацией, авторского права на базу данных).
- Большие пользовательские данные
Судебные споры вокруг бизнес-проектов на персональных данных
Бизнес-проекты с использованием Больших пользовательских данных неизбежно сталкиваются с проблемой соблюдения законодательства о защите ПДн. Так, наглядными примерами здесь являются следующие судебные дела: Роскомнадзор vs. НБКИ, Роскомнадзор vs. МГТС, «HeadHunter» vs. «Робот Вера», «HeadHunter» vs. «FriendWork» и «ВКонтакте» vs. «Double Data».
Единого подхода по вопросу использования Больших пользовательских данных, в том числе размещённых пользователями в социальных сетях, пока не выработано, а позиции различных судебных инстанций пока имеют хаотичный характер. Кроме того, стороны не всегда оперируют законодательством о защите ПДн, а ссылаются наинтеллектуальные права на базу данных. Например, нормы о защите интеллектуальных прав на базу данных использовались в делах по искам компании «HeadHunter», а также в резонансном деле «ВКонтакте» против «Double Data».
Компания «Double Data» собирала и использовала в коммерческих целях данные пользователей, размещённые в социальной сети (фамилии, имена, места работы и учебы). Никаких дополнительных разрешений компания не получала. «Вконтакте» отстаивает позицию, что такие действия нарушают исключительное смежное право на базу данных, возникшее у «Вконтакте» как у изготовителя такой базы данных с данными пользователей. «Double Data», напротив, настаивает на открытости данных, невозможности запретить повторное использование информации и отсутствии прав у «Вконтакте» на базу данных, сформированную самими пользователями. На сегодняшний день (октябрь 2018 г.) дело дошло до СИПа (кассационная инстанция). СИП согласился с выводом апелляционной инстанции, что «из материалов дела усматривается как наличие объекта смежного права (базы данных пользователей социальной сети), так и наличие исключительного права общества «В Контакте» на указанный объект». Довод ответчиков о базе данных как «побочном продукте» деятельности «В Контакте» не был признан судом обоснованным. Однако СИП отправил дело на новое рассмотрение в суд первой инстанции (дата заседания — 19.12.2018), а потому битва «ВКонтакте» и «Double Data» еще продолжается. Видится, что после окончательного разрешения данного дело станет практикообразующим и будет определяющей вехой для развития бизнеса на пользовательских данных в России.
Кроме того, важным для дальнейшей судьбы бизнес-проектов на пользовательских данных является дело Роскомнадзор vs. МГТС, в котором суд попытался найти баланс между правом пользователей и интересами бизнеса. Суд привлек компанию МГТС к административной ответственности, установив, что сделки по «перепродаже» данных об абонентах без их согласия нарушают право на неприкосновенность частной жизни.
Также интересно дело Роскомнадзор vs. НБКИ, которое хоть и закончилось мировым соглашением, но в рамках рассмотрения которого ВС РФ сделал вывод, что данные после их размещения пользователями в социальной сети не становятся общедоступными согласно смыслу ст. 8 ФЗ «О персональных данных».
Как на практике реализуется бизнес на персональных данных?
Из-за отсутствия ясных и однозначных правовых подходов («правил игры») по использованию больших данных уже на протяжение многих лет существуют «серые» сервисы по продаже персональных данных. Например, Dark Web, где продаются самые разные виды ПДн: от паспортных данных до медицинской информации и паролей от кредитных карт. По результатам исследования «Черный рынок баз данных» аналитического центра «МФИ Софт» за 2016 г, объем рынка нелегальных баз данных в России – больше 30 млн рублей. И эта цифра только растёт.
Тем не менее, не стоит полагать, что бизнес на персональных данных — это априори нелегально. Стремительно развиваются и легальные проекты, направленные на монетизацию ПДн пользователей: Opiria, Handshake, Datacoup, GoodData, Pillar Project, Personal и другие сервисы.
Более того, в мировой практике известны и примеры оффлайн-проектов, использующих в качестве оплаты ПДн. Например, в американском кафе Shiru расплатиться по счету можно своими ПДн (именами, номерами телефонов, электронными адресами, датами рождения и сведениями об интересах).
Однако многие компании заинтересованы не столько в получении ПДн конкретного субъекта, сколько в получении массива данных, отражающих те или иные признаки целого ряда субъектов. Потому ценность получают имеющиеся у других компаний базы данных ПДн, Большие пользовательские данные.
Зачастую компании включают положения о передаче данных в договоры оказания услуг или иные аналогичные. Кроме того, видятся интересными проекты по обмену ПДн, реализуемые с помощью соглашений между компаниями об информационном взаимодействие в области передачи персональных данных или иных аналогичных по содержанию. Например, такие соглашения распространены в сфере медицины.
Также описывая проекты, работающие с Большими пользовательскими данными, нельзя не упомянуть проект Double Data и аналогичные ему (Clever Datа, Scorista, Scorto, FICO, Бюро кредитных историй Equifax, Национальное бюро кредитных историй). Эти проекты, по большей части, используют данные для последующей перепродажи, а также для скоринга и персонализации рекламы. Они позиционируют себя как работающие с открытыми данными, отстаивая в лице НБКИ и Double Data в судебном порядке свои права на обработку Больших пользовательских данных без дополнительного разрешения как и от пользователей, так и от компаний, первично обрабатывающих ПДн.
Отдельно стоит отметить скандально известную компанию Cambridge Analytica, которая собирала для анализа политических предпочтений избирателей ПДн пользователей без их согласия, в том числе ПДн пользователей социальной сети Facebook. В результате таких действий не только разгорелся политический скандал, но и неизбежно возникли юридические последствия и для Cambridge Analytica, и для Facebook. Cambridge Analytica, Facebook объявила о своём банкротстве, а Facebook оштрафовали на 500 тысяч фунтов стерлингов (около 600 тысяч долларов) за несоблюдение прав субъектов ПДн: отсутствие должной защиты ПДн пользователей и недостаточную прозрачность их обработки.
В целом, скандал Cambridge Analytica-Facebook имеет далеко идущие последствия, в том числе и для России. Так, компания Facebook стала блокировать доступ к «подозрительным» сервисам, деятельность которых допускает риски нарушения законодательства о ПДн. Например, недавно (в начале октября 2018 г.) Facebook заблокировала больше 66 аккаунтов, профилей, страниц и приложений российского стартапа, Social Data Hub, который раньше сравнивал себя с Cambridge Analytica, а сейчас позиционирует себя как «специализирующийся на разработке систем искусственного интеллекта». Тем не менее, согласно данным СМИ проект занимается также коммерческим анализом данных пользователей для государства.
Интересно, что на сайте Social Data Hub можно ознакомиться с ответом Роскомнадзора о легальности функционирования такого сервиса. Однако это не помешало компании Facebook усмотреть в деятельности Social Data Hub нарушение пользовательского соглашения Facebook и признаки незаконного использования ПДн. Facebook удалила аккаунты стартапа и его сотрудников, а также направила письмо с требованиями:
- немедленно прекратить деятельность по обработке данных пользователей Facebook и уничтожить эти данные;
- предоставить Facebook полный перечень всех используемых компанией данных и организации, получивших к ним доступ;
- предоставить представителям Facebook доступ к хранилищам данных для проверки, что они действительно удалены.
Правовые основы ведения бизнеса на персональных данных
С юридической точки зрения бизнес-проекты на пользовательских данных реализуются с помощью различных правовых инструментов. Во многом такое положение дел объясняется отсутствием нормативного регулирования процессов монетизации пользовательских данных. Закон лишь предписывает обязательные требования и условия, при которых могут собираться и обрабатываться ПДн.
Наиболее распространённое основание для обработки ПДн — это наличие согласия субъекта. Получение такого согласия, его «покупка», как раз лежит в основе большинства легальных бизнес-проектов на пользовательских данных. При этом важно понимать, что реализация такой покупки далека от классического гражданско-правового понимания договор купли-продажи. Помимо непосредственно получения согласия за определенное имущественное вознаграждение возможна обработка ПДн во исполнении заключенных с пользователями договоров, сопутствующих предоставлению каких-либо товаров и услуг (в большинстве случаев предоставления доступа к контенту в интернете).
Кроме того, в последнее время популярность набирают проекты, в том числе и ICO-проекты, основная цель которых — это обеспечение легальной монетизации ПДн. Например, платформа Opiria. Данный проект позволяет пользователям предоставлять согласие на обработку своих ПДн в обмен на токены PDATA. Согласно утверждениям разработчиков, данная платформа является «глобальным децентрализованным рынком, где компании могут покупать персональные данные напрямую у потребителей без посредников». При этом Opiria гарантирует пользователям возможность контроля и управления своими ПДн в соответствии с требованиями законодательства о ПДн.
В то же время посредничество в бизнесе на персональных данных не теряет свою актуальность. Множество компаний пытаются перепродать ПДн или совершить их обмен. Но такие проекты будут соответствовать законодательству, только когда получены соответствующие согласия на передачу ПДн третьим лицам и их последующую обработку.
Показательным является английское дело сервиса DeepMind, который заключил соглашение об обмене ПДн с Национальной службой здравоохранения Великобритании. Однако стороны не предусмотрели получение согласия на передачу и обработку ПДн пациентов сервисом DeepMind, а потому было установлено нарушение законодательства о ПДн. Хотя данное дело основано на нормах иностранного законодательства, его выводы являются применимыми и в российских реалиях. Схожую позицию мы наблюдали, например, в ранее упомянутом деле о продаже МГТС данных о своих абонентах.
В целом, в России для всех бизнес-проектов на ПДн крайне важно соблюдать общие требования законодательства о ПДн. В частности, необходимо:
- ограничивать обработку ПДн конкретными, заранее определенными целями;
- ограничивать объем обрабатываемых данных минимально необходимым объемом для осуществления заявленных целей их обработки;
- не объединять базы данных, содержащие ПДн, обработка которых осуществляется в целях, не совместимых между собой;
- уничтожать или обезличивать ПДн по достижении целей обработки или в случае утраты необходимости в достижении этих целей (кроме случаев прямо предусмотренных законом);
- определять правовое основание обработки ПДн (в большинстве случаев это будет согласие от субъекта ПДн, но также может быть договор, законодательная норма, общедоступность ПДн, иное);
- соблюдать требования к форме согласия на обработку ПДн;
- прекращать обработку или обеспечивать прекращение обработки другим лицом ПДн в случае отзыва субъектом согласия на обработку ПДн.
- Во-первых, отсутствует единый подход к пониманию Больших данных.
- Во-вторых, законодательство регулирует обработку Больших данных лишь частично.
- В-третьих, не выработано однозначной позиции по вопросу использования ПДн, находящихся в открытом доступе и обезличенных ПДн.
- В-четвертых, сложно определить реальную стоимость Больших пользовательских данных.
- В-пятых, агрегирование Больших пользовательских данных какой-либо компанией может порождать интеллектуальные права этой компании на базу данных. В результате возникает коллизия прав. А коммерческие отношения в данной сфере становятся по своей непредсказуемости подобны лотерее.
Также в настоящее время в Госдуме находится законопроект, который направлен на то, чтобы определить правила в отношении такого нового объекта гражданских прав как цифровые права. Законопроект предлагает урегулировать использование Больших данных в договорных отношениях, а именно закрепить в ГК РФ конструкцию договора об оказании услуг по предоставлению информации (ст. 783.1). Данным договором может быть предусмотрено условие о неразглашении информации третьим лицам в течение определенного срока. Кроме того, законопроект предлагает расширить понятие «база данных» исходя из потребности защищать базы данных, основанных на Больших данных.
Заключительные рекомендации
Таким образом, очевидно, что с каждым годом становится все больше и больше бизнес-проектов, в которых пользовательские данные играют основополагающую роль. Большие пользовательские данные могут представлять из себя ценнейший нематериальный актив, а могут стать и токсичным пассивом для компании, если неправильно подходить к обороту и защите таких данных. Согласно оценкам экономистов, такие проекты — неотъемлемая составляющая цифровой экономики, и их число будет только расти. Да и уже сейчас, несмотря на возникающие правовые преграды, вполне возможно построить бизнес на пользовательских данных, если подходить к данным ответственно и следовать несложным рекомендациям:
Источник https://thecode.media/db/
Источник https://vc.ru/services/74841-kak-ispolzuyutsya-bolshie-dannye-v-biznese-primery-i-servisy
Источник https://habr.com/ru/company/digitalrightscenter/blog/427233/