Stape

Як анонімізувати дані користувача в Google Analytics 4

Оновлено
23 лют. 2024 р.
Опубліковано
21 верес. 2022 р.
Також є

Загальний регламент про захист даних (GDPR) зробив необхідним захист конфіденційності користувачів. Відповідно до GDPR, перед передачею даних користувача до будь-якого інструменту, що належить США, необхідно видалити будь-яку інформацію, що дозволяє ідентифікувати особу. Цей крок став необхідним у зв'язку з втратою чинності Privacy Shield.

У цій статті я розповім, як автоматично видаляти дані користувачів за допомогою stape Anonimyzer і вручну редагувати дані користувачів через веб і сервер GTM. Це продовження статті, опублікованої в нашому блозі, в якій розповідається про те, чому потрібно використовувати проксі-сервер для використання Google Analytics в GDPR-сумісному режимі.

Чому ви повинні видалити PII з Google Analytics 4Скопіюйте посилання на цей розділ

У країнах ЄС (Італія, Франція, Австрія, Данія) було кілька випадків, коли люди зверталися до місцевих органів захисту даних, щоб перевірити, чи підпадає використання Google Analytics на сайті під дію GDPR. Відповідь у всіх випадках була одна - використання Google Analytics не відповідає вимогам GDPR.

Основна причина полягає в тому, що американські компанії (в тому числі Google) не забезпечують достатніх заходів безпеки для захисту персональних даних користувачів ЄС. Саме тому обмін PII з американськими компаніями суперечить GDPR. Більше інформації про це ви можете знайти в нашій попередній статті в блозі.

Хороша новина полягає в тому, що є рішення, як використовувати Google Analytics і при цьому відповідати вимогам GDPR. CNIL (французький орган із захисту даних) заявив, що для використання GA у GDPR-сумісний спосіб, слід впровадити дві основні речі: ЄС проксі-сервер та псевдонімізацію даних користувачів перед експортом.

Проксі-сервер забезпечує відсутність прямого контакту між сайтом та американським інструментом аналітики. Найпростішим способом реалізації такого проксі-сервера є використання сервера-контейнера Google Tag Manager. Проксі-сервери повинні відповідати ряду критеріїв. Основна область: компанія, яка надає вам проксі-сервер, повинна бути зареєстрована в ЄС; сервери, які використовуються для розміщення вашого контейнера sGTM, повинні бути фізично розташовані в ЄС. З цих двох причин ви не можете використовувати Google Cloud (GCP) для sGTM. По суті, це та ж причина, що і у випадку з Google Analytics - Google, американська компанія, є її власником.

Ще одна гарна новина полягає в тому, що компанія Stape вже вирішила цю проблему. У нас є спеціальний продукт - Stape Europe, який відповідає всім вимогам до проксі-сервера ЄС. Stape Europe зареєстрований в ЄС (Естонія) і використовує хмарний сервер ЄС, наданий компанією Scaleway, для роботи вашого контейнера sGTM. 

У цій статті я хочу більше зупинитися на другій частині закону, а саме на псевдонімізації даних користувачів. Ми в Stape впроваджуємо перелік функцій, які допоможуть вам автоматично видаляти дані користувачів. Саме тому я розділю статтю на дві частини:

  • Як можна автоматично видалити/псевдонімізувати дані користувачів за допомогою програми stape Anonymizer
  • Як вручну видалити дані користувача за допомогою веб та серверного GTM.

Перелік даних користувачів, які підлягають псевдонімізації, є досить розпливчастим. 

  • IP адреса.
  • Ідентифікатори користувачів. (на кшталт ідентифікатора клієнта Google)
  • Зовнішній референт.
  • URL параметр.
  • Будь-які дані, які можуть бути використані для зняття відбитків пальців.
  • Крос-сайтовий ідентифікатор.
  • Будь-які дані, які можуть бути використані для ідентифікації користувача.

Наразі ми розробляємо додаток Stape Anonymizer тільки для GA4. Однак у наступних оновленнях він буде адаптований і стане доступним з функцією анонімізації UA.

Важливо розуміти, що список параметрів, які надсилає GA4, може змінюватися. Ми будемо оновлювати цю статтю, але переконайтеся, що ви протестували анонімізацію даних користувачів, перш ніж публікувати її у виробництво.

Найкращий інструмент, який я знайшов, який допомагає відстежувати та визначати параметри GA4, - це ось цей. 

Як можна забезпечити анонімізацію даних користувачівСкопіюйте посилання на цей розділ

Процес псевдонімізації даних користувача відбувається всередині тегів GA4 у веб та серверному GTM контейнері. Якщо ви ще не налаштували сервер GA4, виконайте наступні дії.

У нас немає суворих вказівок щодо того, які дані повинні бути видалені. Ви самі вирішуєте, як ви хочете, щоб ваша компанія була захищена. Наприклад, ви можете видалити IP-адресу користувача або відредагувати останні кілька цифр. Інше велике питання стосується таких параметрів, як країна, мова, браузер тощо. Кожен параметр окремо не дає достатньо інформації для ідентифікації користувача, але набір параметрів може її надати.

Немає питань щодо того, чи слід видаляти такі параметри, як ідентифікатор клієнта або URL запитів. Використання кожного параметра окремо може призвести до ідентифікації користувача через унікальний ідентифікатор в Google.

Скажімо, вам може бути важливо проаналізувати мобільний та десктопний трафік або конверсії в різних браузерах. Чи варто видаляти всі дані, які можуть бути використані для зняття відбитків пальців та ідентифікації користувача, чи лише деякі? Чи можна залишити браузер і пристрій, якщо видалити всі інші параметри?

Переконайтеся, що ви обговорили ці питання зі своїми юристами або DPO, щоб мати хороший захист, якщо регулятор прийде до вас. Я вважаю, що видалення всіх ідентифікаторів користувачів, які можуть бути використані для зняття відбитків пальців та повторної ідентифікації, є кращим способом убезпечити вашу компанію. 

Ця стаття не претендує на роль інструкції. Ми просто ділимося досвідом щодо видалення або псевдоанонімізації даних і того, як stape робить це автоматично. Ви можете не використовувати наш інструмент анонімізації або вручну анонімізувати кожен параметр.

Видалення даних користувачів з Google Analytics за допомогою AnonimyzerСкопіюйте посилання на цей розділ

Нещодавно ми випустили "Анонімайзер". Він доступний для всіх користувачів Stape. Основна мета анонімайзера полягає у видаленні або анонімізації даних користувача в Google Analytics 4 та Universal Analytics. 

Щоб увімкнути анонімайзер, відкрийте контейнер sGTM в stape, натисніть кнопку power-up та відкрийте анонімайзер. 

Anonymizer power-up in stape

Анонімайзер все ще знаходиться в стадії бета-версії, оскільки ми додаємо нові функції та тестуємо нестандартні випадки використання. 

Вам потрібно буде вибрати, які параметри ви хочете залишити як є, видалити або анонімізувати. Після налаштування параметрів слід оновити URL-адресу сервера тегів для Google Analytics 4 та Universal Analytics. Якщо ви раніше використовували URL-адресу сервера тегів https://sgtm.example.com при включеному анонімайзері, оновлена URL-адреса сервера тегів буде виглядати як https://sgtm.example.com/anonymize. Ми проксіруємо ваші запити до sGTM через шлях /anonymize і видаляємо вказані дані.

Коли запити GA проходять через URL-адресу сервера тегування, що містить /anonymize, ми автоматично видаляємо або анонімізуємо вибрані параметри. 

Після ввімкнення та налаштування Анонімайзера переконайтеся, що ви змінили транспортну URL-адресу GA4/UA у тезі конфігурації Web GTM на ту, яка закінчується на /anonymize

Нижче наведено список всіх параметрів, які Анонімайзер може видалити та анонімізувати. При створенні Анонімайзера нашою метою було надати нашим клієнтам можливість видалити всі параметри, які так чи інакше можуть бути розцінені як персональні дані користувача. Ви можете вибрати, які параметри ви хочете видалити. Поговоріть зі своїм DPO або юристами, щоб визначити, які параметри необхідно видалити.

Загальна інформаціяСкопіюйте посилання на цей розділ

Для більшості параметрів у вас буде два варіанти: залишити як є або видалити. Для двох параметрів (IP та ідентифікатор клієнта) ви побачите опції Анонімізувати та Строго анонімізувати.

IP

Anonymize - видаляє останній октет.

Anonymize Strictly - видаляє останні два октети

Client IDПрацює тільки за умови використання JavaScript Managed client identification.

Anonymize - використовуйте хеш IP+UserAgent і додайте рік+місяць.

Anonymize Strictly - використовуйте хеш IP+UserAgent та додайте мітку часу, crc32_hash(IP+UA).timestamp

Назва параметра ОписGA4 ПараметрAnonymize
IPUser IPIP AddressAnonymize - видаляє останній октет. Anonymize Strictly - видаляє останні два октети
Client IDGoogle Analytics Client ID, _ga, _ga_*, FPLC, FPID cookiescid, _ga, _ga_*, FPLC, FPID Anonymize - використовуйте хеш IP+UserAgent і додайте рік+місяць. Anonymize Strictly - використовуйте хеш IP+UserAgent та додайте мітку часу, crc32_hash(IP+UA).timestamp
User IDUser ID, Google Developer ID, Firebase IDuid, gdid, _fid-
Session IDSession ID, New Session IDsid, _nsi-
Query parametersRemove query paramaters from Document Locationdl-
RefererDocument Referrer Header, Document Referrer Parameterreferer header, dr-

Інформація про системуСкопіюйте посилання на цей розділ

User AgentDocument User-Agent header, Sec-Ch-Ua header, Sec-Sh-Ua-Platform header, Sec-Ch-Ua-Mobile header, User-Agent Parameteruser-agent header, sec-ch-ua header, sec-ch-ua-platform header, sec-ch-ua-mobile header, ua-
User CountryGeographical ID, Current country for the usergeoid, _uc-
Browser pluginsJava Enabled, Flash Versionje, fl-
Screen InfoBrowser screen resolution, Viewport sizesr, vp-
Screen ColorsSpecifies the screen color depthsd-
User LanguageBrowser active localeul-

User Agent Parsed (Розбір агента користувача)Скопіюйте посилання на цей розділ

User Agent Architectureuaa-
User Agent Bitnessuab-
User Agent Full Version Listuafvl-
User Agent Mobileuamb-
User Agent Modeluam-
User Agent Platformuap-
User Agent Platform Versionuapv-
User Agent WOW64uaw-

Атрибуція рекламної кампаніїСкопіюйте посилання на цей розділ

Campaign Mediumcm-
Campaign Sourcecs-
Campaign Namecn-
Campaign Contentcc-
Campaign IDci-
Campaign Termck-
Campaign Creative Formatccf-
Campaign Marketing Tacticcmt-
Google Ads IDgclid-
Google Display Ads IDdclid-

Параметри, які збирає Google Analytics 4, час від часу змінюються. Тому потрібно перевіряти свої запити GA4, щоб переконатися, що всі дані користувачів видалені.

Після того, як ви налаштували параметри в Anonimiser і змінили транспортну URL-адресу GA4 на ту, яка містить /anonymize в кінці, ми видалимо або анонімізуємо вказані параметри. 

Після увімкнення Анонімайзера та оновлення транспортної URL-адреси GA4, будь ласка, використовуйте web/sGTM відладчики, консоль та відладчик GA4, щоб перевірити, чи всі необхідні параметри були видалені. 

Вручну видаліть PII з GA4 за допомогою GTMСкопіюйте посилання на цей розділ

1. IP адресаСкопіюйте посилання на цей розділ

Цей метод відносно простий у реалізації, але має певні суперечності. Google має вбудовану функцію видалення останнього байта IP-адреси. Видаляючи попередній байт, ймовірність того, що Google зможе ідентифікувати користувачів, становить 1 до 256. У поєднанні з іншими параметрами IP-адреса дозволяє швидко ідентифікувати конкретну особу.

Дехто вважає, що достатньо обрізати останній октет. Інші вважають, що потрібно взагалі видаляти IP користувача. Моя думка полягає в тому, що краще повністю перевизначити IP користувача. Ніколи не знаєш, чи буде Google повторно використовувати IP.

"Слід зазначити, що онлайн-ідентифікатори, такі як IP-адреси або інформація, що зберігається в файлах cookie, зазвичай можуть використовуватися для ідентифікації користувача, особливо в поєднанні з іншими подібними типами інформації. Це ілюструється ст. 30 GDPR, згідно з якою присвоєння онлайн-ідентифікаторів, таких як IP-адреси та ідентифікатори файлів cookie, фізичним особам або їх пристроям може "залишати сліди, які, зокрема, у поєднанні з унікальними ідентифікаторами та іншою інформацією, отриманою серверами, можуть бути використані для створення профілів фізичних осіб та їх ідентифікації".

Ось що говорить CNIL (французький регулятор) про ІP

Щоб видалити IP користувача, я використав тег server GA4 і встановив ip_override на випадковий IP.

remove user IP

2. Ідентифікатори користувачівСкопіюйте посилання на цей розділ

Google присвоює парі пристроїв браузера унікальний ідентифікатор клієнта і використовує його для ідентифікації, коли той самий користувач повторно відвідує ваш сайт. Цей параметр необхідно видалити або псевдоанонімізувати перед відправкою в GA4.

" Для забезпечення ефективної псевдонімізації алгоритм, що здійснює заміну, повинен забезпечувати достатній рівень колізійності (тобто достатню ймовірність того, що два різних ідентифікатора після хешування дадуть ідентичний результат) і включати компонент, що змінюється в часі (додавання до хешованих даних значення, яке змінюється в часі, так що результат хешування не завжди буде однаковим для одного і того ж ідентифікатора)".

Ось що говорить CNIL про ідентифікацію клієнта.

Існує безліч підходів до анонімізації ідентифікаторів клієнтів, все залежить від вашої уяви та набору інструментів, які ви використовуєте. Але переконайтеся, що ідентифікатор клієнта є унікальним і що ви додали компонент, який змінюється в часі.

Можна використовувати хеш агента користувача, IP, випадкову числову змінну GTM тощо. На відміну від IP користувача, ми не знайшли способу відредагувати ідентифікатор клієнта на стороні сервера, тому зробили це на стороні клієнта.

hash client ID
rewrite client ID

Після того, як ви анонімізували ідентифікатор клієнта Google Analytics, ви можете замінити файли cookie GA4 новими значеннями, щоб гарантувати, що GA4 не встановлює жодних ідентифікаторів користувачів. Для цього я використовував шаблон тегу Cookie Monster для серверного контейнера GTM. Все, що вам потрібно зробити, це додати імена і значення файлів cookie. як тільки це буде зроблено, не забудьте скористатися консоллю і перевірити файли cookie, які встановлює GA.

override google analytics cookies

Після того, як ви відредагуєте ідентифікатор клієнта, це суттєво вплине на звітність GA4. Оскільки ідентифікатор клієнта буде унікальним, GA не зможе визначити, чи є він новим відвідувачем або відвідувачем, що повернувся. А також багатоканальну атрибуцію та події, такі як початок сесії, перший візит тощо.

3. Зовнішній рефералСкопіюйте посилання на цей розділ

Зовнішній реферер призначений для того, щоб визначити, як користувач потрапив на ваш сайт. Чи був це органічний, платний або, можливо, соціальний трафік.

Для видалення слід переписати page_referrer.

remove external referrer

4. Параметри, що містяться в зібраних URL-адресахСкопіюйте посилання на цей розділ

Основне призначення параметрів в URL-адресі - визначення походження рекламних кампаній. Параметрами URL можуть бути utm_souce, utm_medium, різні типи ідентифікаторів кліків тощо. Крім того, деякі платформи автоматично вставляють в URL-адресу дані користувача.

Для видалення параметрів URL-адреси необхідно переписати URL-адресу сторінки. Кілька змінних в галереї веб-шаблонів GTM можуть допомогти вам у цьому. Я використовував Trim Query. Вам просто потрібно вказати blocklist або allowlist параметрів запиту, який зробить всю магію за вас.

remove URL parameters GA4

5. Інформація, яка може бути використана для формування відбитка пальцяСкопіюйте посилання на цей розділ

Такою інформацією може бути агент користувача, пристрій, браузер, роздільна здатність екрану, мова, операційна система тощо. Переконайтеся, що ви відредагували всю інформацію, яка може бути використана для зняття відбитків пальців.

remove data that can be used to generate fingerprint

6. Будь-які постійні або крос-сайтові ідентифікаториСкопіюйте посилання на цей розділ

Переконайтеся, що ви не використовуєте міжсайтових ідентифікаторів, таких як ідентифікатор користувача або ідентифікатор CRM.

7. Будь-які інші дані, які можуть призвести до повторної ідентифікаціїСкопіюйте посилання на цей розділ

Цю частину трохи важко зрозуміти, але я пропоную перевірити запит, який ваш контейнер sGTM надсилає до GA, і переконатися, що в ньому немає параметрів, які можуть бути використані для повторної ідентифікації користувача.

Як перевірити анонімізаціюСкопіюйте посилання на цей розділ

Є кілька способів перевірити, чи всі необхідні дані були видалені або псевдонімізовані. Спочатку потрібно зайти в налагоджувач GTM сервера і подивитися вихідні запити GA4. Переконайтеся, що ви тестуєте різні сценарії, коли є параметри користувача проти відсутності параметрів користувача, параметри URL, різні події, реферали тощо. 

test GA4 user data anonimisation

Другий спосіб - скористатися відладчиком Google Analytics 4 і подивитися, які дані обробляє GA4. 

test GA4 user data anonymisation GA4 debugger

Висновок:Скопіюйте посилання на цей розділ

Не лише Google збирає дані користувачів з ЄС та передає їх до США, чим порушує GDPR. Багато компаній роками збирали персональні дані європейців, і тепер, схоже, їхня практика буде обмежена повсюдно у відповідь на деактивацію Privacy Shield та рішення про те, що передача даних користувачів з ЄС до США є незаконною відповідно до GDPR.

Якщо ви є власником веб-сайту в Європейському Союзі, настав час почати змінювати дані, якими ви ділитеся з американськими компаніями, інакше ви можете наразитися на ризик бути оштрафованим регуляторними органами.

Найпоширеніші запитанняСкопіюйте посилання на цей розділ

1. Як використовувати проксі-сервер для GA при реалізації через gtag.js?

Якщо ви використовуєте gtag.js на своєму сайті для відправки подій в серверний контейнер, ви можете додати параметр transport_url до існуючого тегу:

gtag('config', 'TARGET-ID', {

'transport_url': 'https://analytics.example.com',

'first_party_collection': true,

});

Ви можете використовувати URL-адресу анонімайзера для анонімізації даних користувача в GA, якщо це реалізовано через gtag.js. Припустимо, ви використовуєте stape-анонімайзер і ваша URL-адреса анонімайзера - https://sgtm.site.com/anonymize. Вам просто потрібно додати https://sgtm.site.com/anonymize в якості транспортного URL-адреси в gtag config.

Теги:sGTM tag

Схожі пости

Оновлено 14 трав. 2024 р.

Як налаштувати відстеження GA4 за допомогою серверного контейнера Google Tag Manager

У цій статті я опишу переваги використання серверних тегів GA4 і GTM. Ви можете використовувати його як покроковий гайд із надсилання подій до GA4 через серверний контейнер GTM. Що стосується електронної комерції/розширеної електронної комерції, я розповім про це в іншій статті.

Оновлено 14 трав. 2024 р.

Як налаштувати серверний контейнер в Google Tag Manager

Збір даних про відвідувачів вашого веб-сайту має вирішальне значення для аналізу та покращення присутності бізнесу в Інтернеті, охоплення користувачів і перетворення їх у клієнтів. Однак збір даних стає все більш проблематичним через інтелектуальне запобігання відстеження, блокування реклами та скорочення терміну служби файлів cookie. Google Analytics та інші подібні інструменти почнуть бачити менше даних про відвідувачів вашого веб-сайту та надаватимуть менше інформації для аналізу.

Оновлено 8 верес. 2022 р.

ЄС-проксі-сервер для sGTM або як використовувати Google Analytics у спосіб, сумісний із GDPR

Дізнайтеся більше про те, як використовувати Google Analytics у спосіб, сумісний із GDPR, із нашим новим європейським сервером.

Розмістіть свій сервер GTM на Stape