Извлекаем "page_path" из URL

Событие "page_location" в GA4 содержит полный URL-адрес страницы, включая любые параметры запроса.

Чтобы сделать его более понятным и полезным в отчетах, можно избавиться от лишнего, типа протокола, хоста.

Для этого мы будем использовать регулярные выражения. Понять как они работают можно в нашей статье о регулярных выражениях

SELECT
--- Пишем регулярное выражение, которое в два этапа преобразует наш URL 
  REGEXP_REPLACE( REGEXP_REPLACE( (
--- Извлекаем из события "page_location" значение (саму ссылку)
      SELECT
        param.value.string_value
      FROM
        UNNEST(event_params) AS param
      WHERE
        param.key = 'page_location' ), r'^https?://[^/]+', '' ), r'[\?].*', '' ) AS page_path
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_*`
WHERE
  _TABLE_SUFFIX BETWEEN '20210101' AND '20210131'
Результат
В дальнейшем мы можем добавлять этот запрос к основному что увидеть не только путь, а и количественные данные типа конверсий, времени на странице и т.д.
Made on
Tilda