Existem basicamente dois tipos de dado no GA4: métricas e dimensões.
Métricas são números, e portanto, podem sofrer cálculos. Exemplos: sessões, transações, receita.
Dimensões são dados em formato de texto. Exemplos: categoria de dispositivo, cidade. São dados que utilizamos para fazer uma quebra da métrica (como sessões por categoria de dispositivo).
Precisamos levar em conta que, quando acessamos um relatório dentro da interface do GA4, via API ou via Looker Studio, não estamos acessando diretamente a tabela onde os dados foram armazenados a partir da coleta.
Para não gerar um excesso de consumo de computação, o Google prepara periodicamente algumas tabelas que possuem os dados dos principais relatórios do GA4. Essas tabelas não são o dado original, mas sim uma síntese dele. Uma forma de entender melhor é imaginar uma tabela dinâmica feita a partir de uma planilha com os dados brutos. Você só tem acesso (pela interface ou api) a tabela dinâmica.
Devemos lembrar que o GA é uma ferramenta gratuita e o Google não quer ter esse custo de processamento de dados sem que o cliente pague nada por isso.
Acontece que, uma dimensão de alta cardinalidade ocorre quando temos um campo que pode assumir muitos valores. Exemplo: url de página, ID de usuário.
Campos assim podem conter milhares e milhares de valores possíveis. Logo, se você tem esses tipos de dado, sua “tabela dinâmica” começa a apresentar um número excessivo de linhas.
As tabelas que alimentam a interface do GA4, via API ou Looker Studio, tem um limite de linhas. E a partir desse limite o Google começa a jogar tudo em uma categoria chamada “other”.
Não é que o dado foi coletado de maneira errada, ele está certinho, mas lá no banco de dados original. Nas tabelas que você acessa via interface ou API é que ele está limitado. Deu pra entender até aqui?
Então, como resolver?
Felizmente o GA4 possui um recurso para contornar o problema: exportação dos dados brutos para o Google BigQuery. Até um milhão de eventos por dia você consegue exportar no plano gratuito do GA. Algo que era possível apenas no plano 360 do GA3.
Empresas com um certo nível de investimento em Marketing devem considerar a manutenção de um processo de tratamento de dados de marketing digital no Google BigQuery.
E daí surge a necessidade de entender a estrutura de dados presente nessa tabela do GBQ no GA4.