BigQuery로 GA4 데이터 사용하기(2)

BigQuery를 이용하여 GA4 데이터를 사용하는 방법에 대해서 알아보기(2)

2022-05-26 01:51

2,401 views

이번 글에서는 지난 글에서 예고하였듯이 BigQuery를 간단히 사용하여 GA4의 Sessions, Total users, New users를 구해보려고 합니다.

BigQuery에 있는 데이터를 활용할 때는 기존의 RDBS에서 사용하던 Query문을 그대로 사용합니다.

"그래서 Query문이 뭐야?"

라는 질문을 하실 분들이 있을 거라고 생각이 듭니다.

벌써부터 너무 힘들어 하지 않으셔도 됩니다.

왜냐면 저희는 GA4의 데이터를 활용하기 위해 많은 Query문의 문법들 중에서도 'SELECT' 문법만 사용할 예정입니다.

SELECT 는 단어 그대로 데이터를 불러오는 쿼리문 입니다.

가장 기본적인 구조는 ' SELECT 컬럼명 FROM 테이블명' 이고 '테이블명' 에 해당하는 '컬럼명'의 데이터를 불러오는 구문 입니다.

모든 컬럼을 불러오고 싶을 때는 '컬럼 명' 부분에 '*'을 넣으시면 됩니다.

한번 같이 살펴볼까요

bigquery-select-1

위 query문이 무엇을 의미할까요?

'컬럼 명' 부분에 '*'이 들어가 있기 때문에 모든 컬럼을 불러온다는 뜻이고

'테이블 명' 부분에는 테이블의 이름이 들어가 있습니다.

뒤에 'LIMIT 3' 은 3개의 행만 가져오라고 제한을 하는 것 입니다.

결과를 확인해보겠습니다.

bigquery-result-1

이렇게 GA4에서 제공해주는 모든 데이터를 확인할 수 있습니다.

어느정도 query문이 눈에 들어올 거라고 생각하고

이제는 앞에서 구하고자 했던 Sessions, Total users, New users 를 구하고자 합니다.

bigquery-select-2

SELECT 부분에 count, case, distinct 등 처음 보는 것들이 막 등장합니다.

이번 글은 BigQuery로 GA4 데이터를 어떤 식으로 사용하는지 소개하는 글이기 때문에 Query문의 자세한 내용은 추후 다른 글에서 작성하도록 하겠습니다

bigquery-result-2

query문을 실행시킨 결과입니다.

GA4 데이터와 일치하는지 한번 확인해볼까요?

ga4-users-data

GA4데이터와 정확하게 일치하는 것을 확인할 수 있습니다.

결론

BigQuery에서는 앞서 소개 드린 것 뿐 아니라 모든 row data를 추출할 수 있기 때문에 SQL을 조금만 다룰 줄 안다면 뽑아낼 수 있는 지표가 굉장히 많습니다.

또 기존에 사용되던 GA360의 가장 고질적인 문제는 데이터 처리속도가 느려도 너무 느린 부분 이였지만 BigQuery를 활용하여 많은 데이터도 병렬처리가 가능합니다.

플러스제로에서는 BigQuery를 활용하여 다양한 데이터를 처리하고 있어 앞으로 소개 드릴 내용이 많을 듯 합니다.

뒤이어 올라오게 될 글, 그리고 저희 팀을 비롯한 각자의 자리에서 빛내고 있는 구성원들의 다른 글에도 많은 관심 부탁드립니다.

감사합니다.



다음글 - 빅쿼리 권한 부여하기
이전글 - BigQuery로 GA4 데이터 사용하기(1)