전체 글 35

빅쿼리에서 REGEXP_EXTRACT 함수로 URL 요소 추출하기

데이터를 분석하면서 정규식의 요소를 외우기는 힘들지만 대신 알고있으면 분석하고 전처리하는데 매우 유용한 것이 바로 정규식입니다. 오늘은 url과 같은 컬럼을 정규식을 활용해서 특정 요소를 추출하는 과정을 정리해보려고 합니다. 요 정규식을 알고있으면 GTM에서 불필요한 이벤트를 굳이 추가할 필요가 없을 것 같기도 합니다. * REGEXP_EXTRACT 함수 regexp_extract(page_location, r'정규식입력') url과 같은 데이터를 전처리하기 위해서는 위 함수에서 첫 번째 value에는 url과 관련된 컬럼을 넣어주시고 두 번째 요소에는 정규식을 입력해주면 됩니다. 그리고 정규식입력하는 value에서 ()를 사용하면 캡쳐링 그룹이라고해서 ()사이에 있는 값을 추출합니다. 제 블로그의 GA..

자주 사용하는 빅쿼리 GA4 데이터 스키마

GA4 데이터를 빅쿼리에서 분석하기 위해서는 기본적인 데이터 형식과 스키마를 알아야 합니다. 간단하게 얘기하면 어떤 데이터가 들어오는지 체크해야합니다. 업무를 하면서 자주 사용하는 스키마를 정리해보려고 합니다. * BigQuery Export 스키마 1. event 필드 이름 데이터 유형 설명 event_timestamp 정수 클라이언트에서 이벤트가 기록된 시간(단위 : 마이크로초, UTC) event_date 문자열 이벤트가 기록된 날짜(앱에 등록된 시간대의 YYYYMMDD 형식) event_params.key 문자열 이벤트 매개변수의 이름 event_params.string_value 문자열 이벤트 매개변수가 URL이나 캠페인 이름과 같은 문자열로 표시되면 이 필드에 채워집니다. event_param..

빅쿼리 GA4 페이지뷰 테이블 만들기

빅쿼리에서 테이블 만드는 내용을 정리하려고 합니다. GA4 데이터를 빅쿼리랑 연동하여 데이터를 분석하면 모든 이벤트 데이터들이 들어오고 특정 이벤트들만 볼 수 있게 테이블을 따로 만들어서 분석을 해볼 수도 있습니다. 이렇게 특정 이벤트 별로 테이블을 만들어서 분석하면 GA4 로우테이블에서 계속해서 분석하는 것보다 쿼리 비용도 크게 절약된다고 알고 있습니다. 오늘은 특정페이지의 페이지뷰 이벤트를 적재하는 테이블을 만드는 과정을 정리해보았습니다. 상세페이지의 페이지뷰 이벤트를 적재하는 테이블을 만들어보겠습니다. * 빅쿼리 테이블 만드는 쿼리(구문) -- 빅쿼리 테이블 만드는 기본 쿼리 create or replace table `myproject.데이터세트이름.테이블이름` as ~ 먼저 위 블록에 있는 코드..

GA4 빅쿼리와 연동하기

최근에 이직을 하게 되면서 현 직장에서 그로스 마케터로 근무하고 있습니다. 웹 기반의 서비스를 운영하는 회사이고 구글애널리틱스(GA4)를 통해 웹로그를 분석하고 있는데 GA4 보고서를 통해 살펴보지 않고 빅쿼리로 분석하고 빅쿼리 데이터셋으로 대시보드를 만들어서 분석을 하고 있었습니다. 그래서 빅쿼리에 대해서 계속 공부를 하고 있는데 그래도 SQL에 대해서는 어느정도 공부를 하고 이직했지만 연습용 데이터로 분석하는 것과 실제 데이터 분석하는 것에는 큰 차이가 있더라구요^^ 빅쿼리 및 웹로그 데이터 분석에 대한 공부 내용을 오랜만에 블로그에 남겨보려고 합니다. 먼저 GA4와 빅쿼리 연동하는 내용에 대해서 정리해보려고 합니다. 먼저 GA4 데이터를 빅쿼리로 연동하여 좋았던 점을 얘기하자면, * GA4 데이터를..

[해커랭크] MySQL PERCENT_RANK - Weather Observation Station 20

Weather Observation Station 20 | HackerRank Query the median of Northern Latitudes in STATION and round to 4 decimal places. www.hackerrank.com LAT_N 값 중에서 중앙값(Median)을 찾는 문제입니다. 문제) A median is defined as a number separating the higher half of a data set from the lower half. Query the median of the Northern Latitudes (LAT_N) from STATION and round your answer to 4 decimal places. 이번 문제는 WINDOW ..

[해커랭크] MySQL JOIN - New Companies

New Companies | HackerRank Find total number of employees. www.hackerrank.com 이번 문제는 JOIN과 계산함수를 활용하는 문제입니다. Amber's conglomerate corporation just acquired some new companies. Each of the companies follows this hierarchy: Given the table schemas below, write a query to print the company_code, founder name, total number of lead managers, total number of senior managers, total number of managers, ..

[해커랭크] MySQL - Binary Tree Nodes

Binary Tree Nodes | HackerRank Write a query to find the node type of BST ordered by the value of the node. www.hackerrank.com 이번 문제는 이진 트리와 관련된 문제를 푸는 쿼리입니다. 문제) You are given a table, BST, containing two columns: N and P, where N represents the value of a node in Binary Tree, and P is the parent of N. Write a query to find the node type of Binary Tree ordered by the value of the node. Output o..

[해커랭크] MySQL TRNCATE 함수 - Weather Observation Station 14

Weather Observation Station 14 | HackerRank Query the greatest value of the Northern Latitudes from STATION that are under 137.2345 and truncated to 4 decimal places. www.hackerrank.com 137.2345 보다 낮은 북위도 중 가장 큰 값을 찾는 쿼리를 출력하는 문제입니다. 문제) Query the greatest value of the Northern Latitudes (LAT_N) from STATION that is less than 137.2345. Truncate your answer to decimal places. 그리고 소수점을 4자리 밑으로는 제외..

[해커랭크] MySQL WHERE절 서브쿼리 - Top Earners

Top Earners | HackerRank Find the maximum amount of money earned by any employee, as well as the number of top earners (people who have earned this amount). www.hackerrank.com 이번 문제는 그 동안 급여를 가장 많이 받은 급여의 금액과 몇 명이 받았는지 출력하는 문제입니다. 총 급여는 salary x month로 정의하고 (각 직원의 급여와 재직 개월 수) 총 급여를 구합니다. 문제) We define an employee's total earnings to be their monthly salary x months worked, and the maximum total..

카테고리 없음 2023.09.11