group by(2)
-
데이터 샘플링 VS GROUP BY 조회 성능 비교
우리 회사의 경우, 데이터를 보여주는 방식은 크게 아래 2가지 방식이다. 모든 데이터를 그냥 화면에 보여준다. 모든 데이터를 특정기준으로 GROUP BY 해서 평균을 보여준다. 모든 데이터를 뿌리는 경우 데이터의 양이 적으면 성능에 큰 문제가 발생하지 않지만, 데이터의 양이 늘어나게 되면 화면이 무거워져 사용자의 편의성이 떨어진다. 모든 데이터를 특정기준으로 GROUP BY 해서 평균 [1. 모든 데이터를 뿌리는 경우]의 성능에 문제가 발생하면, 거의 모든 튜닝이 “GROUP BY 해서 뿌려주는 데이터를 줄이자” 방식으로 진입한다. 하지만, 이 경우, 바람직한 방식이 아니다. 이유는 데이터를 스캔하는 범위는 여전히 똑같고, 거기에 연산 작업이 추가되기 때문에 데이터를 조회하는 성능이 저하된다. “GROU..
2024.02.15 -
mongodb group by 샘플
1. 몽고디비 그룹바이 문법 $group 파이프라인 연산자는 MongoDB에서 집계(aggregate)를 수행하는데 사용됩니다. 이 연산자는 문서들을 그룹화하고 그룹화된 문서들의 합계, 평균, 최대, 최소 등의 값을 계산할 수 있습니다. $group 파이프라인 연산자는 다음과 같은 구문을 사용합니다. { $group: { _id: , // 그룹화할 기준 필드 : { : }, ... } } 여기서 _id 필드는 그룹화할 기준 필드를 나타내며, 는 계산된 결과를 저장할 필드를 나타냅니다. 는 계산 방법을 나타내며, 은 계산 대상 필드를 나타냅니다. 예를 들어, 다음은 orders 컬렉션에서 status 필드를 그룹화하고 각 그룹의 합계를 계산하는 쿼리입니다: db.orders.aggregate([ { $gr..
2023.03.09