java - mysql單表流水500W數據多維度統計的方案
問題描述
現在項目中有張流水表結構大概如下id sdkVersion jarVersion countryCode imei createTime
以前的需求是按sdkVersion,jarVersion,countryCode的分組求總數和imei排重后的總數,大致sql如下:
select sdkVersion,jarVersion,countryCode,count(*),count(distinct imei) from xxx where createTime = ’xxxx-xx-xx’group by sdkVersion,jarVersion,countryCode
查出前一天的所有數據然后匯總到一張表里,結構大概如下
id sdkVersion jarVersion countryCode count(*) count(distinct imei) createTime
然后現在的需求是要任意緯度的組合查詢,就是可以group by sdkVersiongroup by jarVersiongroup by countryCodegroup by sdkVersion,countryCode等等各種組合,如果按以前的每日匯總方案的話就要為不同的緯度組合建立很多個表,有什么好的方案可以解決這種問題?或者是用專門的統計框架可以解決的?
問題解答
回答1:樓主可以去看看PipelineDB流式數據庫
回答2:apache kylin, 亞秒級olap
回答3:每日匯總的話,實時性要求并不高,500W 記錄也還在可以處理的范圍內,視圖 + 定時計劃,可以滿足要求,不需要建多表。題主最好能說明一下有什么瓶頸或者痛點,畢竟 mysql 是個成熟產品,換用新銳技術有一定風險。
回答4:寫存儲過程,每天定時跑就行了
相關文章:
1. mysql儲存json錯誤2. sql語句 - 如何在mysql中批量添加用戶?3. 怎么php怎么通過數組顯示sql查詢結果呢,查詢結果有多條,如圖。4. mysql - 表名稱前綴到底有啥用?5. 編輯成功不顯示彈窗6. 哭遼 求大佬解答 控制器的join方法怎么轉模型方法7. 在mybatis使用mysql的ON DUPLICATE KEY UPDATE語法實現存在即更新應該使用哪個標簽?8. mysql - 數據庫表中,兩個表互為外鍵參考如何解決9. mysql - 怎么生成這個sql表?10. Navicat for mysql 中以json格式儲存的數據存在大量反斜杠,如何去除?
