文章詳情頁
python - 對大面積空值的數據預處理是怎么進行的?
瀏覽:81日期:2022-07-16 18:28:14
問題描述
對于缺失值基本有刪除、填充和重構變量等做法,但是具體的操作是怎么進行的呢?比方說你當你并不清楚各個字段的含義時:
1.如何認定該字段與模型無關、缺失值的比例達到多少就可以刪除?
2.什么時候會認為缺失值也是一種有用的狀態?
3.什么時候需要進行數據填充?
問題解答
回答1:方法還是挺多的。我找到幾個鏈接,附在下面,應該對你有幫助。
訓練集中有的特征含有缺失值,一般怎么處理如何判斷缺失值是否是隨機的缺失?
回答2:請問怎麼用。
相關文章:
1. 數據庫 - 使用讀寫分離后, MySQL主從復制延遲會導致讀不到數據嗎?2. javascript - 為什么js代碼后面報錯,會導致前面的代碼執行不了,我確定后面的部分和前面的部分沒有邏輯上的關聯。3. python如何設置一個隨著系統時間變化的動態變量?4. docker gitlab 如何git clone?5. docker images顯示的鏡像過多,狗眼被亮瞎了,怎么辦?6. 個人主頁博客統計中的“進入博客”不能點擊7. 就一臺服務器,mysql數據庫想實現自動備份,如何設計?8. mysql 5個left關鍵 然后再用搜索條件 幾千條數據就會卡,如何解決呢9. .......10. 請問一下,圖片上傳成功,但是后臺對應文件夾里面卻沒有圖片,這是什么原因?(已部署到服務器)
排行榜
