文章詳情頁
如何提高python查詢速度?
瀏覽:157日期:2022-06-29 18:39:57
問題描述
最近在爬股票的相關新聞,一開始設想的是,當有新的新聞動態發布,程序通過郵件發送最新內容到郵箱。
所以我想把新聞標題,內容存到數據庫里,當內容更新時,把新的內容和數據庫的標題列表對比,看是不是已存在的,如果已存在,那就不發送,如果沒有,那發送到郵箱。
但數量大了以后,列表查詢速度就會變慢,請問各位還有什么方法可以傳授下嗎?
問題解答
回答1:爬蟲任務去重
抓過的鏈接存到一個set中,檢查新鏈接是否在集合中即可。
回答2:去重有很多方法,比如樓上的set或者布隆過濾器都可以有效的使用內存,提升效率
相關文章:
1. mysql - 百萬行的表中是否盡量避免使用update等sql語句?2. shell - Update query wrong in MySQL3. node.js - mysql如何通過knex查詢今天和七天內的匯總數據4. python - 在使用Pycharm時經常看到如下的樣式,小括號里紅色的部分是什么意思呢?5. mysql 插入數值到特定的列一直失敗6. javascript - 豆瓣的這個自適應是怎么做的?7. javascript - 用jsonp抓取qq音樂總是說回調函數沒有定義8. 360瀏覽器與IE瀏覽器有何區別???9. javascript - 新浪微博網頁版的字數限制是怎么做的10. 怎么在網頁中設置圖片進行左右滑動
排行榜
