講解SQL Server海量數(shù)據(jù)導(dǎo)入的最快方法
這篇論壇文章(賽迪網(wǎng)技術(shù)社區(qū))詳細講解了SQL Server海量數(shù)據(jù)導(dǎo)入的最快方法,更多內(nèi)容請參考下文:
最近做某項目的數(shù)據(jù)庫分析,要實現(xiàn)對海量數(shù)據(jù)的導(dǎo)入問題,就是最多把200萬條數(shù)據(jù)一次導(dǎo)入sqlserver中,如果使用普通的insert語句進行寫出的話,恐怕沒個把小時完不成任務(wù),先是考慮使用bcp,但這是基于命令行的,對用戶來說友好性太差,實際不大可能使用;最后決定使用BULK INSERT語句實現(xiàn),BULK INSERT也可以實現(xiàn)大數(shù)據(jù)量的導(dǎo)入,而且可以通過編程實現(xiàn),界面可以做的非常友好,它的速度也很高:導(dǎo)入100萬條數(shù)據(jù)不到20秒中,在速度上恐怕無出其右者。
但是使用這種方式也有它的幾個缺點:
1.需要獨占接受數(shù)據(jù)的表
2.會產(chǎn)生大量的日志
3.從中取數(shù)據(jù)的文件有格式限制
但相對于它的速度來說,這些缺點都是可以克服的,而且你如果愿意犧牲一點速度的話,還可以做更精確的控制,甚至可以控制每一行的插入。
對與產(chǎn)生占用大量空間的日志的情況,我們可以采取在導(dǎo)入前動態(tài)更改數(shù)據(jù)庫的日志方式為大容量日志記錄恢復(fù)模式,這樣就不會記錄日志了,導(dǎo)入結(jié)束后再恢復(fù)原來的數(shù)據(jù)庫日志記錄方式。
具體的一個語句我們可以這樣寫:
alter database taxi
set RECOVERY BULK_LOGGED
BULK INSERT taxi..detail FROM 'e:out.txt'
WITH (
?? DATAFILETYPE = 'char',
?? FIELDTERMINATOR = ',',
?? ROWTERMINATOR = 'n',
?TABLOCK
)
alter database taxi
set RECOVERY FULL
這個語句將從e:out.txt導(dǎo)出數(shù)據(jù)文件到數(shù)據(jù)庫taxi的detail表中。
