對于一些數(shù)據(jù)量較大的系統(tǒng),面臨的問題除了是查詢效率低下,還有一個很重要的問題就是插入時間長。我們就有一個業(yè)務系統(tǒng),每天的數(shù)據(jù)導入需要4-5個鐘。這種費時的操作其實是很有風險的,假設程序出了問題,想重跑操作那是一件痛苦的事情。因此,提高大數(shù)據(jù)量系統(tǒng)的MySQL insert效率是很有必要的。
經過對MySQL的測試,發(fā)現(xiàn)一些可以提高insert效率的方法,供大家參考參考。
1、一條SQL語句插入多條數(shù)據(jù)。
常用的插入語句如:
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0', 'userid_0', 'content_0', 0); INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('1', 'userid_1', 'content_1', 1); |
修改成:
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0', 'userid_0', 'content_0', 0), ('1', 'userid_1', 'content_1', 1); |
修改后的插入操作能夠提高程序的插入效率。這里第二種SQL執(zhí)行效率高的主要原因有兩個,一是減少SQL語句解析的操作,只需要解析一次就能進行數(shù)據(jù)的插入操作,二是SQL語句較短,可以減少網(wǎng)絡傳輸?shù)腎O。
這里提供一些測試對比數(shù)據(jù),分別是進行單條數(shù)據(jù)的導入與轉化成一條SQL語句進行導入,分別測試1百、1千、1萬條數(shù)據(jù)記錄。

2、在事物中進行插入處理。
把插入修改成:
START TRANSACTION; INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0', 'userid_0', 'content_0', 0); INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('1', 'userid_1', 'content_1', 1); ... COMMIT; |
使用事物可以提高數(shù)據(jù)的插入效率,這是因為進行一個INSERT操作時,MySQL內部會建立一個事物,在事物內進行真正插入處理。通過使用事物可以減少創(chuàng)建事物的消耗,所有插入都在執(zhí)行后才進行提交操作。
這里也提供了測試對比,分別是不使用事物與使用事物在記錄數(shù)為1百、1千、1萬的情況。

性能測試:
這里提供了同時使用上面兩種方法進行INSERT效率優(yōu)化的測試。即多條數(shù)據(jù)合并為同一個SQL,并且在事物中進行插入。

從測試結果可以看到,insert的效率大概有50倍的提高,這個一個很客觀的數(shù)字。
注意事項:
1、SQL語句是有長度限制,在進行數(shù)據(jù)合并在同一SQL中務必不能超過SQL長度限制,通過max_allowed_packe配置可以修改,默認是1M。
2、事物需要控制大小,事物太大可能會影響執(zhí)行的效率。MySQL有innodb_log_buffer_size配置項,超過這個值會日志會使用磁盤數(shù)據(jù),這時,效率會有所下降。所以比較好的做法是,在事物大小達到配置項數(shù)據(jù)級前進行事物提交。