Bulk insert data operations #10

Mintaka · 2021-03-01T01:06:36Z

Now we store measurement data one row by one.

Does have SQLite ability to store multiple values in one SQL query?
If so, made a code which can do bulk inserts.
Also compare duration of separated insert vs bulk inserts.

lucijim · 2021-03-09T22:47:12Z

pull request #29

koukalka · 2021-03-15T00:38:53Z

Našla jsem pár řešení a jedno z nich se jeví nejslibněji:

příkaz connection.executemany (viz. https://www.codementor.io/@charreleramis24/how-to-handle-bulk-data-insertion-sqlite-python-16xwf6ggu7)
druhý nápad - vytvoří se virtuální tabulka se všemi daty a zavolá se insert do tabulky nové , kde select * from virtuální tabulka (viz https://stackoverflow.com/questions/364017/faster-bulk-inserts-in-sqlite3)
uložení jako pandas dataframe (ale viz diskuze minule, s pandas ještě nepracujeme)

Mintaka · 2021-03-15T08:32:42Z

Testoval jsem generovaní dotazu tak že se nejdřív přidá hlavička
INSERT INTO table VALUES
a pak se přidá řetězec ve kterém jsou poskládané sady hodnot:
(null, val1, val2, val3), (null, val4, val5, val6), (null, val7, val8, val9) ...
a tím se vloží hodně záznamů najednou.

Chtělo by to ještě vyzkoušet, které z těch řešení je nejefektivnější.
Pandas je v našem případě zatím asi kanón na vrabce, ale určitě na něj dojde v samostané/ých lekcích.

lucijim · 2021-03-15T08:57:18Z

Ahoj,

Filipe, já jsem to zkusila předělat na ten způsob, jak popisuješ a funguje to, viz můj pull request.
Ale dělala jsem to před refaktoringem kódu, tak to ještě bude potřeba upravit, kdyžtak se na to večer kouknu.
Pandas je možná teda kanón na vrabce, ale nejefektivnější mi přijde. :) Ale je fakt, že je asi blbost to teď dělat přes pandas, když hodně lidí z kurzu neví,jak funguje, spíš pak možná až proberem pandas, tak ukázat, že to jde přes něj taky.

Mintaka · 2021-03-15T09:14:53Z

Refaktoring by měl být jednoduchý.

Ve funkci insert_csv2db jsou všechna potřebná data k dispozic.
Samotnou část, kdy se z csv vytahují jednotlivé řádky a skládají se do řetězce by možná bylo dobré dát do samostatné funkce, která by vracela už jeden kompletní řetězec s daty.

To řešení s Pandas s jeho velmi stručným představením by mohlo být na kurzu představeno.

lucijim · 2021-03-15T09:22:14Z

OK, díky, tak já na to večer mrknu.

Mintaka · 2021-03-15T09:28:52Z

Jasan, uvidíš, jak budeš mít prostor a chuť.

lucijim linked a pull request Mar 9, 2021 that will close this issue

bulk insert - data from each csv inserted in one insert statement to SQLite #29

Closed

Mintaka added the performance improvement label Mar 10, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Bulk insert data operations #10

Bulk insert data operations #10

Mintaka commented Mar 1, 2021

lucijim commented Mar 9, 2021

koukalka commented Mar 15, 2021

Mintaka commented Mar 15, 2021 •

edited

Loading

lucijim commented Mar 15, 2021

Mintaka commented Mar 15, 2021

lucijim commented Mar 15, 2021

Mintaka commented Mar 15, 2021

Bulk insert data operations #10

Bulk insert data operations #10

Comments

Mintaka commented Mar 1, 2021

lucijim commented Mar 9, 2021

koukalka commented Mar 15, 2021

Mintaka commented Mar 15, 2021 • edited Loading

lucijim commented Mar 15, 2021

Mintaka commented Mar 15, 2021

lucijim commented Mar 15, 2021

Mintaka commented Mar 15, 2021

Mintaka commented Mar 15, 2021 •

edited

Loading