På dette webinar præsenterer Christian Thomsen igangværende forskning, der har ledt til ModelarDB, der er et open source, SQL-baseret system udviklet af forskere på Aalborg Universitet til håndtering af meget store mængder tidsseriedata.
Mange installationer, f.eks. vindmøller, har adskillige sensorer, som genererer så meget højfrekvent data, at det i dag er dyrt og besværligt at gemme alt data. ModelarDB komprimerer tidsseriedata vha. "modeller". Med ModelarDB kan brugeren vælge, om komprimeringen skal være tabsfri, så data kan genskabes eksakt, eller genskabte værdier må afvige inden for en brugerbestemt fejlgrænse, f.eks. 0,1%. Eksperimenter med vindmølledata viser, at ModelarDB komprimerer bedre end populære løsninger som ORC, Parquet og IoTDB, også når fejlgrænsen er 0. Hvis man tillader en fejlgrænse på 0.01%, forbedres komprimeringen, så ModelarDB komprimerer dobbelt så godt som ORC, og med en fejlgrænse på 5% er ModelarDBs komprimering mere end 29 gange bedre end ORCs.
Målgruppe
Webinaret henvender sig til alle med interesse for håndtering af store mængder tidsseriedata, uanset teknisk niveau.

Om Christian Thomsen
Christian Thomsen er lektor ved Institut for Datalogi på Aalborg Universitet, hvor han er med i følgende forskningsgrupper: ”Data Engineering, Science and Systems” og ”Daisy – Center for Data intensive systemer”.
Desuden er Christian Thomsen fast tilknyttet masteruddannelsen i it, hvor man kan opleve ham som underviser efter nytår på fagpakken Business Intelligence: Analyse af store databaser. Tidligere har han undervist på fagpakken Data Science og Big Data.