Summary: | Buildings account for a large part of the total energy demand in the world. The building energy demand increases every year and space cooling is the main contributor for this increase. In order to create a sustainable global energy system it is therefore of great importance to improve the energy efficiency in buildings. Cooling load predictions are an essential part of improving the building energy efficiency. The widespread use of Building Automation Systems (BAS) in modern buildings makes it possible to use data-driven methods for such predictions. The purpose of this study is twofold: to compare the performance of five different machine learning algorithms by analyzing their accuracy and robustness; and to examine what effect different versions of a data set have on these algorithms. The data that is used in this study is one-year operational data from a building in the city of Shenzhen in China. This data set is engineered in multiple different ways and is used to test the algorithms. This study show that the predictive accuracy of machine learning models can be improved by introducing time-lag variables into the data set, especially if the original data set is very low-dimensional. It is also shown that some algorithms benefit from a binary representation of calendar variables instead a decimal representation. All algorithms in this study show quite similar results which suggests that they are all capable of capturing the relationships in the data. The accuracy of all models that are developed in this study are considered good enough for engineering purposes. === Byggnader står för en stor del av världens totala energibehov. Byggnaders energibehov ökar varje år och den största bidragande faktorn är det ökade behovet av energi för nedkylning av byggnader. För att skapa ett hållbart globalt energisystem är det viktigt att förbättra energianvändningen i byggnader. Att uppskatta köldbelastningen i byggnader är en nödvändig del för att i nästa steg kunna förbättra energieffektiviteten i byggnader. Den breda användningen av automationssystem i moderna byggnader (BAS) gör det möjligt att använda data-baserade metoder för sådana uppskattningar. Syftet med den här studien är dels att jämföra hur fem olika maskininlärningsalgoritmer fungerar genom att analysera hur noggranna och robusta de är, dels att undersöka vilken effekt olika versioner av ett dataset har på dessa algoritmer. Datan som används i denna studie är ett års operativ data från en byggnad i Shenzhen i Kina. Detta dataset modifieras på ett antal olika sätt och används för att pröva algoritmerna. Den här studien visar att noggrannheten i maskininlärningsmodellerna kan förbättras genom att skapa tidslaggade variabler i datasetet, speciellt om det ursprungliga datasetet har en låg dimension. Studien visar även att vissa algoritmer fungerar bättre med en binär representation av kalendervariabler än en decimal representation. Alla algoritmer i den här studien visar likande resultat vilket tyder på att de alla kan fånga sambanden i datan. Noggrannheten i alla modellerna i studien visar sig vara tillräckligt bra med ingenjörsmässig noggrannhet.
|