Metodologia para seleção de algoritmo de aprendizagem de máquina para estudos de controle centrado no usuário de edificações

Título principal
Metodologia para seleção de algoritmo de aprendizagem de máquina para estudos de controle centrado no usuário de edificações [recurso eletrônico] / Thayane Lodote Bilésimo ; orientador, Enedir Ghisi
Data de publicação
2024
Descrição física
130 p. : il.
Nota
Disponível somente em versão on-line.
Tese (doutorado) – Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Civil, Florianópolis, 2024.
Inclui referências.

Assunto
Engenharia civil
Aprendizagem de máquina
Algorítmos
Edificação
Responsabilidade
Bilésimo, Thayane Lodete
Ghisi, Enedir
Universidade Federal de Santa Catarina. Programa de Pós-Graduação em Engenharia Civil
Idioma
Português

Versão integral em pdf

O atual cenário do setor de edificações requer novas estratégias de eficiência energética, que sejam capazes de identificar e proporcionar aos usuários um ambiente confortável segundo sua percepção. A aprendizagem de máquina – método de análise de dados capaz de identificar padrões e realizar inferências é uma alternativa para identificação das preferências dos usuários e controle dos sistemas das edificações, especialmente os de climatização e iluminação. A aprendizagem supervisionada é a abordagem mais usada, pois permite classificar condições ambientais em termos de conforto. No entanto, é importante identificar o algoritmo capaz de realizar inferências mais assertivas e de se adaptar às variações de preferências dos usuários das edificações ao longo do tempo. Neste sentido, o objetivo deste trabalho é propor um método para comparar o desempenho de diferentes algoritmos de aprendizagem supervisionada. O método deve permitir a identificação do algoritmo mais adequado para ser usado em estudos de sistemas de controle centrados no usuário. Para avaliar o desempenho dos algoritmos em cenários realistas, dados de ocupação, iluminância, temperatura, estado das aberturas e do sistema de iluminação artificial foram coletados durante oito meses, entre junho de 2022 e fevereiro de 2023, em um laboratório da Universidade Federal de Santa Catarina. Os dados foram pré-processados e agrupados em subconjuntos de 1, 7, 15 e 30 dias. Cada subconjunto foi utilizado no treinamento e teste dos algoritmos Decision Tree, k-Nearest Neighbors, Multilayer Perceptron, Random Forest e Support Vector Machine, visando prever o estado do sistema de iluminação. Os resultados foram comparados estatisticamente e os algoritmos foram avaliados a partir do cálculo da acurácia, precisão e sensibilidade. Inicialmente, identificou-se o subconjunto ideal (em quantidade de dias) para o funcionamento adequado de cada algoritmo. Em seguida, os algoritmos foram comparados. A melhor configuração (algoritmo e quantidade de dias) foi submetida a um processo de otimização. Posteriormente, simulou-se a atualização diária do conjunto de dados, a fim de avaliar o desempenho da configuração otimizada em um cenário realístico. Para o cenário estudado, o melhor resultado foi obtido utilizando o k-Nearest Neighbors e subconjuntos de 7 dias para treino. O algoritmo foi capaz de se adaptar às variações observadas após cada atualização, mesmo com a substituição completa do conjunto inicial de dados. Ao final da análise, acurácia, precisão e sensibilidade foram de 98%, em média. Por fim, pode-se afirmar que o método proposto permitiu comparar e selecionar adequadamente o algoritmo e o subconjunto ideal de dias para prever o estado do sistema de iluminação artificial.

Abstract: The current building sector scenario demands new energy efficiency strategies. They need to be capable of identifying and assuring comfortable environments according to users’ perceptions. Machine learning – a method of data analysis capable of identifying patterns and make predictions – is an alternative to identify users’ preferences and control lighting and heating, ventilation and air-conditioning systems in buildings. Supervised learning is the most common approach because it allows classifying environmental conditions in terms of comfort. However, it is important to identify the algorithms’ capacity of making right predictions and adapting to the change in the preferences of building users over time. This research aims to present a method to assess different supervised learning algorithms. The method must allow the identification of the most accurate algorithms to be used in studies of occupant centered control systems. In order to assess algorithms’ performance in realistic scenarios, the following data were collected: occupancy, illuminance, temperature, and the current state of openings and artificial lighting system. Data were collected for eight months, between June 2022 and February 2023 in a research laboratory of Federal University of Santa Catarina. They were pre-processed and grouped in subsets within 1, 7, 15 and 30 days. Each subset was used in training and testing the following algorithms: Decision Tree, k-Nearest Neighbors, Multilayer Perceptron, Random Forest and Support Vector Machine, in order to predict the state of the lighting system. The results were statistically compared and the performance of the algorithms was assessed using each models’ accuracy, precision and recall. First, the ideal subset to each algorithm (in number of days) was identified. In the next step, algorithms were compared. The best configuration (algorithm and number of days) was submitted to an optimization process. Then, the update of the subset was assessed, aiming to evaluate the optimized algorithm working in a realistic scenario. For this case study, the best results were achieved using the k- Nearest Neighbors and subsets within 7 days for training. The algorithm was able to adapt to changes in users’ patterns and could reach a good performance even after total data substitution. At the end of the analysis, accuracy, precision and recall remained around 98%, in average. Finally, it is possible to affirm that the method proposed allowed to appropriately compare and select the algorithm and the ideal subset to predict the state of the artificial lighting system.

Campo	Ind1	Ind2	Dados
Líder			06697ntm a2200289 a 4500
001 - Número de controle			B000147
003 - Identificador do número de controle			BR-FlWIK
005 - Data e hora da última transação			20260525111625.0
008 - Informações gerais			241014s2024 scba g m 000 0 por d
040 - Fonte da catalogação	#	#	$aBR-FlWIK $bpor $cBR-FlWIK $dBR-FlUSC
090 - Número de chamada local (etiqueta)	#	#	$aCETD $bUFSC $cPECV $d1339
100 - Ponto de acesso principal - Nome pessoal	1	#	$aBilésimo, Thayane Lodete
245 - Indicação de título	1	0	$aMetodologia para seleção de algoritmo de aprendizagem de máquina para estudos de controle centrado no usuário de edificações $h[recurso eletrônico] / $cThayane Lodote Bilésimo ; orientador, Enedir Ghisi
260 - Publicação, distribuição, etc. (Imprenta)	#	#	$c2024.
300 - Descrição física	#	#	$a130 p. : $bil.
500 - Nota geral	#	#	$aDisponível somente em versão on-line.
502 - Nota de dissertação	#	#	$aTese (doutorado) – Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Civil, Florianópolis, 2024.
504 - Nota de bibliografia, etc.	#	#	$aInclui referências.
520 - Resumo, etc.	#	#	$aO atual cenário do setor de edificações requer novas estratégias de eficiência energética, que sejam capazes de identificar e proporcionar aos usuários um ambiente confortável segundo sua percepção. A aprendizagem de máquina – método de análise de dados capaz de identificar padrões e realizar inferências é uma alternativa para identificação das preferências dos usuários e controle dos sistemas das edificações, especialmente os de climatização e iluminação. A aprendizagem supervisionada é a abordagem mais usada, pois permite classificar condições ambientais em termos de conforto. No entanto, é importante identificar o algoritmo capaz de realizar inferências mais assertivas e de se adaptar às variações de preferências dos usuários das edificações ao longo do tempo. Neste sentido, o objetivo deste trabalho é propor um método para comparar o desempenho de diferentes algoritmos de aprendizagem supervisionada. O método deve permitir a identificação do algoritmo mais adequado para ser usado em estudos de sistemas de controle centrados no usuário. Para avaliar o desempenho dos algoritmos em cenários realistas, dados de ocupação, iluminância, temperatura, estado das aberturas e do sistema de iluminação artificial foram coletados durante oito meses, entre junho de 2022 e fevereiro de 2023, em um laboratório da Universidade Federal de Santa Catarina. Os dados foram pré-processados e agrupados em subconjuntos de 1, 7, 15 e 30 dias. Cada subconjunto foi utilizado no treinamento e teste dos algoritmos Decision Tree, k-Nearest Neighbors, Multilayer Perceptron, Random Forest e Support Vector Machine, visando prever o estado do sistema de iluminação. Os resultados foram comparados estatisticamente e os algoritmos foram avaliados a partir do cálculo da acurácia, precisão e sensibilidade. Inicialmente, identificou-se o subconjunto ideal (em quantidade de dias) para o funcionamento adequado de cada algoritmo. Em seguida, os algoritmos foram comparados. A melhor configuração (algoritmo e quantidade de dias) foi submetida a um processo de otimização. Posteriormente, simulou-se a atualização diária do conjunto de dados, a fim de avaliar o desempenho da configuração otimizada em um cenário realístico. Para o cenário estudado, o melhor resultado foi obtido utilizando o k-Nearest Neighbors e subconjuntos de 7 dias para treino. O algoritmo foi capaz de se adaptar às variações observadas após cada atualização, mesmo com a substituição completa do conjunto inicial de dados. Ao final da análise, acurácia, precisão e sensibilidade foram de 98%, em média. Por fim, pode-se afirmar que o método proposto permitiu comparar e selecionar adequadamente o algoritmo e o subconjunto ideal de dias para prever o estado do sistema de iluminação artificial.
520 - Resumo, etc.	8	#	$aAbstract: The current building sector scenario demands new energy efficiency strategies. They need to be capable of identifying and assuring comfortable environments according to users’ perceptions. Machine learning – a method of data analysis capable of identifying patterns and make predictions – is an alternative to identify users’ preferences and control lighting and heating, ventilation and air-conditioning systems in buildings. Supervised learning is the most common approach because it allows classifying environmental conditions in terms of comfort. However, it is important to identify the algorithms’ capacity of making right predictions and adapting to the change in the preferences of building users over time. This research aims to present a method to assess different supervised learning algorithms. The method must allow the identification of the most accurate algorithms to be used in studies of occupant centered control systems. In order to assess algorithms’ performance in realistic scenarios, the following data were collected: occupancy, illuminance, temperature, and the current state of openings and artificial lighting system. Data were collected for eight months, between June 2022 and February 2023 in a research laboratory of Federal University of Santa Catarina. They were pre-processed and grouped in subsets within 1, 7, 15 and 30 days. Each subset was used in training and testing the following algorithms: Decision Tree, k-Nearest Neighbors, Multilayer Perceptron, Random Forest and Support Vector Machine, in order to predict the state of the lighting system. The results were statistically compared and the performance of the algorithms was assessed using each models’ accuracy, precision and recall. First, the ideal subset to each algorithm (in number of days) was identified. In the next step, algorithms were compared. The best configuration (algorithm and number of days) was submitted to an optimization process. Then, the update of the subset was assessed, aiming to evaluate the optimized algorithm working in a realistic scenario. For this case study, the best results were achieved using the k- Nearest Neighbors and subsets within 7 days for training. The algorithm was able to adapt to changes in users’ patterns and could reach a good performance even after total data substitution. At the end of the analysis, accuracy, precision and recall remained around 98%, in average. Finally, it is possible to affirm that the method proposed allowed to appropriately compare and select the algorithm and the ideal subset to predict the state of the artificial lighting system.
650 - Ponto de acesso secundário de assunto - Termo tópico	0	4	$aEngenharia civil
650 - Ponto de acesso secundário de assunto - Termo tópico	0	4	$aAprendizagem de máquina
650 - Ponto de acesso secundário de assunto - Termo tópico	0	4	$aAlgorítmos
650 - Ponto de acesso secundário de assunto - Termo tópico	0	4	$aEdificação
700 - Ponto de acesso secundário - Nome pessoal	1	#	$aGhisi, Enedir, $eorientador
710 - Ponto de acesso secundário - Entidade coletiva	1	#	$aUniversidade Federal de Santa Catarina. $bPrograma de Pós-Graduação em Engenharia Civil
856 - Localização e acesso eletrônicos	4	0	$zVersão integral em pdf $uhttps://bu.ufsc.br/teses/PECV1339-T.pdf