Metodologia para seleção de algoritmo de aprendizagem de máquina para estudos de controle centrado no usuário de edificações

Revisão de 17h11min de 17 de outubro de 2024 por Jaider.ferreira (discussão | contribs) (Desfeita a edição 5062 de Jaider.ferreira (Discussão))


Título principal
Metodologia para seleção de algoritmo de aprendizagem de máquina para estudos de controle centrado no usuário de edificações [recurso eletrônico] / Thayane Lodote Bilésimo ; orientador, Enedir Ghisi
Data de publicação

Descrição física
130 p. : il.
Nota
Disponível somente em versão on-line.
Tese (doutorado) – Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Civil, Florianópolis, 2024.
Inclui referências.
O atual cenário do setor de edificações requer novas estratégias de eficiência energética, que sejam capazes de identificar e proporcionar aos usuários um ambiente confortável segundo sua percepção. A aprendizagem de máquina – método de análise de dados capaz de identificar padrões e realizar inferências é uma alternativa para identificação das preferências dos usuários e controle dos sistemas das edificações, especialmente os de climatização e iluminação. A aprendizagem supervisionada é a abordagem mais usada, pois permite classificar condições ambientais em termos de conforto. No entanto, é importante identificar o algoritmo capaz de realizar inferências mais assertivas e de se adaptar às variações de preferências dos usuários das edificações ao longo do tempo. Neste sentido, o objetivo deste trabalho é propor um método para comparar o desempenho de diferentes algoritmos de aprendizagem supervisionada. O método deve permitir a identificação do algoritmo mais adequado para ser usado em estudos de sistemas de controle centrados no usuário. Para avaliar o desempenho dos algoritmos em cenários realistas, dados de ocupação, iluminância, temperatura, estado das aberturas e do sistema de iluminação artificial foram coletados durante oito meses, entre junho de 2022 e fevereiro de 2023, em um laboratório da Universidade Federal de Santa Catarina. Os dados foram pré-processados e agrupados em subconjuntos de 1, 7, 15 e 30 dias. Cada subconjunto foi utilizado no treinamento e teste dos algoritmos Decision Tree, k-Nearest Neighbors, Multilayer Perceptron, Random Forest e Support Vector Machine, visando prever o estado do sistema de iluminação. Os resultados foram comparados estatisticamente e os algoritmos foram avaliados a partir do cálculo da acurácia, precisão e sensibilidade. Inicialmente, identificou-se o subconjunto ideal (em quantidade de dias) para o funcionamento adequado de cada algoritmo. Em seguida, os algoritmos foram comparados. A melhor configuração (algoritmo e quantidade de dias) foi submetida a um processo de otimização. Posteriormente, simulou-se a atualização diária do conjunto de dados, a fim de avaliar o desempenho da configuração otimizada em um cenário realístico. Para o cenário estudado, o melhor resultado foi obtido utilizando o k-Nearest Neighbors e subconjuntos de 7 dias para treino. O algoritmo foi capaz de se adaptar às variações observadas após cada atualização, mesmo com a substituição completa do conjunto inicial de dados. Ao final da análise, acurácia, precisão e sensibilidade foram de 98%, em média. Por fim, pode-se afirmar que o método proposto permitiu comparar e selecionar adequadamente o algoritmo e o subconjunto ideal de dias para prever o estado do sistema de iluminação artificial.

Abstract: The current building sector scenario demands new energy efficiency strategies. They need to be capable of identifying and assuring comfortable environments according to users’ perceptions. Machine learning – a method of data analysis capable of identifying patterns and make predictions – is an alternative to identify users’ preferences and control lighting and heating, ventilation and air-conditioning systems in buildings. Supervised learning is the most common approach because it allows classifying environmental conditions in terms of comfort. However, it is important to identify the algorithms’ capacity of making right predictions and adapting to the change in the preferences of building users over time. This research aims to present a method to assess different supervised learning algorithms. The method must allow the identification of the most accurate algorithms to be used in studies of occupant centered control systems. In order to assess algorithms’ performance in realistic scenarios, the following data were collected: occupancy, illuminance, temperature, and the current state of openings and artificial lighting system. Data were collected for eight months, between June 2022 and February 2023 in a research laboratory of Federal University of Santa Catarina. They were pre-processed and grouped in subsets within 1, 7, 15 and 30 days. Each subset was used in training and testing the following algorithms: Decision Tree, k-Nearest Neighbors, Multilayer Perceptron, Random Forest and Support Vector Machine, in order to predict the state of the lighting system. The results were statistically compared and the performance of the algorithms was assessed using each models’ accuracy, precision and recall. First, the ideal subset to each algorithm (in number of days) was identified. In the next step, algorithms were compared. The best configuration (algorithm and number of days) was submitted to an optimization process. Then, the update of the subset was assessed, aiming to evaluate the optimized algorithm working in a realistic scenario. For this case study, the best results were achieved using the k- Nearest Neighbors and subsets within 7 days for training. The algorithm was able to adapt to changes in users’ patterns and could reach a good performance even after total data substitution. At the end of the analysis, accuracy, precision and recall remained around 98%, in average. Finally, it is possible to affirm that the method proposed allowed to appropriately compare and select the algorithm and the ideal subset to predict the state of the artificial lighting system.
Campo Ind1 Ind2 Dados
Líder 06697ntm a2200289 a 4500
001 - Número de controle B000147
003 - Identificador do número de controle BR-FlWIK
005 - Data e hora da última transação 20241017171120.0
008 - Informações gerais 241014s2024    scba   g m    000 0 por d
















040 - Fonte da catalogação # #

$aBR-FlWIK
$bpor
$cBR-FlWIK
$dBR-FlUSC

090 - Número de chamada local (etiqueta) # #

$aCETD
$bUFSC
$cPECV
$d1339

100 - Ponto de acesso principal - Nome pessoal 1 #

$aBilésimo, Thayane Lodete
$0(BR-FlUSC)366819

245 - Indicação de título 1 0

$aMetodologia para seleção de algoritmo de aprendizagem de máquina para estudos de controle centrado no usuário de edificações
$h[recurso eletrônico] /
$cThayane Lodote Bilésimo ; orientador, Enedir Ghisi

260 - Publicação, distribuição, etc. (Imprenta) # #

$c2024.

300 - Descrição física # #

$a130 p. :
$bil.

500 - Nota geral # #

$aDisponível somente em versão on-line.

502 - Nota de dissertação # #

$aTese (doutorado) – Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Civil, Florianópolis, 2024.

504 - Nota de bibliografia, etc. # #

$aInclui referências.

520 - Resumo, etc. # #

$aO atual cenário do setor de edificações requer novas estratégias de eficiência energética, que sejam capazes de identificar e proporcionar aos usuários um ambiente confortável segundo sua percepção. A aprendizagem de máquina – método de análise de dados capaz de identificar padrões e realizar inferências é uma alternativa para identificação das preferências dos usuários e controle dos sistemas das edificações, especialmente os de climatização e iluminação. A aprendizagem supervisionada é a abordagem mais usada, pois permite classificar condições ambientais em termos de conforto. No entanto, é importante identificar o algoritmo capaz de realizar inferências mais assertivas e de se adaptar às variações de preferências dos usuários das edificações ao longo do tempo. Neste sentido, o objetivo deste trabalho é propor um método para comparar o desempenho de diferentes algoritmos de aprendizagem supervisionada. O método deve permitir a identificação do algoritmo mais adequado para ser usado em estudos de sistemas de controle centrados no usuário. Para avaliar o desempenho dos algoritmos em cenários realistas, dados de ocupação, iluminância, temperatura, estado das aberturas e do sistema de iluminação artificial foram coletados durante oito meses, entre junho de 2022 e fevereiro de 2023, em um laboratório da Universidade Federal de Santa Catarina. Os dados foram pré-processados e agrupados em subconjuntos de 1, 7, 15 e 30 dias. Cada subconjunto foi utilizado no treinamento e teste dos algoritmos Decision Tree, k-Nearest Neighbors, Multilayer Perceptron, Random Forest e Support Vector Machine, visando prever o estado do sistema de iluminação. Os resultados foram comparados estatisticamente e os algoritmos foram avaliados a partir do cálculo da acurácia, precisão e sensibilidade. Inicialmente, identificou-se o subconjunto ideal (em quantidade de dias) para o funcionamento adequado de cada algoritmo. Em seguida, os algoritmos foram comparados. A melhor configuração (algoritmo e quantidade de dias) foi submetida a um processo de otimização. Posteriormente, simulou-se a atualização diária do conjunto de dados, a fim de avaliar o desempenho da configuração otimizada em um cenário realístico. Para o cenário estudado, o melhor resultado foi obtido utilizando o k-Nearest Neighbors e subconjuntos de 7 dias para treino. O algoritmo foi capaz de se adaptar às variações observadas após cada atualização, mesmo com a substituição completa do conjunto inicial de dados. Ao final da análise, acurácia, precisão e sensibilidade foram de 98%, em média. Por fim, pode-se afirmar que o método proposto permitiu comparar e selecionar adequadamente o algoritmo e o subconjunto ideal de dias para prever o estado do sistema de iluminação artificial.

520 - Resumo, etc. 8 #

$aAbstract: The current building sector scenario demands new energy efficiency strategies. They need to be capable of identifying and assuring comfortable environments according to users’ perceptions. Machine learning – a method of data analysis capable of identifying patterns and make predictions – is an alternative to identify users’ preferences and control lighting and heating, ventilation and air-conditioning systems in buildings. Supervised learning is the most common approach because it allows classifying environmental conditions in terms of comfort. However, it is important to identify the algorithms’ capacity of making right predictions and adapting to the change in the preferences of building users over time. This research aims to present a method to assess different supervised learning algorithms. The method must allow the identification of the most accurate algorithms to be used in studies of occupant centered control systems. In order to assess algorithms’ performance in realistic scenarios, the following data were collected: occupancy, illuminance, temperature, and the current state of openings and artificial lighting system. Data were collected for eight months, between June 2022 and February 2023 in a research laboratory of Federal University of Santa Catarina. They were pre-processed and grouped in subsets within 1, 7, 15 and 30 days. Each subset was used in training and testing the following algorithms: Decision Tree, k-Nearest Neighbors, Multilayer Perceptron, Random Forest and Support Vector Machine, in order to predict the state of the lighting system. The results were statistically compared and the performance of the algorithms was assessed using each models’ accuracy, precision and recall. First, the ideal subset to each algorithm (in number of days) was identified. In the next step, algorithms were compared. The best configuration (algorithm and number of days) was submitted to an optimization process. Then, the update of the subset was assessed, aiming to evaluate the optimized algorithm working in a realistic scenario. For this case study, the best results were achieved using the k- Nearest Neighbors and subsets within 7 days for training. The algorithm was able to adapt to changes in users’ patterns and could reach a good performance even after total data substitution. At the end of the analysis, accuracy, precision and recall remained around 98%, in average. Finally, it is possible to affirm that the method proposed allowed to appropriately compare and select the algorithm and the ideal subset to predict the state of the artificial lighting system.

650 - Ponto de acesso secundário de assunto - Termo tópico 0 4

$aEngenharia civil
$0(BN)000049840

650 - Ponto de acesso secundário de assunto - Termo tópico 0 4

$aAprendizagem de máquina

650 - Ponto de acesso secundário de assunto - Termo tópico 0 4

$aAlgorítmos
$0(BN)000120273

650 - Ponto de acesso secundário de assunto - Termo tópico 0 4

$aEdificação

700 - Ponto de acesso secundário - Nome pessoal 1 #

$aGhisi, Enedir,
$eorientador
$0(BR-FlUSC)52902

710 - Ponto de acesso secundário - Entidade coletiva 1 #

$aUniversidade Federal de Santa Catarina.
$bPrograma de Pós-Graduação em Engenharia Civil
$0(BR-FlUSC)149193

856 - Localização e acesso eletrônicos 4 0

$zVersão integral em pdf
$uhttps://bu.ufsc.br/teses/PECV1339-T.pdf