Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
Essa dissertação tem como objetivo utilizar características cardíacas clássicas e os novos parâmetros introduzidos por Campello de Souza (2010) [O Apoio ao Diagnóstico Médico: o que se pode fazer com um tensiômetro e um relógio. 2. ed. Recife] no processo de classificação de indivíduos cardiopatas....
Main Author: | FERREIRA, Adenice Gomes de Oliveira |
---|---|
Other Authors: | OSPINA MARTÍNEZ, Raydonal |
Format: | masterThesis |
Language: | por |
Published: |
Universidade Federal de Pernambuco
2019
|
Subjects: | |
Online Access: |
https://repositorio.ufpe.br/handle/123456789/35327 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: |
Essa dissertação tem como objetivo utilizar características cardíacas clássicas e os novos parâmetros introduzidos por Campello de Souza (2010) [O Apoio ao Diagnóstico Médico: o que se pode fazer com um tensiômetro e um relógio. 2. ed. Recife] no processo de classificação de indivíduos cardiopatas. Considerando distintos cenários de análise e baseados em quatro diferentes bancos de dados, os parâmetros de Campello de Souza foram incluídos no processo de seleção dos atributos mais informativos e no processo de classificação binária dos cardiopatas. Foram testados cinco classificadores bem consolidados na literatura a saber: Naive Bayes, Florestas Aleatórias, Regressão Logística, Adaboost e Máquinas de Vetores de Suporte. Os desempenhos destes classificadores foram avaliados com base nas acurácias e respectivos desvios padrões (DPs). Dada a alta dimensionalidade das matrizes de características contínuas usadas e sob ausência de ortogonalidade, as classificações foram também avaliadas utilizando Componentes Principais. Nessa fase é adicionando um sexto método de classificação: as Redes Neuronais Artificiais. Os resultados empíricos indicam que dentre os parâmetros introduzidos por Campello de Souza, a Pressão Arterial Média (PAM), que aparece em 8 dos 12 modelos selecionados pelo fator de inflação de variância VIF melhora o desempenho dos classificadores, apresentando acurácias que variaram entre 78.77% (DP = 4.54%) e 99.20% (DP = 1.17%), respectivamente. Considerando os classificadores, a Regressão Logística e o Adaboost foram os métodos com maiores médias de acurácias, cada classificador presente em um terço dos 12 modelos selecionados pelo VIF. Dominic, Gupta e Khare (2015) obtiveram 98% de acurácia com o classificador Adaboost, Umamaheswuari et al. (2017) obtiveram 91.89% com o classificador Stacking, enquanto que neste trabalho e para o mesmo banco de dados encontrou-se resultados mais competitivos na classificação dos cardiopatas, sendo a Regressão Logística o modelo contendo dentre suas variáveis explicativas a PAM, o Índice Pulsátil da Pressão Arterial (IPPA) e o parâmetro RC (Resistência _ Complacência), obtendo uma acurácia média nas bases de teste foi igual a 99.20% (DP = 1.17%). |
---|