Como remover outliers no SPSS

Valores atípicos nas análises estatísticas são valores extremos que parecem não se encaixar na maioria de um conjunto de dados. Se não forem eliminados, esses valores extremos podem ter um grande efeito nas conclusões que podem ser extraídas dos dados em questão, pois podem distorcer os coeficientes de correlação e as melhores linhas de ajuste na direção errada. O SPSS é um de uma série de programas de software de análise estatística que podem ser usados ​​para interpretar um conjunto de dados e identificar e eliminar discrepâncias.

Análise de dados exploratória

Passo 1

Clique em “Analisar”. Selecione “Estatísticas descritivas” e depois “Explorar”.

Etapa 2

Arraste e solte as colunas que contêm os dados da variável dependente na caixa que diz “Lista de dependentes”. Clique em “Aceitar”.

Etapa 3

Remova todos os discrepantes identificados pelo SPSS nos diagramas de caixa excluindo os pontos de dados individuais. Como alternativa, você pode configurar um filtro para excluir esses pontos de dados.

Etapa 4

Selecione “Dados” e, em seguida, “Selecionar casos” e clique em uma condição com os valores extremos que você deseja excluir. Determine um valor para essa condição que exclua apenas discrepantes e nenhum dos pontos de dados não distantes.

Etapa 5

Selecione a opção “Se a condição for atendida” na caixa “Selecionar” e clique no botão “Sim” logo abaixo. Digite a regra de exclusão dos valores extremos que foram determinados na etapa anterior na caixa no canto superior direito. Por exemplo, se medidas acima de 74,5 polegadas foram excluídas da condição “altura”, digite “altura <= 74,5”. Clique em “Continuar” e “Aceitar” para ativar o filtro.

Análise de regressão

Passo 1

No menu “Analisar”, selecione “Regressão” e depois “Linear”. Selecione as variáveis ​​dependentes e independentes que você deseja analisar.

Etapa 2

Clique em “Salvar” e selecione “Distância de cozimento”. Os valores calculados para a distância de cozimento serão armazenados no arquivo de dados como variáveis ​​denominadas “COO-1”.

Etapa 3

Execute um gráfico de caixa usando a opção “Gráficos” seguida de “Gráfico de caixa”. Clique em “Simples” e selecione “Resumos de variáveis ​​independentes”. Digite “COO-1” na caixa “Caixas representam” e, em seguida, insira o ID ou nome pelo qual identificar os casos na caixa “Etiquetar casos por”.

Etapa 4

Aumente o diagrama da caixa no arquivo de saída clicando duas vezes nele. Tome nota dos casos que estão além das linhas pretas, esses são seus valores extremos. Você pode optar por eliminar todos os valores discrepantes ou apenas valores extremos, marcados com um asterisco (*).

Etapa 5

Retorne ao arquivo de dados e localize os casos que precisam ser excluídos. Trabalhe de baixo para cima, selecione o número na extrema esquerda, na coluna cinza, para que toda a linha seja selecionada. Clique em “Editar” e selecione “Excluir”. Repita esta etapa para cada discrepância definida no diagrama de caixa.

Referências

 

Você pode estar interessado:

Deixe um comentário