Tipos de variáveis
Segundo MORETTIN e BUSSAB (2017), algumas variáveis apresentam como possíveis valores números resultantes de uma contagem ou mensuração, enquanto outras, apresentam valores de qualidades (ou atributos). As variáveis do primeiro tipo são chamadas quantitativas, e as do segundo tipo, qualitativas.
Variáveis quantitativas ainda podem se dividir em dois tipos: variáveis quantitativas discretas que são valores inteiros, normalmente vindos de contagens; e variáveis quantitativas contínuas que são valores reais, muitas vezes obtidos através de algum instrumento de medida.
De forma análoga, as variáveis qualitativas podem se dividir em dois tipos: variáveis qualitativas nominais, quando não existe ordenação entre as categorias; e variáveis qualitativas ordinais quando existe uma ordenação entre as categorias.
Podemos dividir as variáveis da tabela “funcionario” (Figura 2) de acordo com os tipos vistos acima, a Figura 4 apresenta essa classificação.
Figura 4: Tipos de variáveis e respectivos exemplos na tabela “funcionario”.
As variáveis qualitativas que possuem apenas dois possíveis valores são chamadas de dicotômicas ou binárias. Quando esses possíveis valores são “verdadeiro” ou “falso” as variáveis são chamadas booleanas. É comum representar numericamente com 0 ou 1 estes tipos de variáveis, quando isso acontece, dizemos que temos uma variável dummy.
A variável plano_de_saude da tabela “funcionario” é uma variável booleana, onde podemos facilmente atribuir o valor “1” para o VERDADEIRO e “0” para FALSO, transformando-a em uma dummy. Essa atribuição faz com que mesmo que não se conheça o significado da variável, se possa captar a diferença do valor esperado entre categorias.
Variáveis de data, embora não pareçam do tipo inteiro, são armazenadas dessa forma em todas as ferramentas. A representação interna de uma data é um número inteiro que dá a diferença em dias entre uma data inicial e a data em questão.
Independente da ferramenta utilizada para a abrir a tabela de dados, variáveis numéricas geralmente são representadas com alinhamento à direita e variáveis textuais à esquerda. Na Figura 5 temos duas linhas da tabela de dados “funcionario” onde podemos perceber essa formatação.
Figura 5: Formatação de uma tabela de dados.
Uma das formas de garantir que os dados de uma tabela fiquem compreensíveis é através do Dicionário de dados ou Metadados.