PRÁTICA: FILTRANDO DADOS NO PYTHON

Prática: Filtro

Para selecionar uma ou mais linhas da tabela de dados, é necessário a definição de critérios realização de filtros. Uma vez definido o critério, ele é aplicado a todas as linhas da tabela de dados. O produto resultante de uma filtragem são linhas que satisfazem as condições definidas.

Para os critérios utiliza-se os seguintes operadores:

Para filtrar valores de variáveis numéricas se utiliza diretamente um número. Para filtrar valores de variáveis textuais, utiliza-se o valor dentro de aspas que podem ser duplas ou simples. É importante ressaltar que valores textuais são procurados exatamente como são escritos, ou seja, “Mariana” é diferente de “mariana”.

  • Acessando apenas a linha em que id_funcionario é igual a 2005.

funcionario[funcionario['id_funcionario']==2005]

Acessando apenas as linhas em que instrucao é diferente de fundamental.

funcionario[funcionario['instrucao']!='fundamental']

Acessando apenas as linhas em que salario é maior que 10.

funcionario[funcionario['salario']>=10]

Acessando apenas as linhas em que salario é menor ou igual que 5 e plano_de_saude é VERDADEIRO.

funcionario.loc[(funcionario['salario'] <=5) & (funcionario['plano_de_saude'] == 'VERDADEIRO')]

Acessando apenas as linhas em que instrucao é fundamental ou salario é menor que 5.

funcionario.loc[(funcionario['salario'] < 5) & (funcionario['instrucao'] == 'fundamental')]

Agora que já tivemos a primeira impressão sobre a nossa tabela de dados, podemos passar para o próximo capítulo onde vamos explorar a qualidade dos dados e ver como realizar as limpezas necessárias na tabela.

Guest User