Pandas Dataframe Exclusivo

Pandas Dataframe Exclusivo



A biblioteca Python mais popular que é utilizada em ciência de dados é chamada Pandas. Ele oferece aos programadores Python ferramentas de análise de dados de alto desempenho, fáceis de usar e fáceis de usar. Depois de entender as funções fundamentais e como utilizá-las, o Pandas é uma ferramenta potente para alterar dados. Em “pandas” os métodos padrão para armazenar dados em forma de tabela são os DataFrames. Podemos utilizar alguns métodos “pandas” para obter os valores exclusivos na coluna do DataFrame “pandas”. Quando precisamos obter valores únicos nas colunas do DataFrame e não queremos duplicação de valores na coluna do DataFrame “pandas”, podemos usar os métodos que o “pandas” fornece para fazer isso. Vejamos esses métodos neste guia, juntamente com alguns exemplos e saídas para obter valores exclusivos na coluna de “pandas” do DataFrame.

Métodos para obter valores exclusivos nas colunas do DataFrame “pandas”

Podemos utilizar dois métodos para obter os valores exclusivos nas colunas do DataFrame “pandas”. Eliminamos os valores duplicados e obtemos apenas os valores únicos nas colunas de DataFrames. Os métodos que os “pandas” fornecem para fazer esta tarefa são:







  • Utilizando o método unique().
  • Utilizando o método drop_dupliactes().

Agora, utilizaremos os dois métodos nos códigos “pandas” para obter os valores exclusivos nas colunas do DataFrame “pandas”.



Exemplo # 01

O aplicativo 'Spyder' é utilizado aqui para gerar esses códigos 'pandas' para utilizar os métodos que nos ajudam a obter os valores exclusivos nas colunas do DataFrame 'pandas'. Devemos importar os módulos “pandas”, que são necessários para o código “pandas”, antes de criar o DataFrame. Ao usar o termo “importar” e colocar “pandas como pd”, importamos esses módulos.



Agora, com a ajuda de “pd”, podemos obter rapidamente as funções ou métodos dos “pandas”. Em seguida, colocamos o “Subject_data” no qual adicionamos “Name” e no “Name”, estamos adicionando os dados do nome que são “Roman, William, Peter, Smith, John, Milli, Thomas e James”. Em seguida, adicionamos os dados do assunto no “Assunto” que são “Matemática, Economia, Ciências, Matemática, Estatística, Estatística, Estatística e Computação”. Em seguida, convertemos esse “Subject_data” no DataFrame “Subject_df” usando o método “pd.DataFrame()”. Colocamos “Subject_df” no método “print()” para que ele apareça no terminal.





Agora, queremos obter os valores exclusivos na coluna “Subj” do DataFrame “pandas”. Para isso, estamos usando o método “unique()” aqui e adicionamos o nome da coluna e também o nome do DataFrame conforme mostrado abaixo. Adicionamos este método no “print()” para que o resultado também apareça no terminal.



Agora, estamos pressionando o “Shift+Enter” para obter o resultado deste código e ele renderiza no terminal e também é mostrado aqui, que contém o DataFrame com todos os valores. Este é o DataFrame original que adicionamos no código e abaixo ele exibe os valores exclusivos da coluna “Subj”. Ele descarta os valores duplicados e exibe os valores exclusivos da coluna “Subj” do DataFrame.

Exemplo # 02

Criamos a “Sample_list” que contém algumas informações. Inserimos “Layla, 21, 28, 31, 14 e 39” que aparecerá como a primeira coluna quando convertermos esta lista para o DataFrame. Em seguida, adicionamos “Lusy, 31, 25, 34, 26 e 21” como a segunda linha do DataFrame. Depois disso, temos “Peter, 38, 20, 20, 35, and 24” e “Layla 38, 23, 39 24, 23” que serão a terceira e quarta linhas do DataFrame. Também inserimos mais três dados que são “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” e também “Peter, 21, 21, 31, 21, 29” .

Agora, estamos convertendo o “Sample_list” para o “DF_Sample” que é o nome do DataFrame aqui colocando a função “pd.DataFrame()”. Além disso, definimos o nome das colunas deste DataFrame e esses nomes são “Nome, Ass_1, Ass_2, Ass_3, Ass_4 e Ass_5”. Em seguida, usamos o “print()” que ajuda na exibição do DataFrame “DF_Sample”. Agora, estamos usando outro método neste exemplo para obter os valores exclusivos na coluna do DataFrame. Este método é o método “drop_duplicates()” de “pandas”.

No método “drop_duplicates()”, definimos o nome da coluna onde queremos obter os valores únicos na coluna do DataFrame. Estamos obtendo valores únicos da coluna “Nome” soltando os valores duplicados nesta coluna com a ajuda do método “drop_duplicates()” e também renderizando esses valores únicos usando a função “print()” aqui.

Os nomes duplicados são descartados e os valores exclusivos são renderizados após a aplicação do método “drop_duplicates()”. Você pode notar que o nome “Layla” aparece em três células da coluna “Nome”. Mas quando o método “drop_duplicates()” é aplicado a esta coluna, todos os valores duplicados são descartados e um nome “Layla” aparece na tela. Depois de descartar os valores duplicados, apareceu o novo DataFrame que contém os valores exclusivos nesta coluna “Nome”. Dessa forma, podemos descartar os valores duplicados e obter o valor único na coluna do DataFrame com a ajuda do método “drop_duplicates()”.

Exemplo # 03

O mesmo DataFrame é utilizado novamente e agora estamos aplicando o método “unique()” aqui. Com o método “unique()” colocamos o nome da coluna assim como o nome do DataFrame no qual queremos aplicar este método “unique()” para obter os valores únicos. Isso renderizará apenas os valores exclusivos dessa coluna e não mostrará esses valores na forma de DataFrame.

Aqui, o DataFrame contém sete valores na coluna “Nome” mas quando aplicamos o método “unique()” a esta coluna, apenas quatro valores apareceram e estes são os valores únicos dessa coluna. Não renderiza valores duplicados.

Exemplo # 04

O DataFrame que criamos neste exemplo é o “F_G_df”. Inserimos “My_fruits” e “my_Vegs” neste DataFrame. A coluna “My_fruits” contém “Maçã, Laranja, Maçã, Pêra, Lichia, Maçã, Maçã, Pêra e Maçã”. Em seguida, temos o “My_Vegs” que contém os nomes dos vegetais que são “Chilli, Bringle, Cenoura, Batata, Batata, Cenoura, Cebola, Alho e Gengibre”. Este DataFrame contém apenas duas colunas.

Agora, estamos obtendo os valores exclusivos em ambas as colunas com a ajuda do método 'unique()'. Mencionamos o nome do DataFrame. Em seguida, coloque o nome da primeira coluna da coluna. Depois disso, utilizamos o método append(). Neste anexo, colocamos novamente o nome do DataFrame e o nome da segunda coluna e colocamos o método “unique()”. Isso obterá os valores exclusivos de ambas as colunas e, em seguida, anexará os valores exclusivos de ambas as colunas e os exibirá na tela.

O DataFrame é renderizado primeiro contendo todos os valores. Depois disso, o método “unique()” é aplicado e os valores exclusivos de ambas as colunas são renderizados abaixo. Neste código, obtemos os valores exclusivos nas várias colunas do DataFrame usando o método “unique()”.

Conclusão

A explicação completa sobre como obter os valores exclusivos na coluna do DataFrame é encontrada neste guia. Discutimos os métodos “unique()” e “drop_duplicates()” que nos ajudam a obter os valores exclusivos da coluna do DataFrame. Exploramos como usar esses métodos no código “pandas” usando esses métodos aqui em nossos códigos. Ilustramos diferentes exemplos neste guia e mostramos como obter os valores exclusivos de uma coluna usando o método “unique()” e também o método “drop_duplicates()”. Também exploramos como obter os valores exclusivos em várias colunas utilizando o método “unique()” neste guia.