Obter um número de colunas no R DataFrame

Obter Um Numero De Colunas No R Dataframe



No R, obter o número de colunas é uma operação básica necessária em muitas situações ao trabalhar com DataFrames. Ao criar subconjuntos, analisar, manipular, publicar e visualizar os dados, a contagem de colunas é uma informação crucial a ser conhecida. Portanto, R fornece diferentes abordagens para obter o total das colunas do DataFrame especificado. Neste artigo, discutiremos algumas das abordagens que nos ajudam a obter a contagem das colunas do DataFrame.

Exemplo 1: Usando a Função Ncol()

A ncol() é a função mais frequente para obter o total das colunas dos DataFrames.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Número de colunas no Data Frame :', n)

Neste exemplo, primeiro criamos um DataFrame “df” com três colunas rotuladas como “y1”, “y2” e “y3” usando a função data.frame() em R. Os elementos em cada coluna são especificados usando a função c() que cria um vetor de elementos. Então, usando a variável “n”, a função ncol() é usada para determinar o total de colunas no DataFrame “df”. Finalmente, com a mensagem descritiva e a variável “n”, a função cat() fornecida imprime os resultados no console.



Conforme esperado, a saída recuperada indica que o DataFrame especificado possui três colunas:







Exemplo 2: conte o total de colunas para o DataFrame vazio

Em seguida, aplicamos a função ncol() ao DataFrame vazio, que também obtém os valores das colunas totais, mas esse valor é zero.

empty_df <- data.frame()

n <- ncol(empty_df)

cat('---Colunas no Data Frame :', n)

Neste exemplo, geramos o DataFrame vazio, “empty_df”, chamando o data.frame() sem especificar nenhuma coluna ou linha. Em seguida, usamos a função ncol() que é usada para encontrar a contagem de colunas no DataFrame. A função ncol() é definida com o DataFrame “empty_df” aqui para obter o total de colunas. Como o DataFrame “empty_df” está vazio, ele não possui colunas. Portanto, a saída de ncol(empty_df) é 0. Os resultados são exibidos pela função cat() que é implementada aqui.



A saída mostra o valor “0” como esperado porque o DataFrame está vazio.

Exemplo 3: Usando a função Select_If() com a função Length()

Se quisermos recuperar o número de colunas de qualquer tipo específico, devemos usar a função select_if() em conjunto com a função length() de R. Essas funções são usadas que são combinadas para obter o total das colunas de cada tipo . O código para usar essas funções é implementado a seguir:

biblioteca (dplyr)

x1<-LETRAS[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Summer','Winter'),10,replace=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

length(select_if(df1,is.numeric))

Neste exemplo, primeiro carregamos o pacote dplyr para que possamos acessar a função select_if() e a função length(). Em seguida, criamos as quatro variáveis ​​– “x1”, “x2”, “x3” e “x4”, respectivamente. Aqui, “x1” contém as 10 primeiras letras maiúsculas do alfabeto inglês. As variáveis ​​“x2” e “x3” são geradas usando a função rpois() para criar dois vetores separados de 10 números aleatórios com parâmetros 2 e 5, respectivamente. A variável “x4” é um vetor de fatores com 10 elementos que são amostrados aleatoriamente do vetor c (“Verão”, “Inverno”).

Em seguida, tentamos criar o DataFrame “df1” onde todas as variáveis ​​são passadas na função data.frame(). Por fim, invocamos a função length() para determinar o comprimento do DataFrame “df1” que é criado usando a função select_if() do pacote dplyr. A função select_if() seleciona as colunas de um DataFrame “df1” como um argumento e a função is.numeric() seleciona apenas as colunas que contêm valores numéricos. Em seguida, a função length() obtém o total de colunas selecionadas por select_if(), que é a saída de todo o código.

O comprimento da coluna é mostrado na seguinte saída que indica o total de colunas do DataFrame:

Exemplo 4: Usando a Função Sapply()

Por outro lado, se quisermos apenas contar os valores ausentes das colunas, temos a função sapply(). A função sapply() itera sobre cada coluna do DataFrame para operar especificamente. A função sapply() é passada primeiro com o DataFrame como um argumento. Em seguida, leva a operação a ser executada nesse DataFrame. A implementação da função sapply() para obter a contagem de valores NA nas colunas DataFrame é fornecida da seguinte forma:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

Neste exemplo, geramos o DataFrame “new_df” com três colunas – “c1”, “c2” e “c3”. As primeiras colunas, “c1” e “c3”, contêm os valores numéricos, incluindo alguns valores ausentes que são representados por NA. A segunda coluna, “c2”, contém os caracteres incluindo alguns valores ausentes que também são representados por NA. Em seguida, aplicamos a função sapply() ao DataFrame “new_df” e calculamos o número de valores ausentes em cada coluna usando a expressão sum() dentro da função sapply().

A função is.na() é aquela expressão que é especificada para a função sum() que retorna um vetor lógico indicando se cada elemento na coluna está faltando ou não. A função sum() soma os valores TRUE para contar o número de valores ausentes em cada coluna.

Portanto, a saída exibe os valores NA totais em cada uma das colunas:

Exemplo 5: Usando a Função Dim()

Além disso, queremos obter o total de colunas junto com as linhas do DataFrame. Em seguida, a função dim() fornece as dimensões do DataFrame. A função dim() considera o objeto como um argumento cujas dimensões queremos recuperar. Aqui está o código para usar a função dim():

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

pontos=c(8, 10, 7, 4))

dim(d1)

Neste exemplo, primeiro definimos o DataFrame “d1” que é gerado usando a função data.frame() onde duas colunas são definidas “equipe” e “pontos”. Depois disso, invocamos a função dim() sobre o DataFrame “d1”. A função dim() retorna o número de linhas e colunas do DataFrame. Portanto, quando executamos o dim(d1), ele retorna um vetor com dois elementos – o primeiro deles reflete o número de linhas no DataFrame “d1” e o segundo representa o número de colunas.

A saída representa as dimensões do DataFrame onde o valor “4” indica o total de colunas e o valor “2” representa as linhas:

Conclusão

Agora aprendemos que contar o número de colunas em R é uma operação simples e importante que pode ser realizada no DataFrame. Entre todas as funções, a função ncol() é a mais conveniente. Agora, estamos familiarizados com as diferentes maneiras de obter o número de colunas do DataFrame fornecido.