Pandas exibem o máximo de linhas

Pandas Exibem O Maximo De Linhas



Pandas estão entre as ferramentas mais populares usadas hoje por cientistas de dados para analisar dados tabulares. Para lidar com conteúdo tabular, oferece uma API mais rápida e eficaz. Sempre que visualizamos quadros de dados durante a análise, o Pandas define automaticamente vários comportamentos de exibição para valores padrão. Esses comportamentos de exibição incluem quantas linhas e colunas serão exibidas, a precisão das flutuações em cada frame de dados, tamanhos de coluna etc.  Dependendo dos requisitos, às vezes podemos precisar modificar esses padrões. Pandas têm uma variedade de abordagens para alterar o comportamento padrão. Aproveitar o atributo “options” dos pandas nos permitiu mudar esse comportamento.

Pandas exibem o máximo de linhas

Sempre que você tentar imprimir um quadro de dados enorme que contenha mais linhas e colunas do que o limite predefinido, a saída será cortada. Para mostrar todas as linhas no DataFrame, você aprenderá a modificar as opções de exibição do Pandas neste tutorial. Pandas, por padrão, impõem um limite no número de colunas e linhas que exibe. Embora isso possa ser útil para a leitura de conteúdo, frequentemente causa frustração se as informações que você precisa visualizar não forem exibidas. Aqui, usaremos os métodos fornecidos abaixo com sua sintaxe para exibir todas as colunas do dataframe.







para sequenciar()





set_option()





option_context()



Aprenderemos a utilização de todos esses métodos com implementação prática para exibir o máximo de linhas no dataframe fornecido.

Exemplo # 1: Utilizando o Método Pandas to_string()

Esta demonstração nos ensinará a exibir o máximo de linhas em um dataframe no terminal usando o método pandas “to_string()”.

Para a compilação e execução dos programas de exemplo, escolhemos a ferramenta “Spyder”. Neste guia, usaremos essa ferramenta para a execução de todos os nossos exemplos. Lançamos a ferramenta “Spyder” para começar a escrever o script python. Começando com o código, primeiro precisamos carregar as bibliotecas necessárias em nosso arquivo python para que possamos usar seus recursos. A biblioteca de módulos que precisamos aqui é a “Pandas”. Então, nós o importamos para nosso arquivo python e o aliamos para “pd”.

Como a principal operação deste artigo é exibir o máximo de linhas de um dataframe, primeiro precisamos de um dataframe. Agora você decide se prefere gerar um dataframe ou importar um arquivo CSV. Importamos um arquivo CSV de amostra. Para ler um arquivo CSV no programa python, utilizamos a função pandas “pd.read_csv()”. Entre os parênteses desta função, fornecemos o arquivo CSV que queremos ler no display, que é “industry.csv”. Construímos uma variável “df” para armazenar a saída gerada a partir da leitura do arquivo CSV fornecido. Em seguida, invocamos o método “print()” para exibir o dataframe.

Quando executamos este programa python clicando na opção “Run file”, um dataframe é exibido no console. Você pode observar que existem 43 linhas no resultado abaixo, mas apenas dez são exibidas. Isso ocorre porque o valor padrão da biblioteca Pandas é de apenas 10 linhas.

Usaremos o método pandas “to_string” para exibir todas as linhas aqui. A maneira mais direta de mostrar o máximo de linhas de um quadro de dados é com essa técnica. No entanto, como ele transforma o quadro de dados completo em uma única string, não é recomendado para conjuntos de dados muito grandes (na casa dos milhões). No entanto, isso funciona de forma eficaz para conjuntos de dados com comprimento de milhares.

Seguimos a sintaxe fornecida acima para a função “to_string()”. Simplesmente invocamos o método “to_string()” com o nome do nosso dataframe. Em seguida, colocamos esse método na função “print()” para exibi-lo quando chamado.

O instantâneo de saída nos mostra um dataframe com todas as linhas sendo exibidas no terminal.

Exemplo # 2: utilizando o método set_option do Pandas

O segundo método que vamos praticar neste guia é o pandas “set_option()” para exibir o máximo de linhas do dataframe fornecido.

No arquivo python, importamos a biblioteca pandas para acessar a função mencionada acima. Usamos os pandas “pd.read_csv()” para ler o arquivo CSV fornecido. Chamamos a função “pd.read_CSV()” com o nome do arquivo CSV que queremos usar entre seus parênteses que é “Sampledata.csv”. Ao importar o arquivo CSV, lembre-se do diretório de trabalho atual do programa Python. Seu arquivo CSV deve ser colocado no mesmo diretório; caso contrário, você receberá uma mensagem de erro “arquivo não encontrado”. Criamos uma variável “sample” para armazenar o dataframe do arquivo CSV. Chamamos o método “print()” para mostrar esse dataframe.

Aqui, temos nossa saída onde apenas dez linhas são exibidas. O número máximo de linhas indicado é 99. Todas as outras linhas entre as primeiras 5 e as últimas cinco linhas são truncadas.

Para exibir o máximo de linhas que são 99 para este dataframe, usaremos a função “set_option()” do módulo pandas. Os Pandas vêm com um sistema operacional que permite alterar o comportamento e a exibição. Esse método nos permite definir a exibição para exibir um quadro de dados completo em vez de um truncado. Os pandas fornecem a função 'set_ option()' para exibir todas as linhas do frame de dados.

Invocamos o “pd.set_option()”. Esta função possui os parâmetros “display.max_rows”. O “display.max_rows” especifica o número máximo de linhas que serão exibidas ao exibir um dataframe. O valor de “max_rows” é definido como 10 por padrão. Se 'Nenhum' for selecionado, significa todas as linhas no quadro de dados. Como queremos exibir todas as linhas, definimos como “Nenhum”. Por fim, usamos a função “print()” para exibir o dataframe com o máximo de linhas.

Isso produz o resultado fornecido no instantâneo abaixo.

Exemplo # 3: Utilizando o método option_context() do Pandas

O último método que estamos discutindo aqui é o “option_context()” para exibir todas as linhas do dataframe. Para isso, importamos o pacote pandas para o arquivo python e começamos a escrever o código. Usamos a função “pd.read_csv()” para ler o arquivo CSV que especificamos. Criamos uma variável “dalta” para armazenar o dataframe do arquivo CSV especificado. Em seguida, simplesmente imprimimos o dataframe com o método “print()”.

O resultado que obtivemos ao executar o código acima nos mostra um dataframe com linhas truncadas.

Vamos agora aplicar os pandas “pd.option_context()” neste dataframe. Esta função é idêntica a “set_option()”. A única diferença entre as duas abordagens é que “set_option()” altera as configurações permanentemente, enquanto “option _context()” apenas as altera dentro de seu escopo. Esse método também usa as linhas display.max como parâmetro, que definimos como “Nenhum” para renderizar todas as linhas do quadro de dados. Após invocar esta função, acabamos de exibi-la através do método “print()”.

Aqui, podemos visualizar o dataframe completo com suas linhas máximas que são 2747.

Conclusão

Este artigo se concentra nas opções de exibição dos pandas. Às vezes, podemos precisar visualizar o dataframe completo no terminal. Pandas nos dão uma variedade de opções para esse fim. Neste guia, usamos três dessas estratégias. O primeiro exemplo foi baseado no uso do método “to_string()”. Nossa segunda instância nos ensina a implementar o “set_option()” enquanto a última ilustração executa o método “option_context()”. Todas essas técnicas são demonstradas para familiarizá-lo com as formas alternativas que os pandas nos fornecem para alcançar o resultado desejado.