Série Pandas para CSV

Serie Pandas Para Csv



O método “Series.to_csv()” no Pandas gera o objeto de série especificado em uma notação de valores separados por vírgula (csv). Essa função simplesmente pega os valores de uma série e modifica seu formato adicionando vírgulas para a separação dos valores de índice e coluna.

Para empregar esta função, temos que utilizar a seguinte sintaxe:









Este artigo fornecerá duas técnicas diferentes para aprender as maneiras de empregar esse método em um programa python.



Exemplo # 1: Utilizando o método Series.to_csv() para converter uma série com DatetimeIndex em valores separados por vírgula

Para modificar uma série para o formato CSV, empregaremos a função “Series.to_csv()”. Esta ilustração gerará uma série com um DatetimeIndex e a converterá em um formato de valores separados por vírgula.





Para colocar este método em operação, devemos ter uma ferramenta que suporte a programação python. A ferramenta “Spyder” é escolhida para compilar os códigos. Para escrever o script nele, primeiro lançamos a ferramenta instalada em nosso sistema. O programa python precisa de uma biblioteca para exercitar seus métodos para alcançar o resultado desejado. A biblioteca que carregamos aqui é a “Pandas”. Na mesma linha de código, o alias desta biblioteca é identificado como “pd”. Então, em qualquer lugar do programa, precisamos escrever “pandas” para acessar uma função. Em vez disso, escreveríamos “pd”.

O primeiro passo para começar com o código é gerar uma série Pandas. Precisamos escrever “pd” para empregar o método de criação de séries dos pandas. A função “pd.Series()” é chamada para construir uma série com os valores especificados. Os valores que fornecemos para a série são “Istambul”, “Izmir”, “Ankara”, “Ankara”, “Antalya”, “Konya” e “Bursa”. Se você quiser dar um nome a este array de valores, você pode fazê-lo usando o parâmetro “name”. Aqui, nomeamos essa matriz de valores 'Cities', pois ela contém os nomes de 6 cidades. Para armazenar esta série, foi criado um objeto de série “Turkey”.



Para criar um DatetimeIndex, invocamos o método “pd.date_range()”. Entre os parênteses desta função, passamos 4 argumentos que são: “start”, “freq”, “periods” e “tz”.

O argumento “start” recebe uma data e hora para começar a gerar um intervalo de datas a partir dele. Aqui, especificamos a data e hora de início como “2022-03-02 02:30”. O parâmetro “freq” está classificando a frequência para o intervalo de datas. Então, nós fornecemos o valor “D”. Agora, ele criará um intervalo de datas na frequência diária. O argumento “period” é definido como “6”, o que significa que gerará um intervalo de datas de 6 dias. O último parâmetro é “tz” que especifica o fuso horário para a área especificada. Especificamos o fuso horário para “Ásia/Istambul”.

Para armazenar este intervalo de datas, criamos uma variável “Datetime”. Para definir o DatetimeIndex, utilizamos a propriedade “Series.index”. O nome da série “Turkey” é fornecido com a propriedade “.index” e atribuído a ela o intervalo de data e hora armazenado na variável “Datetime”. Assim, a propriedade “index” pegará os valores da variável “Datetime” e os tornará a lista de índices da série “Turkey”. Por fim, para visualizar a série de saída, empregamos o método “print()” e passamos a série “Turkey” como entrada para exibir seu conteúdo.

Acabamos de pressionar a opção “Executar arquivo” para executar o script. Consequentemente, podemos ver uma série com o DatetimeIndex começando em “2022-03-02 02:30:00+03:00” e terminando em “2022-03-07 02:30:00+03:00″ criando um ponto de 6 dias. Abaixo da série a “Freq :D”, o nome da lista de arrays “Cities” e o dtype “object” também são mencionados.

Agora, vamos aprender a converter esta série que acabamos de ver no instantâneo acima para um formato CSV. Para modificar a série para valores separados por vírgula, temos um método fornecido pelo módulo pandas que é “Series.to_csv()”. Este método pega os valores da série fornecida e adiciona vírgulas entre os valores da coluna.

A função “Series.to_csv()” é chamada. O nome da série que queremos converter é mencionado com o método como “Turkey.to_csv()”. Para preservar os valores separados por vírgula, criamos uma variável “Comma_Separated” e colocamos seu conteúdo na janela de saída invocando a função “print()”.

Aqui está nossa série no formato csv. Podemos ver no instantâneo que os valores do índice e da série foram separados usando as vírgulas neles.

Exemplo # 2: Utilizando o método Series.to_csv() para converter uma série com valores NaN em valores separados por vírgula

A segunda técnica para exercitar o método “Series.to_csv()” é aplicar esse método para converter uma série que contém algumas entradas nulas em um formato CSV.

Inicialmente importamos os pacotes necessários. O “pd” é um alias para pandas e “np” como um alias para numpy. O kit de ferramentas numpy é carregado aqui porque faremos algumas entradas nulas em nossa série usando “np.NaN” enquanto a criamos usando o método pandas “pd.Series()”.

A função “pd.Series()” é invocada para construir uma série de pandas com estes valores: “Nile”, “Amazon”, np.NaN, “Ganges”, “Mississippi”, “np.NaN”, “Yangtze”, “Danúbio”, “Mekong”, “np.NaN” e “Volga”. Há um total de 21 valores definidos para a série, dos quais 3 entradas contêm valores “np.NaN”, o que significa que 3 valores estão faltando na série. A propriedade “name” está especificando o nome para esta matriz de valores que fornecemos “Titles”. A propriedade “index” é utilizada para definir a lista de índices definida pelo usuário em vez de usar a lista padrão.

Aqui, queremos a lista de índices com os valores “10”, “11”, “12”, “13”, “14”, “16”, “17”, “18”, “19”, “20”, e 21”. Agora, nossa série terá a lista de índices começando em “10” em vez de “0”. Agora, armazene esta série para que possamos usá-la mais tarde no programa. Inicializamos um objeto de série “Rivers” e atribuímos a ele a série de saída gerada pela chamada do método “pd.Series()”. A série pode ser vista colocando-a em exibição usando a função “print()” do python.

A saída renderizada no terminal imprimiu uma série cuja lista de índices começa em 10 e termina em 21, o que significa que a série tem 21 valores.

A série será transformada em formato CSV com o método “Series.to_csv()”.

Invocamos o método “Series.to_csv()” com nossa série “Turkey”. Portanto, este método pegará os valores da série “Turkey” e os converterá em um formato de valores separados por vírgula. O resultado é salvo na variável “Converted_csv”. E, finalmente, a série convertida é impressa com o auxílio da função “print()”.

No instantâneo do resultado abaixo, você pode ver que os valores da série agora são alterados de forma que uma vírgula é usada para separá-los da lista de índices. Além disso, onde os valores estão ausentes, apenas o número do índice é impresso com uma vírgula.

Conclusão

A modificação de uma série de pandas para um formato CSV é uma abordagem prática. Isso pode ser feito usando a função pandas “Series.to_csv()”. Este guia colocou em prática duas técnicas para empregar este método. Na primeira ilustração, invocamos esse método para converter uma série com um DatetimeIndex em um formato de valores separados por vírgula. A segunda instância usou a função “Series.to_csv()”   para modificar uma série com algumas entradas ausentes em um formato CSV. Ambas as técnicas foram implementadas na prática usando a ferramenta “Spyder” no sistema operacional Windows.