Opções e comparação de compactação de arquivos do Linux

Linux File Compression Options



A compactação, em geral, é um método útil que essencialmente codifica informações usando menos dados do que o original. No caso do Linux, existem várias opções de compactação, cada uma com seus próprios benefícios.

Uma distribuição Linux genérica oferece acesso a um punhado de mecanismos de compressão simples e realmente úteis. Este artigo se concentrará apenas neles.







Tipos de compressão

A compactação é a codificação e a representação de informações usando menos bits do que originalmente. No caso de compactação de arquivo, um método de compactação utiliza seu próprio algoritmo e cálculo matemático para gerar uma saída que geralmente é menor que o tamanho do arquivo original. Por causa de como funciona a compactação diferente e da natureza aleatória dos arquivos, a quilometragem pode variar muito.



Existem 2 tipos de compressão.



  • Compressão com perda : Este é um tipo de compactação arriscado que não garante a integridade dos dados. Essencialmente, uma vez compactado, há o risco de que o arquivo original não possa ser reconstruído usando o arquivo compactado.
    Um exemplo sólido desse tipo de compressão é o conhecido formato MP3. Quando um MP3 é criado a partir do arquivo de áudio original, é significativamente menor do que o arquivo de música de origem original. Isso causa perda de alguma qualidade de áudio.
  • Compressão sem perdas : Este é o tipo de compressão mais amplamente utilizado. Usando um método de compactação sem perdas, o arquivo original pode ser reconstruído a partir do arquivo compactado. Os métodos de compressão que discutirei neste artigo são todos métodos de compressão sem perdas.

Compressão Linux

A maioria dos métodos de compressão estão disponíveis na ferramenta alcatrão . Quanto à compactação zip, usaremos o fecho eclair ferramenta. Supondo que seu sistema já tenha essas ferramentas instaladas, vamos começar.





Primeiramente, precisamos de um arquivo de teste. Execute o seguinte comando para criar um.

$base64/dev/urandom| cabeça -c 20000000 >arquivo.txt



Ele criará um arquivo de texto com tamanho de 20 MB.

Agora, vamos criar 10 cópias do arquivo. Juntos, são 200 MB.

Zip para compressão

Zip é bastante comum. Para criar um arquivo zip, a ferramenta zip requer a seguinte estrutura de comando.

$fecho eclair <saída>.fecho eclair<entrada>

Para compactar todos os arquivos no diretório de teste em um único arquivo zip, execute este comando.

$fecho eclairtest.zip*

O tamanho da entrada foi de 200 MB. Após a compressão, agora é 152 MB!

Por padrão, a ferramenta zip aplicará a compactação DEFLATE. No entanto, também é capaz de usar compactação bzip2. Além disso, você também pode criar arquivos zip protegidos por senha! Saiba mais sobre zip .

Tar para compactação em Linux

O alcatrão não é um método de compressão. Em vez disso, é mais frequentemente usado para criar arquivos. No entanto, ele pode implementar vários métodos de compactação populares para o arquivo.

Para lidar com o arquivo tar (também conhecido como tarball), existe a ferramenta tar. Saiba mais sobre tar. Geralmente, a ferramenta tar usa a seguinte estrutura de comando.

$alcatrão <opções> <arquivo de saída> <entrada>

Para adicionar os arquivos de teste em um único arquivo tar, execute o seguinte comando.

$alcatrão -cvftest.tar*

Aqui, o tamanho do arquivo permanece o mesmo.

Gzip para compactação em Linux

GNU Zip ou gzip é outro método de compactação popular que, em minha opinião, é melhor do que o zip tradicional por causa de sua melhor compactação. É um produto de código aberto criado por Mark Adler e Jean-Loup Gailly que foi originalmente destinado a substituir o UNIX comprimir Utilitário.

Para gerenciar arquivos gzip, existem 2 ferramentas disponíveis: tar e gzip. Vamos verificar os dois.

Primeiro, a ferramenta gzip. Esta é a aparência da estrutura do comando gzip.

$gzip <opção> <entrada>

Por exemplo, o comando a seguir substituirá test1.txt pelo arquivo compactado test1.txt.gz.

$gzip -vtest1.txt

Se você deseja compactar um diretório inteiro usando gzip, execute este comando. Aqui, o sinalizador -r é para compactação recursiva. O Gzip percorrerá todas as pastas e compactará os arquivos individuais em cada uma delas.

$gzip -r <folder_path>

Gzip suporta vários valores de força de compressão, começando de 1 (menor compressão, mais rápido) a 9 (melhor compressão, mais lento).

$gzip -v -9 <Arquivo>

Para melhor controle sobre a saída e facilidade de uso, o tar é melhor para a tarefa. Execute o seguinte comando.

$alcatrão -cvzftest.tar.gz*

O resultado é semelhante ao zip usando DEFLATE, resultando em 152 MB após a compactação.

Bzip2 para compactação em Linux

Bzip2 é uma ferramenta gratuita e de código aberto que usa o algoritmo Burrows-Wheeler para compressão. Introduzido pela primeira vez em 1996, o bzip2 é amplamente usado como uma alternativa à compactação gzip.

Como o gzip, existem 2 ferramentas para trabalhar com o bzip2: tar e bzip2.

A ferramenta bzip2 funciona de forma semelhante à ferramenta gzip. Ele só pode funcionar com um único arquivo por vez. Aqui está a estrutura de comando.

$bzip2 <opção> <entrada>

Vamos compactar o arquivo test1.txt. Aqui, o sinalizador -v é para o modo detalhado.

$bzip2 -vtest1.txt

Semelhante ao gzip, o bzip2 também oferece suporte a diferentes níveis de compactação, começando de 1 (padrão, menos uso de memória) a 9 (compactação extrema, alto uso de memória).

$bzip2 -v -9 <Arquivo>

A melhor maneira de usar a compactação bzip2 é usando o tar. Use o seguinte comando.

$alcatrão -cvjftest.tar.bz2*

A compressão é ligeiramente melhorada do que as anteriores. Agora, o tamanho do arquivo foi reduzido para 151,7 MB.

XZ para compactação em Linux

É relativamente novato no campo da compressão. Lançado pela primeira vez em 2009, tem visto um crescimento constante de uso desde então.

A ferramenta de compactação xz usa o algoritmo LZMA2 que é conhecido por maior taxa de compactação em comparação com gzip e bzip2, tornando-a uma ótima escolha quando você deseja economizar a quantidade máxima de espaço em disco. No entanto, isso acarreta o custo de maiores requisitos de memória e consumo de tempo.

O arquivo criado pela ferramenta de compactação XZ possui a extensão .xz. Para compactar um único arquivo, você pode chamar diretamente a ferramenta XZ.

$xz<opção> <Arquivo>

Por exemplo, execute o seguinte comando para compactar o arquivo test1.txt.

$xz-vtest1.txt

Semelhante a outros métodos de compressão mencionados, xz também oferece suporte a várias faixas de força de compressão, começando de 1 (menor compressão, mais rápida) a 9 (melhor compressão, mais lenta). Se você não se preocupa com o tempo e só quer economizar espaço, vá ao extremo.

$xz-v -9 <Arquivo>

Para criar um arquivo XZ compactado a partir de todos os arquivos de teste, execute este comando.

$alcatrão -cvJftest.tar.xz*

Aqui, o tamanho do arquivo de saída é 153,7 MB.

Extraindo arquivos compactados

Extrair os arquivos que criamos é mais fácil do que criá-los. Para extrair um arquivo zip, use a seguinte estrutura de comando.

$descompactar <nome do arquivo>.fecho eclair-d <destino>

Para extrair o arquivo zip que criamos, execute este comando. Isso irá extrair todo o conteúdo no mesmo diretório.

$descompactartest.zip

Para extrair os arquivos tar, tar.gz, tar.bz2 e tar.xz, temos que usar o alcatrão ferramenta. O seguinte comando tar é aplicável para extrair todos eles.

$alcatrão -xvf <archive_filename>

Por exemplo, vamos extrair todos os arquivos do arquivo compactado bz2.

$alcatrão -xvftest.tar.bz2

Para descompactar um arquivo gzip (não tar.gz), execute este comando.

$gzip -d <gzip_file>

Da mesma forma, o seguinte comando descompactará o arquivo bzip2.

$bzip2 -d <bzip2_file>

A mesma estrutura de comando se aplica ao arquivo xz.

$xz-d <xz_file>

Pensamentos finais

Felizmente, agora você tem conhecimento suficiente para lidar com as tarefas de compressão em diferentes circunstâncias. Dependendo do requisito específico, todos os métodos de compressão oferecem recursos muito atraentes.

Uma coisa importante a notar é que o resultado da compressão não será o mesmo o tempo todo. Com entrada de dados diferente, a saída será diferente. Por exemplo, em alguns casos, xz pode oferecer um resultado de compressão insano, enquanto neste exemplo, não o fez. O mesmo vale para outros métodos.

Para aprender mais sobre essas ferramentas, verifique suas respectivas páginas de manual.

$cara fecho eclair