Lista dos 10 melhores livros e descrições de ciência de dados para o generalista

Lista Dos 10 Melhores Livros E Descricoes De Ciencia De Dados Para O Generalista



Data Science é o campo de estudo que lida com grandes quantidades de dados usando métodos científicos, processos, algoritmos e sistemas para encontrar padrões invisíveis, derivar informações significativas, tomar decisões de negócios em empresas e também usar em instituições não comerciais. As instituições não comerciais incluem setores de saúde, jogos, reconhecimento de imagem, sistemas de recomendação, logística, detecção de fraude (instituições bancárias e financeiras), pesquisa na Internet, reconhecimento de fala, publicidade direcionada, planejamento de rotas aéreas e realidade aumentada. Data Science é um subconjunto da Inteligência Artificial. Os dados usados ​​para análise podem vir de muitas fontes diferentes e são apresentados em vários formatos. Alguns dos dados de origem podem ser padronizados; outros podem não ser padronizados.

Em outras palavras, diferentes metodologias são usadas para coletar os dados (plural de datum). Então, o conhecimento (conclusões valiosas) é extraído dos dados reunidos. No processo, após a coleta dos dados, é feita a pesquisa sobre eles (dados) para obtenção de novos dados (resultados) a partir dos quais os problemas são resolvidos.







Data Science como uma disciplina (principal) existe no nível de bacharelado e mestrado na universidade. No entanto, apenas poucas universidades no mundo oferecem a Ciência de Dados no Bacharelado ou Mestrado. No nível de Bacharelado, o aluno se forma com uma licenciatura em Ciência de Dados. Isto é como um grau de propósito geral. No nível de Mestrado, o aluno sai com uma Pós-Graduação em Data Science, com especialização em Data Analytics, Data Engineering ou como Data Scientist.



Pode surpreender o leitor e possivelmente infelizmente, que Aprendizado de Máquina, Modelagem, Estatística, Programação e Bancos de Dados são conhecimentos pré-requisitos para estudar Ciência de Dados no nível de Bacharelado, apesar de serem cursos universitários respeitados por seus próprios direitos, estudados em outras disciplinas em nível de Bacharelado ou Mestrado. Não obstante, quando um aluno for para uma universidade para cursar Ciência de Dados no nível de graduação, todos esses cursos ainda serão cursados, paralelamente ou antes dos cursos apropriados, para Ciência de Dados.



Data Science para Bacharel ou suas especializações como Data Analytics, Data Engineering ou como Data Scientist ainda estão em desenvolvimento; embora tenham chegado a um estágio em que são aplicados nas indústrias depois de estudados (na universidade). Data Science é uma disciplina relativamente muito nova, em geral.





Lembre-se de que você deve primeiro ser um generalista antes de se tornar um especialista. As distinções entre os programas de especialistas ainda não são claras. As distinções entre os programas generalistas e especializados ainda não estão claras.

Como Data Science é uma disciplina relativamente nova, os livros prescritos neste documento são baseados na cobertura do conteúdo e não na pedagogia (quão bem o livro ensina). E são para o programa de Bacharelado (generalista). Existem diferentes cursos generalistas.



A lista

Para mais detalhes e possível compra com cartão de crédito, é fornecido um hiperlink para cada um dos livros. Nenhum dos livros cobre todos os cursos generalistas.

Matemática essencial para ciência de dados: cálculo, estatística, teoria das probabilidades e álgebra linear

Escrito por: Hadrien Jean

  • Editora: Hadrien Jean
  • Data de publicação: após 30 de setembro de 2020
  • Idioma: Inglês
  • Número de páginas: ‎mais de 400

O conteúdo deste livro pode ser visto como o curso de matemática para Data Science. Embora não seja recomendado aprender Data Science sozinho, um graduado do ensino médio que deseja aprender Data Science sozinho deve começar com este livro.

Conteúdo: Cálculo; Estatística e Probabilidade; Álgebra Linear; Escalares e Vetores; Matrizes e Tensores; Extensão, Dependência Linear e Transformação Espacial; Sistemas de Equações Lineares; Autovetores e Autovalores; Decomposição de valor singular.

https://www.essentialmathfordatascience.com/

Um guia de bom senso para estruturas de dados e algoritmos: Aumente o nível de suas principais habilidades de programação / 2ª edição

Escrito por: Jay Wengrow

  • Editora: Pragmatic Bookshelf
  • Data de publicação: 15 de setembro de 2020
  • Idioma: Inglês
  • Dimensões: 7,5 x 1,25 x 9,25 polegadas
  • Número de páginas: ‎508

Este livro trata de algoritmos e estruturas de dados que são usados ​​em Ciência de Dados. Supondo que alguém esteja aprendendo Data Science sozinho depois de se formar no ensino médio, este é o próximo livro a ser lido depois de ler o livro de matemática anterior. Os programas de exemplo são fornecidos em JavaScript, Python e Ruby.

Conteúdo: Por que as estruturas de dados são importantes; Por que os algoritmos são importantes; Oh sim! Notação O grande; Acelerando seu código com Big O; Otimizando Código com e Sem Big O; Otimização para Cenários Otimistas; Big O no código do dia-a-dia; Pesquisa extremamente rápida com tabelas de hash; Criação de código elegante com pilhas e filas; Recursão recursiva com recursão; Aprender a Escrever em Recursivo; Programaçao dinamica; Algoritmos Recursivos para Velocidade; Estruturas de dados baseadas em nós; Acelerando todas as coisas com árvores de busca binárias; Mantendo suas prioridades em linha reta com pilhas; Não dói tentar; Conectando tudo com gráficos; Lidando com restrições de espaço; Técnicas para Otimização de Código

Ciência de dados mais inteligente: obtendo sucesso com dados de nível empresarial e projetos de IA / 1 st Editando

Escrito por: Neal Fishman, Cole Stryker e Grady Booch

  • Editora: Wiley
  • Data de publicação: 14 de abril de 2020
  • Idioma: Inglês
  • Número de páginas: ‎286

Conteúdo: Subindo a escada AI; Enquadrando a Parte I: Considerações para Organizações que Usam IA; Enquadramento Parte II: Considerações para trabalhar com dados e IA; Uma retrospectiva do Analytics: mais de um martelo; Um olhar para o futuro no Analytics: nem tudo pode ser um prego; Abordando Disciplinas Operacionais na Escada de IA; Maximizando o uso de seus dados: sendo orientado por valor; Valorizando Dados com Análise Estatística e Permitindo Acesso Significativo; Construindo para o Longo Prazo; Fim de uma jornada: um IA para AI.

Aprendizado de Máquina: Uma Perspectiva Probabilística (série Computação Adaptativa e Aprendizado de Máquina) Edição Ilustrada

Escrito por: Kevin P. Murphy

  • Editora: The MIT Press
  • Data de publicação: 24 de agosto de 2012
  • Idioma: Inglês
  • Dimensões: 8,25 x 1,79 x 9,27 polegadas
  • Número de páginas: ‎1104

Este livro é bom para iniciantes. Novamente, como todos os outros livros prescritos neste documento, este livro não cobre tudo o que é necessário para o programa generalista que, infelizmente, ainda não está finalizado (os programas especializados também ainda não estão finalizados). O iniciante típico aqui é um graduado do ensino médio com aprovação em matemática e ciência da computação.

Conteúdo: Introdução (Aprendizado de máquina: o que e por quê?, Aprendizado não supervisionado, Alguns conceitos básicos em aprendizado de máquina); Probabilidade; Modelos generativos para dados discretos; Modelos Gaussianos; estatísticas bayesianas; estatísticas frequentistas; Regressão linear; Regressão logística; Modelos lineares generalizados e família exponencial; Modelos gráficos direcionados (redes de Bayes); Modelos de mistura e o algoritmo EM; Modelos lineares latentes; Modelos lineares esparsos; Núcleos; processos Gaussianos; Modelos funcionais de base adaptativos; modelos de Markov e modelos ocultos de Markov; Modelos de espaço de estado; Modelos gráficos não direcionados (campos aleatórios de Markov); Inferência exata para modelos gráficos; inferência variacional; Mais inferência variacional; inferência de Monte Carlo; inferência de cadeia de Markov Monte Carlo (MCMC); Agrupamento; Aprendizagem da estrutura do modelo gráfico; Modelos de variáveis ​​latentes para dados discretos; Aprendizagem profunda.

Ciência de dados para negócios: o que você precisa saber sobre mineração de dados e pensamento analítico de dados / 1ª edição

Escrito por: Tom Fawcett e Foster Provost

  • Editora: O'Reilly Media
  • Data de publicação: 17 de setembro de 2013
  • Idioma: Inglês
  • Dimensões: 7 x 0,9 x 9,19 polegadas
  • Número de páginas: ‎413

Conteúdo: Pensamento analítico de dados; Problemas de negócios e soluções de ciência de dados; Introdução à Modelagem Preditiva: Da Correlação à Segmentação Supervisionada; Ajustando um Modelo aos Dados; Overfitting e sua prevenção; Semelhança, Vizinhos e Clusters; Pensamento analítico de decisão I: O que é um bom modelo?; Visualizando o desempenho do modelo; Evidências e Probabilidades; Representação e Mineração de Texto; Pensamento Analítico de Decisão II: Rumo à Engenharia Analítica; Outras Tarefas e Técnicas de Ciência de Dados; Ciência de Dados e Estratégia de Negócios; Conclusão.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Estatística prática para cientistas de dados: mais de 50 conceitos essenciais usando R e Python / 2ª edição

Escrito por: Peter Bruce, Andrew Bruce e Peter Gedeck

  • Editora: O'Reilly Media
  • Data de publicação: 2 de junho de 2020
  • Idioma: Inglês
  • Dimensões: 7 x 0,9 x 9,1 polegadas
  • Número de páginas: ‎368

Conteúdo: Análise Exploratória de Dados, Distribuições de Dados e Amostragem, Experimentos Estatísticos e Testes de Significância, Regressão e Predição, Classificação, Aprendizado de Máquina Estatístico, Aprendizado Não Supervisionado.

O Livro dos Porquês: A Nova Ciência de Causa e Efeito

Escrito por: Judea Pearl, Dana Mackenzie

  • Editora: Livro Básico
  • Data de publicação: 15 de maio de 2018
  • Idioma: Inglês
  • Dimensões: 6,3 x 1,4 x 9,4 polegadas
  • Número de páginas: ‎432

Enquanto muitos livros de ciência de dados usam a indústria de negócios pura para ilustração, este livro usa a indústria médica e outras disciplinas para ilustração.

Conteúdo: Introdução: Mind over Data; A Escada da Causalidade; De bucaneiros a porquinhos-da-índia: a gênese da inferência causal; Da evidência às causas: o reverendo Bayes conhece o Sr. Holmes; Confundindo e desconfundindo: ou, matando a variável à espreita; O Debate Cheio de Fumaça: Limpando o Ar; Muitos paradoxos!; Além do Ajuste: A Conquista da Intervenção do Monte; Contrafactuais: mundos de mineração que poderiam ter existido; Mediação: A Busca de um Mecanismo; Big Data, Inteligência Artificial e as Grandes Questões.

Construa uma carreira em ciência de dados

Escrito por: Emily Robinson e Jacqueline Nolis

  • Editora: Manning
  • Data de publicação: 24 de março de 2020
  • Idioma: Inglês
  • Dimensões: 7,38 x 0,8 x 9,25 polegadas
  • Número de páginas: ‎354

Conteúdo: Introdução à Ciência de Dados; Encontrando seu trabalho de ciência de dados; Estabelecendo-se em Ciência de Dados; Crescendo em sua função de ciência de dados.

https://www.manning.com/books/build-a-career-in-data-science

Ciência de dados para leigos / 2ª edição

Escrito por: Lillian Pierson

  • Editora: Para Leigos
  • Data de publicação: 6 de março de 2017
  • Língua inglesa
  • Dimensões: 7,3 x 1 x 9 polegadas
  • Número de páginas: ‎384

Este livro assume que o leitor já possui os conhecimentos pré-requisitos de matemática e programação.

Conteúdo:  Entendendo a ciência de dados; Explorando pipelines e infraestrutura de engenharia de dados; Aplicação de insights baseados em dados para negócios e indústria; Machine Learning: aprendendo com dados com sua máquina; Matemática, probabilidade e modelagem estatística; Usando Clustering para Subdividir Dados; Modelagem com Instâncias; Construindo modelos que operam dispositivos de Internet das Coisas; Seguindo os Princípios de Design de Visualização de Dados; Usando D3.js para visualização de dados; Aplicativos baseados na Web para design de visualização; Explorando as melhores práticas em design de painéis; Fazendo Mapas a partir de Dados Espaciais; Usando Python para Ciência de Dados; Usando Open Source R para Ciência de Dados; Usando SQL em Ciência de Dados; Fazendo Ciência de Dados com Excel e Knime; Data Science in Journalism: Definindo os Cinco Ws (e um H); Investigando a Ciência de Dados Ambientais; Ciência de dados para impulsionar o crescimento no comércio eletrônico; Usando a ciência de dados para descrever e prever atividades criminosas; Dez recursos fenomenais para dados abertos; Dez ferramentas e aplicativos gratuitos de ciência de dados.

Mineração de conjuntos de dados maciços / 3 terceiro Editando

Roteiro: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Editora: Cambridge University Press
  • Data de publicação: 13 de fevereiro de 2020
  • Língua inglesa
  • Dimensões: 7 x 1 x 9,75 polegadas
  • Número de páginas: ‎565

Este livro também assume que o leitor já possui os conhecimentos pré-requisitos de matemática e programação.

Conteúdo: Mineração de Dados; MapReduce e a nova pilha de software; Algoritmos Usando MapReduce; Encontrar itens semelhantes; Fluxos de Dados de Mineração; Análise de links; Conjuntos de itens frequentes; Agrupamento; Publicidade na Web; Sistemas de recomendação; Gráficos de redes sociais de mineração; Redução de dimensionalidade; Aprendizado de Máquina em Grande Escala.

Conclusão

As distinções entre os programas de especialistas ainda não são claras. As distinções entre os programas generalistas e especializados também não são claras. No entanto, depois de ler a lista de livros fornecida, o leitor estará em condições de apreciar melhor os papéis especiais de analista de dados, engenharia de dados e cientista de dados e, em seguida, seguir em frente.