arquivo | Data Science RSS para esta seção

Próximos Cursos relacionados a Data Science

Data Analysis and Statistical Inference – Coursera

  • Início: 17 Fev 2014
  • Duração do curso: 10 semanas
  • Esforço estimado: 6h-8h por semana

Leia Mais…

Bias vs. Variância (Parte 3)

Depois de tanto tempo, a terceira parte da série Bias vs. Variância saiu!

Apenas relembrando, a série foi dividida da seguinte forma:

  • Primeira parte: conceito de bias e variância
  • Segunda parte: cálculo do bias e da variância
  • Terceira parte: métodos de redução do bias e da variância

Em resumo, enquanto o bias está ligado à capacidade das predições do modelo se aproximarem dos valores reais, a variância está relacionada à consistência dos resultados do modelo em diferentes conjuntos de dados.

Apesar de sabermos calcular “explicitamente” o bias e a variância de um modelo, dependendo do tamanho do conjunto de dados (número de variáveis e samples) e da complexidade do modelo, o processo pode ser computacionalmente caro. Desta forma, precisamos ter outras maneiras de inferir se estamos com problemas de bias ou variância.

Leia Mais…

The Rise of Analytics 3.0

Excelente apresentação de Thomas H. Davenport, considerado um dos Data Scientists mais influentes do mundo.

The Rise of Analytics 3.0: How to Compete in the Data Economy

Nesta apresentação, ele divide Analytics em 3 períodos:

  1. Analytics 1.0 -> Tradicional
    • Basicamente análise descritiva e reporting
    • Dados internos e estruturados
    • Pouco contato entre analistas e área de negócios
    • Suporte à decisão interna
  2. Analytics 2.0 -> Big Data
    • Análise preditiva e prescritiva
    • Dados complexos, não estruturados e de diferentes fontes (internos e externos)
    • Novos recursos computacionais e analíticos (Machine Learning!)
    • Data Scientists
    • Produtos e serviços baseados em dados (empresas online)
  3. Analytics 3.0 -> Data Economy
    • Todas as decisões são baseadas ou influenciadas pelos dados
    • Rápida entrega de insights
    • Ferramentas de análise estão disponíveis para quem toma as decisões
    • Análise é incorporada dentro dos processos operacionais e de decisão
    • Todas as empresas podem criar produtos e serviços baseados em dados

How To Build Data Science Teams?

Avatar de Ryan SwanstromRyan Swanstrom

Companies everywhere are struggling to assemble data science teams. Here are a couple of videos to help answer the following questions and more.

  • How do you assemble a team?
  • What skills do you need?
  • Where do you look for data scientists?

     

    DJ Patil, one of the stars of the data science world, answers a bunch of great questions in this talk. It is a couple years old, but still relevant.

    What are the Characteristics to look for in a Data Scientist?

  • Curiosity
  • Passion for playing with data
  • History of having to manipulate data to solve problems

 

What are the Key Data Science Skills?

  • Finding Data Sources
  • Working with large data sets despite constraints
  • Cleaning data
  • Merging data sets
  • Visualization
  • Building tools for others to use

 

Where to look for data science team members?

  • Internal
  • Interns
  • Other fields (physics, neurology, sciences)
  • Academic counterparts

 

Principles for Data…

Ver o post original 152 mais palavras

At Netflix, big data can affect even the littlest things

Avatar de Derrick HarrisGigaom

You weren’t alone. You fired up your Netflix (s nflx) device a couple Fridays ago, happened across Orange is the New Black in your Netflix recommendations, started watching the first episode and then wondered why you’d never heard of it. Netflix’s other original programming — House of Cards and Arrested Development — received huge preavailability marketing, and they weren’t even this good.

The answer to your question, like the answer to so many other questions these days, is data. Netflix didn’t have to spend millions of dollars advertising the new show hoping you would tune in — it knew you’d see it in the recommendations, it knew you’d give it a try and it knew you’d like it. According to the company during its earnings call on Monday, “Orange is the New Black” actually had more viewers watching more hours than during its first week than its predecessors had.

Ver o post original 873 mais palavras

Machine Learning: 12 importantes lições

O conhecimento que não é facilmente encontrado em livros e proveniente da experiência de pesquisadores/profissionais da área.

A Few Useful Things to Know about Machine Learning (pdf)

Artigo escrito por Pedro Domingos (2012), Professor do Departamento de Ciência da Computação e Engenharia na Universidade de Washington.

  • Learning= Representation + Evaluation + Optimization
  • It’s Generalization That Counts
  • Data Alone Is Not Enough
  • Overfitting Has Many Faces
  • Intuition Fails In high dimensions
  • Theoretical guarantees are not what they seem
  • Feature Engineering Is The Key
  • More Data Beats A Cleverer Algorithm
  • Learn Many Models, Not Just One
  • Simplicity Does Not Imply Accuracy
  • Representable Does Not Imply Learnable
  • Correlation Does Not Imply Causation

A practical intro to Data Science

Uma vasta lista de recursos – artigos, livros, cursos, etc – sobre as diferentes disciplinas importantes para quem está interessado em Data Science:

http://blog.zipfianacademy.com/post/46864003608/a-practical-intro-to-data-science

😉

Crie um site como este com o WordPress.com
Comece agora