MapReduce – Python (Parte 1)
Hoje irei falar de um tópico com o qual estou tendo o meu primeiro contato através do curso de Data Science – que está sendo oferecido no Coursera – e dar alguns exemplos utilizando Python.
O MapReduce é um paradigma que nos permite trabalhar com uma enorme massa de dados utilizando um algoritmo paralelizado e distribuído. Como o próprio nome já nos deixa claro, é necessário explicitarmos 2 etapas distintas desse processamento, o Map e o Reduce.
Drawing Dynamics Visualizations
Bret Victor, ex-designer da Apple, em um seminário, mostrando uma maneira inovadora de se reportar números. Outros trabalhos dele podem ser encontrados em seu site: http://worrydream.com/
Mais um curso no Coursera…
Até o fim de junho, estarei fazendo o curso Introduction to Data Science no Coursera. Até o momento, estou empolgado com o curso e pretendo finalizá-lo!
Apesar da primeira semana ter sido focada em introduzir conceitos básicos, o primeiro assignment, focado em análise de sentimentos utilizando uma API do Twitter, foi bem interessante – apesar de alguns probleminhas com o upload de um dos problemas – e ajuda a ter noção do que vem pela frente! =)
Infelizmente, devo demorar um pouco para postar os reviews dos cursos que já terminei e o passo a passo de alguns dos algoritmos de busca “apresentados” no primeiro post.