Handwritten digit recognition – Part1

Published by:

OBS: There is a version in portuguese.

Handwritten digit recognition task was one of first great successes of machine learning methods. Nowadays, the task can be carried out by multiple specialized libraries with very high accuracy (> 97% of correct answers), such that many times, despite of indirectly we use these features in tablets and smartphones, in general we do not know exactly how the method works.

3_032.BMP

Thinking about it, as I worked with this problem before, I will demonstrate in this post how the process works, the techniques used and how to implement it with R language. To begin, we will work with the problem of recognizing digits 0,1,2 , 3,4,5,6,7,8, or 9, i.e. a classification problem with 10 categories.

I’ll try to work here implementing all the modeling only with R base functions and a few extra packages with the required functions and algorithms; in the next post, I can try to use other packages to automate the various modeling tasks.

Continue reading

Share Button

Reconhecimento de dígitos escritos a mão – Parte 1

Published by:

3_032.BMP

A tarefa de reconhecimento de dígitos escritos a mão foi um dos primeiro grandes sucessos dos métodos de aprendizado de máquina. Hoje em dia, a tarefa pode ser realizada por diversas bibliotecas especializadas com altíssima acurácia (> 97% de acertos), tal que muitas vezes, apesar de utilizarmos indiretamente esses recursos em tablets e smartphones, em geral não sabemos exatamente como o método funciona.

3_032.BMP

Pensando nisso, como já trabalhei com esse problema antes, vou demonstrar nesse post como o processo funciona, as técnicas utilizadas e como implementar tudo na linguagem R. Para começar, vamos trabalhar com o problema de reconhecer se o dígito é 0,1,2,3,4,5,6,7,8,ou 9, isto é, um problema de classificação com 10 categorias.

Vou tentar trabalhar aqui implementando toda a modelagem somente com as funções do pacote base e uns poucos pacotes extras com as funções e algoritmos necessários; em um próximo post, posso tentar utilizar outros pacotes para automatizar as diversas etapas da modelagem.

Continue reading

Share Button

Ganhe U$100,00 de créditos no Digital Ocean!

Published by:

u100_do

Essa é uma super dica para estudantes! Existe um projeto do Github chamado Student Developer Pack por meio do qual o Github Education oferece diversos serviços gratuitos para estudantes que estejam trabalhando com desenvolvimento. São diversos serviços que você pode verificar no link, mas com alguns destaques: uma conta com 5 repositórios privados no Github e U$100,00 de créditos no Digital Ocean!

Continue reading

Share Button

WordPress do Digital Ocean

Published by:

creditoDO

Atualização IMPORTANTE: Para quem quiser experimentar com o  DIGITAL OCEAN, eu ATUALIZEI todos os links para o programa de “referral” deles. O que é isso? Se você se cadastrar por um destes links vai ganhar U$10,00 em créditos para brincar com o Digital Ocean! Isto representa 2 meses de um máquina virtual mais simples. Participe! Só para testar eu fiz a inscrição usando o e-mail da universidade:

Continue reading

Share Button

Como fazer mapas eleitorais

Published by:

mapa_cru

Se você vota no Aécio e chegou aqui por meio dessa figura, calma, não tenha um derrame, os dados são fictícios! Para descontrair um pouco do clima das eleições, hoje eu vou mostrar como criar mapinhas eleitorais. Esses mapinhas são muito interessantes, e além de dados de votação, você pode incluir qualquer tipo de dados que quiser nesses mapas. Eu escolhi o mapa da cidade de São Paulo para mostrar como é possível fazer mesmo os mapas com maior granularidade, desde que você possuas os shapes do mapa que quiser fazer.


Continue reading

Share Button

Leitura da PNAD 2013 com o R

Published by:

pnad2013

Com o erro recente na divulgação dos resultados da PNAD 2013, o nome do IBGE e também os resultados dessa pesquisa, chegaram na grande mídia de um forma muito negativa. Ainda assim, a maioria das pessoas desconhece o que é a PNAD, como esses dados são obtidos e como eles podem ser baixados e utilizados. Neste post vou fornecer uma breve explicação do que é PNAD, como esses dados são distribuídos (na forma de microdados) e como você pode facilmente obtê-los e utiliza-los a partir de ferramentas gratuitas como o R.

Continue reading

Share Button

Data Preparation – Part II

Published by:

This time i will talk about how to deal with large text files in chuncks with R. Just to provide some real data to work with download Airlines data, relative to 1988; from now on i will work with this file.

Continue reading

Share Button