PRESENTATION OUTLINE
Vivemos em uma era onde a mineração de dados é um fator muito importante se tratando, por exemplo, do fato de obter uma vantagem no mercado sobre a concorrência. Mineração de dados pode ser utilizada em diversas áreas, como administrativa, científica, comercial, educacional, governamental, social, entre outras.
Untitled Slide
- Bancos: identificar padrões para auxiliar no gerenciamento de relacionamento com o cliente;
- Cartão de Crédito: identificar segmentos de mercado, identificar padrões de rotatividade;
- Cobrança: detecção de fraudes;
- Telemarketing: acesso facilitado aos dados do cliente;
- Segurança: na detecção de atividades terroristas e criminais;
- RH: identificação de competências em currículos;
Weka é um Software livre do tipo open source para mineração de dados, desenvolvido em Java, dentro das especificações da GPL (General Public License).
Seu ponto forte é a tarefa de classificação, mas também é capaz de minerar regras de associação e clusters de dados. Pode ser utilizada no modo console ou através da interface gráfica Weka Explorer. Ao longo dos anos se consolidou como a ferramenta de data mining mais utilizada em ambiente acadêmico.
Untitled Slide
- Software Livre
- Portabilidade
- Uma coleção completa de dados de pré-processamento e técnicas de modelagem
- Facilidade de utilização com sua interfaces gráficas de usuário
O WEKA é uma excelente ferramenta de mineração de dados principalmente para iniciantes no qual é uma ferramenta que tem uma curva de aprendizado menor comparado ao R.
Entretanto uma ferramenta também open source que vem agradando diversos praticantes de mineração de dados é o Rapidminer que conta com uma suíte bem sugestiva e tem uma curva de aprendizado muito baixa, além de contar com possibilidade de se realizar ETL de alguns dados na própria suíte.
O RapidMiner tem como principais diferenciais a parte de pré-processamento de dados, a baixa curva de aprendizado para início dos trabalhos em mineração de dados, além de produzir gráficos de ótima qualidade.
O RapidMiner tem como desvantagem o “travamento” de diversos recursos que são liberados somente com a versão paga, não ter uma comunidade tão ativa, e pouca documentação (livros) dirigidos para o seu uso prático.
Untitled Slide
- O RapidMiner pode lidar com conjuntos de dados maiores do que o Weka
- O consumo de memória do RapidMiner é menor em relação ao Weka, mesmo lidando com um conjunto maior de dados