Get Even More Visitors To Your Blog, Upgrade To A Business Listing >>

Afinal de contas, o que é análise estatística e mineração de dados?

A Análise estatística e mineração de Dados, se trata da Prospeção de dados ou mineração de dados, também conhecida pelo termo inglês data mining, este é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados, simples né?

Data mining

Daniel Dionne / Flickr

No campo da administração, a mineração de dados é o uso da tecnologia da informação para descobrir regras, identificar fatores e tendências-chave, descobrir padrões e relacionamentos ocultos em grandes bancos de dados para auxiliar a tomada de decisões sobre estratégia e vantagens competitivas.

Data mining é uma expressão inglesa ligada à informática cuja tradução é mineração de dados. Consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padrões, associações, mudanças e anomalias relevantes.

A Análise estatística de dados

song zhen / Flickr

Esse é um tópico recente em ciência da computação, mas utiliza várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões.

Algoritmos de aprendizagem

Matt Brown / Flickr

A mineração de dados é formada por um conjunto de ferramentas e técnicas que através do uso de algoritmos de aprendizagem ou classificação baseados em redes neurais e estatística, são capazes de explorar um conjunto de dados, extraindo ou ajudando a evidenciar padrões nestes dados e auxiliando na descoberta de conhecimento. Esse conhecimento pode ser apresentado por essas ferramentas de diversas formas: agrupamentos, hipóteses, regras, árvores de decisão, grafos, ou dendrogramas.

O ser humano sempre aprendeu observando padrões, formulando hipóteses e testando-as para descobrir regras. A novidade da era do computador é o volume enorme de dados que não pode mais ser examinado à procura de padrões em um prazo razoável. A solução é instrumentalizar o próprio computador para detectar relações que sejam novas e úteis. A mineração de dados (MD) surge para essa finalidade e pode ser aplicada tanto para a pesquisa cientifica como para impulsionar a lucratividade da empresa madura, inovadora e competitiva. Também a multidisciplinaridade da mineração de dados pode ser considerada inevitável devido à integração de diversas áreas de conhecimento no processo de análise, abordando áreas de pesquisas que envolvem estatística, matemática e a computação, as quais são disciplinas fundamentais para realização do processo de mineração de dados.

Diariamente as empresas acumulam grande volume de dados em seus aplicativos operacionais. São dados brutos que dizem quem comprou o quê, onde, quando e em que quantidade. É a informação vital para o dia-a-dia da empresa. Se fizermos estatística ao final do dia para repor estoques e detectar tendências de compra, estaremos praticando business intelligence (BI). Se analisarmos os dados com estatística de modo mais refinado, à procura de padrões de vinculações entre as variáveis registradas, então estaremos fazendo mineração de dados. Buscamos com a MD conhecer melhor os clientes, seus padrões de consumo e motivações. A MD resgata em organizações grandes o papel do dono atendendo no balcão e conhecendo sua clientela. Através da MD, esses dados agora podem agregar valor às decisões da empresa, sugerir tendências, desvendar particularidades dela e de seu meio ambiente e permitir ações melhor informadas aos seus gestores.

Pode-se então diferenciar o business inteligence (BI) da mineração de dados (MD) como dois patamares distintos de atuação. O primeiro busca subsidiar a empresa com conhecimento novo e útil acerca do seu meio ambiente e funciona no plano estratégico. O Segundo visa obter a partir dos dados operativos brutos, informação útil para subsidiar a tomada de decisão nos escalões médios e altos da empresa e funciona no plano táctico.

Conceitos de mineração de dados

julochka / Flickr

A mineração de dados é o processo de descoberta de informações acionáveis em grandes conjuntos de dados.A mineração de dados usa análise matemática para derivar padrões e tendências que existem nos dados.Normalmente, esses padrões não podem ser descobertos com a exploração de dados tradicional pelo fato de as relações serem muito complexas ou por haver muitos dados.

Padrões e tendências

Patrick Finnegan / Flickr

Os padrões e tendências podem ser coletados e definidos como um modelo de mineração de dados.Os modelos de mineração podem ser se aplicados a cenários específicos, como:

  • Previsão: Estimando vendas, prevendo cargas de servidor ou tempo de inatividade de servidor
  • Risco e probabilidade: Escolhendo os melhores clientes para malas diretas, determinando o ponto equilibrado provável para cenários de risco, atribuindo probabilidades a diagnósticos ou outros resultados
  • Recomendações: Determinando quais produtos são mais prováveis de serem vendidos juntos, gerando recomendações
  • Localizando sequências: Analisando seleções de cliente em um carrinho de compras, prevendo os próximos eventos prováveis
  • Agrupamento: Separando clientes ou eventos em cluster de itens relacionados, analisando e prevendo afinidades

Encontrar padrões requer que os dados brutos sejam sistematicamente “simplificados” de forma a desconsiderar aquilo que é específico e privilegiar e/ou valorizar tudo o que for generalizado. Em um determinado produto uma única data pode apenas significar que esse cliente em particular procurava grande quantidade desse produto naquele exato momento. Mas isso provavelmente não indica nenhuma tendência de mercado.

Bom trabalho!



This post first appeared on Bagarai, Esporte De Um Jeito Diferente, please read the originial post: here

Share the post

Afinal de contas, o que é análise estatística e mineração de dados?

×

Subscribe to Bagarai, Esporte De Um Jeito Diferente

Get updates delivered right to your inbox!

Thank you for your subscription

×