terça-feira, 24 de junho de 2008
Inteligência Empresarial: ferramentas de apoio à tomada de decisão
Autores: Manoel Flávio Leal e Jefferson Carlos Martins
1. Introdução
A curiosidade, a busca e a descoberta de novos conhecimentos surgiram desde que o homem veio ao mundo. Esta inquietação permanente provocada pelo exercício contínuo do pensamento é reflexo daquilo que só os seres humanos têm de forma plena: a inteligência.
A evolução da busca do conhecimento está em constante crescimento nos últimos anos alcançou tal velocidade que foi inevitável que os cientistas buscassem transplantar as formas de raciocínio, memorização e pensamento (formulação de hipóteses) para máquinas, algoritmos e sistemas que permitiriam, de forma integrada, processar quantidades maiores de informação, liberando o homem de uma série de tarefas repetitivas como memorização, cálculos e hipóteses.
Os pesquisadores com o passar dos anos desenvolveram diversas ferramentas para suprir essas necessidades, entre elas estão técnicas de KDD (Knowledge Discovery Database), técnicas essas que têm como objetivo extrair conhecimentos em bases de dados. Em paralelo, as empresas começaram a armazenar cada vez mais dados de seus clientes/produtos, surgindo, assim, a necessidade de transformar estes dados em informações para suportar a tomada de decisão dos executivos.
As empresas cada vez mais precisarão conhecer os seus clientes/produtos através de sua base de informações para atender esta necessidade, nos últimos anos o Data Warehouse (DW) que tem sido apresentado como a solução para este tipo de problema, mas nem sempre esta é a melhor solução. Existem outras ferramentas tais como Database Marketing e Data Mining, que são melhores e apresentam custo bem menor, dependendo do escopo do problema. O objetivo deste artigo é apresentar essas novas ferramentas de apoio e fazer um pequeno comparativo entre Data Warehouse e Database Marketing.
2. Database Marketing (DBM)
Todos falam que o mundo está mudando, que as empresas precisam conhecer cada um de seus clientes, suas individualidades, suas necessidades, para que seja possível atendê-los de forma individualizada e sempre atender as suas necessidades de novos produtos/serviços. Na verdade, isto já existe há muito tempo. Isto é o que aquele pequeno comerciante da mercearia próxima da sua casa, provavelmente na sua infância, já fazia. Conhecia tudo sobre você e sua família, seus hábitos de consumo e principalmente como você gostava de ser tratado. O problema surge agora. O pequeno comerciante deveria ter em média uns cinqüenta clientes, e como conhecer um milhão de clientes de uma empresa? Surge então nesse contexto uma ferramenta que tem como objetivo gerenciar essas informações dos clientes. Esta ferramenta chama-se Database Marketing.
Para (Jackson, 2000), o Database Marketing é um método de longo prazo, voltado para o cliente e profundamente baseado em informações. O Database pode ser utilizado para interligar e orientar os esforços de marketing atuais, assim como para construir uma base completa de informações, de modo a orientar futuros projetos.
O Database Marketing é mais do que uma ferramenta, na verdade é um conjunto de habilidades. Habilidades estas que são compostas de quatro pilares:
- Marketing: A função do marketing abrange a consultoria estratégica e a execução criativa. É o profissional de marketing que vai identificar quais serão as informações necessárias para o desenvolvimento da estratégia de marketing com os seus clientes ou clientes em potencial.
- Tecnologia: Um ponto crucial na tecnologia é que o software de gestão do Database Marketing seja de conhecimento da empresa. Em muitos casos, quando esse controle é terceirizado, a empresa acaba perdendo o controle do que acontece com suas informações estratégicas.
- Estatística: Após a criação da base de dados, as habilidades em estatística são a força que move o Database Marketing. Os dados não têm valor algum se não puderem ser acessados de uma maneira que agreguem valor. A habilidade de segmentar dados e criar modelos permite que o profissional de marketing aperfeiçoe o processo de utilização das informações.
- Gerenciamento de dados: É fundamental para o Database Marketing, é aqui que o profissional de marketing deverá definir quais serão as informações necessárias para que o Database Marketing consiga responder todas demandas dos executivos. Fica aqui o lembrete para os profissionais de marketing: “Se colocarmos lixo (dados inconsistentes) no banco de dados, teremos lixo (informações conflitantes) como resposta”.
Para os profissionais de marketing pode-se dizer que os quatro pilares seriam como os quatro “Ps” da definição clássica do marketing. Produto, preço, praça e promoção.
2.1 Principais utilidades e características de DBM
O Database Marketing tem como objetivo auxiliar o profissional de marketing, através do gerenciamento de informações sobre os seus clientes e a comunicação através de diversos canais de contato. A seguir serão apresentadas as principais utilidades e características que tornam o Database Marketing uma ferramenta imprescindível para as empresas que se encontram em mercados competitivos.
2.1.1 Identificar os melhores clientes
O Database Marketing tem como tarefa fundamental possibilitar que a empresa identifique seus melhores clientes, possibilitando, assim, a geração de lucro no decorrer do tempo.
Todos sabem que as empresas têm maior interesse em manter seus clientes, do que em agregar novos clientes à sua base, devido ao seu preço de aquisição que pode chegar a ser cinco vezes maior do que manter um cliente da empresa.
Existem dois métodos utilizados freqüentemente para identificar os melhores clientes:
- RFV (Recência, Freqüência e Valor): Utilizando a análise RFV é possível construir um modelo que reflete o valor atual do cliente para a empresa, sendo possível também traçar uma previsão do seu valor em longo prazo.
- Análise Comparativa: Sua finalidade é a criação de segmentos de clientes na base da empresa. Uma vez definido este segmento, tenta-se buscar, em listas externas, clientes com as mesmas características dos segmentos encontrados na empresa.
2.1.2 Conquistar novos clientes
Quando se fala na conquista de novos clientes usando Database Marketing, as empresas podem definir dois tipos de clientes:
- Clientes com o mesmo perfil dos pertencentes à empresa;
- Clientes da concorrência.
Na aquisição de clientes com mesmo perfil dos pertencentes à empresa, um artifício amplamente utilizado é a compra de listas externas contendo o máximo de informações semelhantes às existentes na empresa. Com a posse dessa lista as informações são inseridas no Database Marketing. Em seguida, são realizados relacionamentos para identificar quais clientes da lista possuem perfil semelhante aos clientes da empresa. Uma vez identificado, monta-se uma ação de marketing para agregá-lo à base de clientes da empresa.
2.1.3 Tratamento de dados e de duplicação
Alguns dos dados existentes nas bases de dados operacionais são irrelevantes, impossibilitando, assim, a produção de informações. Este é um grande problema que o Database Marketing precisa resolver antes de conseguir suportar a tomada de decisão dos profissionais de marketing. Em geral os dados existentes nas bases de dados operacionais não possuem alguns critérios de validação, tampouco um tipo de padronização.
Devido a esses fatores faz-se necessária a utilização de processos de tratamento de dados, que consiste, na maioria das vezes, em identificar clientes que estão duplamente cadastrados nas bases de dados, sendo assim considerados dois clientes distintos em vez de um, esse trabalho é chamado de duplicação.
Outra tarefa imprescindível é a realização do tratamento fonético dos dados, pois em muitos casos os clientes são cadastrados com erros de digitação. Para identificar esse problema e agrupar os clientes, podem ser utilizados Algoritmos Fonéticos que geram uma chave resolvendo assim o problema de identificação.
2.1.4 Consolidação de dados por clientes
Existem várias maneiras de consolidar informações. Uma bastante utilizada pelos profissionais de marketing é a consolidação por household (mesmo endereço), que consiste em identificar vários clientes, que residem em um mesmo lugar e identificá-los como um grupo. Uma técnica muito vantajosa para o envio de mala direta. Com este tipo de informação a empresa pode enviar apenas uma comunicação para a residência de seus clientes, reduzindo os gastos e incomodando cada vez menos o cliente.
2.1.5 Acesso descentralizado
A finalidade do Database Marketing é não ficar dependente de profissionais de informática para gerar qualquer tipo de consulta. Para isso é necessária a construção de uma interface user-friendly para que os profissionais possam processar informações quando necessário, não precisando esperar um desenvolvedor para a criação de qualquer tipo de relatório.
2.1.6 Gerenciamento de campanhas
O Database Marketing possui uma vasta infra-estrutura para suportar todas as informações geradas pelas campanhas de marketing. Entre elas estão: armazenamento das campanhas, acompanhamento das campanhas em que o cliente participou e motivação do cliente para comprar o produto, ou seja, possui todo um histórico de participação do cliente nas campanhas realizadas pela empresa. Informações desta natureza são de grande utilidade por possibilitar medição do resultado. Com essas informações é possível identificar quais clientes não esboçaram reação a uma determinada ação, conseguindo, assim, medir como os clientes reagem às ações impostas a ele, quais gostam de ser contatados por uma nova campanha, quais não se interessam por propaganda, campanhas, promoções, etc.
2.1.7 Interface com sistemas de CRM
O Database Marketing tem como finalidade fornecer informações para os sistemas de Call Center, provendo informações sobre o histórico dos clientes, data de nascimento, últimas aquisições e formas de pagamento. Informações estas que são utilizadas para consultar a situação do cliente, mas também de uma forma ativa para venda de novos produtos, pois a atendente de Call Center possui todo o perfil do cliente, podendo realizar uma venda cruzada no momento em que o mesmo cliente entra em contato com a empresa.
2.1.8 Sistema de Loyalty (Programa de Fidelidade)
O Sistema de loyalty, mais conhecido como Programa de fidelização, está em evidência devido à sua ampla divulgação pelas empresas de aviação. É, também, uma funcionalidade do Database Marketing que tem como tarefa gerenciar o controle de pontuação dos clientes, o resgate de prêmios, e comunicações em datas especiais. Ressaltando que todas as regras são definidas pelos gerenciadores do plano de fidelidade e devem ser implementadas no Database Marketing.
3. Data Warehouse X Database Marketing
Muitas pessoas questionam: Quando é necessário o Database Marketing? Quando é necessário um Data Warehouse? Este tipo de dúvida é muito comum, não é necessário entender amplamente as duas ferramentas para resolver este problema. A tabela 1 mostra de forma simples como esclarecer esta dúvida.
4. Data Mining
Um dos grandes problemas dos especialistas em análise de informação é a transformação de dados em informação. Como fazer isso de uma forma automatizada e no menor tempo possível? Uma das respostas para isso é a combinação de estatística convencional e técnicas de inteligência artificial, que resulta em uma técnica muito comentada nos dias de hoje, o Data Mining.
Os processos de Data Mining são extremamente complexos, além de ser um trabalho que dificilmente será resolvido apenas por um especialista em Data Mining. Em qualquer projeto de Data Mining é obrigatória a existência de um profissional com o conhecimento do negócio, pois ele possui domínio total do assunto. Para evitar que o resultado da modelagem não tenha a menor utilidade para apoiar uma decisão.
Para esclarecer o conceito de Data Mining, segundo (Naliato, 2000), o conceito de Data Mining flutua entre uma forma de estatística e um conceito revolucionário, agora aplicado ao mercado. Na verdade, o objetivo desta técnica é encontrar padrões ainda não descobertos nos dados, que possam gerar respostas corretas para novos casos. Este processo de busca e interpretação de padrões é tipicamente interativo e iterativo, envolvendo a aplicação repetitiva de métodos específicos de mineração de dados ou algoritmos e interpretações dos padrões gerados como resultado destes algoritmos.
Os problemas que podem ser resolvidos com Data Mining normalmente são divididos em dois grandes grupos: Predição e Descoberta de Conhecimento. A predição tem a finalidade de atingir um objetivo específico de acordo com casos ocorridos no passado, como o próprio nome já diz, com o objetivo de projetar respostas para novos casos.
A descoberta de conhecimento já apresenta uma maior abrangência ao suporte à tomada de decisão. Usa-se para resolver problemas que estão em um estágio antes da predição, ou melhor, onde não se conhece nenhuma informação.
Dentro destas duas linhas, existem várias técnicas. Na predição pode-se identificar duas:
- Classificação: A resposta será apresentada na forma de verdadeiro ou falso. Exemplo: Todo paciente que apresenta o vírus X está com gripe? A resposta será sim ou não.
- Regressão: A resposta será um valor numérico. Exemplo: Escore para o possível Churn (cancelamento da linha) de um cliente de uma operadora de telefonia celular.
Para descoberta de conhecimento existem as seguintes técnicas:
- Detecção de desvios: Identifica mudanças nos padrões anteriormente detectados. A técnica clássica para executar tal detecção é o teste de significância, por exemplo, média, variância, desvio padrão.
- Segmentação de bases de dados: O objetivo é dividir um problema em segmentos menores que formam grupos inter-relacionados.
- Clusterização: Processo semelhante à segmentação de bases de dados, mas parte do pressuposto que não se possui resposta previamente conhecida.
- Regras de associação: São regras que são formadas com informações existes na base de dados. São relacionamentos que, na grande parte das vezes, não são conhecidos pelo detentor do negócio.
- Resumo e visualização: O objetivo é encontrar descrições compactas dos dados e prover diferentes maneiras de apresentá-los. O nível de resumo ou detalhamento dos resultados é específico do tipo de usuário desta informação.
- Mineração de textos: A técnica pode ser definida com uma busca de tendências ou padrões, só que em vez de usar uma base de dados, são usados textos (documentos eletrônicos). Textos estes que podem ser transformados numa estrutura mais adequada para um processamento posterior, através de métodos de extração do conhecimento.
Como pode ser visto, existem várias técnicas de Data Mining que podem ajudar as empresas a encontrar informações para fomentar a sua tomada de decisão. Resta aos especialistas identificar a melhor técnica para o seu problema.
5. Conclusão
Várias técnicas, ferramentas e conceitos existem no mercado. Cabe às empresas identificarem qual é seu problema, como atacar o mesmo e, principalmente, como resolvê-lo. Estas perguntas serão de extrema importância para escolha da ferramenta ou técnica exata que deverá ser utilizada para a empresa atingir suas metas.
Não existe nada que possa comprovar que Data Warehouse é melhor que Database Marketing ou Data mining e vice-versa, mas existem conjuntos de particularidades que cada uma delas apresenta que irá adaptar-se de uma melhor forma ao problema que a empresa precisava resolver.
A conclusão que fica é que ferramentas, técnicas e conceitos existem, mas é necessário saber qual usar e como usar. Outra coisa que não se pode esquecer é que um projeto de apoio à tomada de decisão não é um projeto apenas de TI, mas sim um projeto de toda empresa, principalmente de quem conhece o negócio.
Referências
1. CARVALHO, D. R. Data mining através de indução de regras e algoritmos genéticos. 1999. 126 f. Dissertação (Mestrado em Informática Aplicada) - Pontifícia Universidade Católica do Paraná - PUCPR, Curitiba, 1999.
2. INMON, W. H. Como construir o data warehouse. 3. ed. Rio de Janeiro: Campus, 1997. 388 p.
3. JACKSON, R.; WANG, P. Database marketing estratégico. Rio de Janeiro: NTC Business Books, 1997. 298 p.
4. NALIATO, F. C. Aplicação de técnicas de mineração de dados: estudo de caso em marketing direto. 2000. 121 f. Dissertação (Mestrado em Sistema e Computação) - Instituto Militar de Engenharia - IME, Rio de Janeiro, 2000.
5. NASH, E. Database marketing ferramenta atual e decisiva do marketing. São Paulo: McGraw-Hill , 1994. 270 p.
As Redes Socias – Organizacionais, como Instrumento de Gestão
19/08/2006
As Redes Socias – Organizacionais, como Instrumento de Gestão
* Por Vivianne Amaral
25/07/2006
“O uso mais geral para o termo ‘rede’ é para uma estrutura de laços entre os atores de um sistema social. Estes atores podem ser papéis, indivíduos, organizações, sectores ou estados -nação. Os seus laços podem basear-se na conversação, afeto, amizade, parentesco, autoridade, trocas econômicas, troca de informação ou qualquer outra coisa que constitua a base de uma relação”
A compreensão complexa dos fenômenos sociais, políticos e econômicos das organizações em rede resulta da confluência de uma série de estudos e da ação inovadora de pesquisadores em diversos campos das ciências físicas e naturais e da cibernética, num primeiro momento, e das ciências sociais num segundo momento, em que se procura abordar os sistemas sociais com um instrumental conceitual e teórico que tem origem na química, física, biologia e ciência de redes.
A base desta compreensão é a abordagem sistêmica, decorrente da teoria dos sistemas e a identificação do padrão organizacional em rede como um elemento comum e gerador dos sistemas vivos. Entre os pesquisadores envolvidos nessa construção de uma nova compreensão da vida e da sociedade podemos citar Ludwig von Bertalanffly, Eugene Odum, Ilya Prigogine, Norbert Wiener, Humberto Maturana e Francisco J. Varela, Gregory Bateson, Niklas Luhmann, Pierre Lévy, Manuel Castells e Fritjof Capra.
O fato é que conceitos elaborados nas ciências físicas e naturais e na cibernética como o de padrão em rede, de estruturas dissipativas, autopoiesis, de sistema aberto, feedback, emergência, ciclos de realimentação, entre outros, permitiram uma visão complexa da dinâmica da vida social e cultural, colocando o foco nas relações horizontais e nas características sistêmicas dos fenômenos e processos.
Dentre estes conceitos, que são interdependentes, destaco como essencial para abordagem do fenômeno das redes de articulação e de informação, o conceito de padrão.
Entendendo-se padrão como a configuração das relações que os componentes de um sistema estabelecem entre si, podemos definir rede como “... um padrão de relacionamentos que conecta vários nós ou centros a muitos outros centros. São conexões de vários pontos para vários outros, não de um ponto para outros. Pode ser um padrão de reações químicas, de variáveis econômicas, uma teia alimentar de relacionamentos entre predador e presa, a rede neural do cérebro ou os complexos relacionamentos sociais de uma comunidade.”[1] Para entender um padrão temos que mapear a configuração de relações que esse estabelecem no sistema.
As redes de articulação e de informação, em suas diferentes configurações locais, indicam uma nova forma de organizar e vivenciar espaços de poder, em que a horizontalidade das relações, ou seja a insubordinação, resulta em experiências políticas investigativas e geradoras de uma nova forma de atuação coletiva, constituindo micro- esferas públicas, verdadeiros laboratórios de idéias e de lideranças.
Apesar das diferenças de configuração, as redes compartilham principalmente as seguintes características:
· objetivos compartilhados, construídos coletivamente;
· múltiplos níveis de organização e ação;
· dinamismo e intencionalidade dos envolvidos;
· coexistência de diferentes;
· produção, reedição e circulação de informação e
· empoderamento dos participantes; desconcentração do poder; multi-iniciativas; tensão entre estruturas verticais & processos horizontais.
Vivianne Amaral –Jornalista,comunicadora social e ecologista, facilitadora da REBEA e editora do site www.rebea.org.br, consultora para animação, facilitação e acionamento de redes em processos coletivos. bioconex@uol.com.br
AUTOR: Vivianne Amaral –Jornalista,comunicadora social e ecologista
INTELIGÊNCIA COMPETITIVA ORGANIZACIONAL: ferramenta ou processo
Marta Ligia Pomim Valentim
INTELIGÊNCIA COMPETITIVA ORGANIZACIONAL: ferramenta ou processo
[Dezembro/2004]
A inteligência competitiva organizacional (ICO) vem sendo discutida ao longo deste ano, sob várias facetas, nesta coluna. Tenho afirmado que entendo a inteligência competitiva como um processo organizacional e não como uma ferramenta. Não acredito em inteligência competitiva organizacional apenas como uma ferramenta, porque se aplicarmos a inteligência competitiva entendendo-a desta forma, primeiramente não exploraremos os conceitos mais amplos da ICO, assim como estaremos entendendo inteligência competitiva organizacional como algo pontual que tem começo, meio e fim.
O processo de inteligência competitiva organizacional é entendido como um processo, justamente porque não tem começo, meio e fim. Este processo é trabalhado no ambiente corporativo de forma continuada. As pessoas são essenciais ao processo e, por isso mesmo, exige ele um modelo de gestão que viabilize sua continuidade, do contrário, o trabalho desenvolvido anteriormente se perderá ao longo do tempo.
Processo significa "[...] Sucessão de estados ou de mudanças [...] Seqüência de estados de um sistema que se transforma; evolução [...]"(1).
Ferramenta significa "[...] Conjunto de utensílios de uma arte ou ofício [...]"(1).
Estes conceitos, por si só, exprimem de forma clara se aplicados à inteligência competitiva, o meu entendimento. A inteligência competitiva organizacional como ferramenta, refere-se aos métodos e técnicas de prospecção e monitoramento informacional, bem como as tecnologias de informação utilizadas para tal atividade. A inteligência competitiva organizacional como processo, refere-se a um modelo de gestão que é sistêmico e se transforma a cada momento, bem como busca evoluir de um estado para outro supostamente melhor.
Discutir se a inteligência competitiva organizacional é uma ferramenta ou um processo, é necessário porque faz com que reflitamos sobre ela, assim como exige a percepção de todos os elementos que fazem parte dela.
Nesse sentido, para mim fazem parte do processo de inteligência organizacional: a) cultura e clima organizacional; comunicação informacional; prospecção e monitoramento informacional; gestão da informação; gestão do conhecimento; inovação; redes de relacionamento; tecnologias de informação; atores do processo; terminologia de especialidade, conforme figura abaixo:
O processo de inteligência competitiva organizacional trabalha a cultura e o clima organizacional, visando das pessoas da corporação uma atitude positiva em relação a geração/criação de conhecimento e ao compartilhamento/socialização da informação.
A comunicação informacional também deve ser objeto de atenção do processo de inteligência competitiva organizacional, pois é por meio dele que as informações e o conhecimento circulam no ambiente corporativo.
A prospecção e o monitoramento informacional, atividades base da ICO são desenvolvidas constantemente, de forma dinâmica e cíclica, exigindo uma avaliação contínua para dar consistência aos procedimentos de retroalimentação do processo.
A gestão da informação é fundamental para a ICO, pois trabalha os fluxos formais do ambiente interno e externo à organização, ou seja, trabalha no âmbito do conhecimento explícito.
A gestão do conhecimento, tão fundamental quanto a gestão da informação, trabalha os fluxos informais do ambiente interno e externo à organização, isto é, trabalha no âmbito do conhecimento tácito. É mais difícil de ser realizada, mas para isso utiliza-se de métodos e técnicas que auxiliam no atendimento do objetivo que é
criar um conjunto de estratégias para criar, adquirir, compartilhar e utilizar ativos de conhecimento, bem como estabelecer fluxos que garantam a informação necessária no tempo e formato adequados, a fim de auxiliar na geração de idéias, solução de problemas e tomada de decisão. (2)
O processo de inteligência competitiva organizacional alimenta a inovação no ambiente corporativo, assim como a inovação alimenta o processo de inteligência competitiva organizacional, portanto existe uma troca nos dois sentidos, ou seja, essa dinâmica é muito produtiva para a organização.
As redes de relacionamento são essenciais para o processo de inteligência competitiva, pois é a partir dos contatos tanto interno quanto externos à organização, que dados, informação e conhecimento circulam e são compartilhados.
Do mesmo modo as tecnologias de informação são fundamentais para a eficiência do processo de inteligência competitiva organizacional. Sem essas ferramentas tecnológicas pouco se pode fazer. Os elementos que compõem o processo de ICO necessitam dessas tecnologias para fornecerem resultados eficazes.
Os atores do processo de ICO, devem ser entendidos como pessoas de diferentes especialidades que trabalham em equipe, isto é, uma equipe multidisciplinar que atua de forma integrada, buscando a competitividade da organização.
Finalizando, a terminologia de especialidade, fundamental ao processo de ICO, permite que a linguagem usada nos sistemas que apóiam o processo de ICO, tenha consistência e unidade de sentido, resultando em maior eficácia de resultados.
______________________________________
1 FERREIRA, A. B. de H. Dicionário Aurélio básico da língua portuguesa. Rio de Janeiro: Nova Fronteira, 2003.
2 VALENTIM, M. L. P. et al. O processo de inteligência competitiva em organizações. DataGramaZero, Rio de Janeiro, v. 4, n. 3, p. 1-23, 2003.
Sobre Marta Ligia Pomim Valentim
Doutora em Ciência da Informação e Documentação (ECA/USP). Ex-Presidente da Associação Brasileira de Educação em Ciência da Informação (ABECIN), Professora do Depto de Ciência da Informação da Universidade Estadual Paulista (UNESP). Autora de livros da área.
domingo, 15 de junho de 2008
sábado, 14 de junho de 2008
quinta-feira, 12 de junho de 2008
Chapter 1: Introduction to Data Mining
Data Mining and Rasch Measurement
Data mining is finding useful relationships in large datasets. 'When you mine data (by 'drilling down'), you use data to improve your business by predicting and understanding behavior.' (Peter Frometa, SPSS Inc., 2001)
According to a press release, 'in May 1998, more than 20 key players in the data mining market met to discuss the first draft of a new process model, CRISP-DM ('CRoss-Industry Standard Process for Data Mining'). This is designed to help businesses plan and work through the complete data mining process - from problem specification to deployment of results. The core consortium consists of NCR, ISL, Daimler-Benz and OHRA. At the centre of the CRISP-DM project is a Special Interest Group (SIG) of data mining service suppliers and large-scale commercial users.'
Data mining employs a 6-stage approach to extracting meaning from business data. This parallels Rasch-based approaches to measurement construction in the social sciences. The Table below focusses on the Data Cleaning component of data mining. It is in marked contrast to the conventional 'data is inviolable' approach of social science research."
CRISP-DM - Home
The CRISP-DM project developed an industry- and tool-neutral data mining process model. Starting from the embryonic knowledge discovery processes used in early data mining projects and responding directly to user requirements, this project defined and validated a data mining process that is applicable in diverse industry sectors. This methodology makes large data mining projects faster, cheaper, more reliable and more manageable. Even small scale data mining investigations benefit from using CRISP-DM."
Data Mining in a Scientific Environment
Data Mining is a concept that is taking off in the commercial sector as a means of finding useful information out of gigabytes of data. While products for the commercial environment are starting to become available, tools for a scientific environment are much rarer (or even non-existent). Yet scientists have long had to search through reams of printouts and rooms full of tapes to find the gems that make up scientific discovery.
This paper will explore some of the ad hoc methods generally used for Data Mining in the scientific community, including such things as scientific visualisation, and outline how some of the more recently developed products used in the commercial environment can be adapted to scientific Data Mining."
KMINING: Business Intelligence, Knowledge Discovery, Data mining
Knowledge discovery in databases (KDD)
- is the (iterative and interactive) nontrivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data. [Fayyad96]"
O BI e a Análise do Ambiente - João Sidemar Serain - B. Intelligence
A Análise do Ambiente é o processo de identificação de oportunidades, ameaças, forças e fraquezas que afetam a empresa no cumprimento da sua missão. Tomemos como exemplo uma ostra.
Um pequeno grão de areia invade seu interior, e por algum tempo ela precisa conviver com aquele ser estranho dentro de si, o que deve provocar certo desconforto, mas com o passar do tempo, aquilo que antes era um grão de areia, transforma-se numa valiosa pérola.
Neste caso vemos que um fator externo agiu sobre a ostra, transformando uma ameaça em uma oportunidade. Este é um caso simples, mas que podemos trazê-lo para o mundo dos negócios.
Para os que temem mudanças, Peter Drucker adverte: 'Mudanças são oportunidades. Podem ser vistas como ameaças por muitos executivos - mas todas precisam ser exploradas como uma oportunidade - para fazer algo de diferente, algo de novo e, acima de tudo, para fazer algo melhor, algo mais produtivo e lucrativo'.
As oportunidades podem estar em qualquer lugar e surgir a qualquer momento. São janelas que se abrem por certo tempo e se fecham rapidamente. Isto pode acontecer tanto em nossas vidas como também dentro das empresas."
Data Warehousing Review - Data Warehousing Overview
Data Warehouses are an important asset for organizations to maintain efficiency, profitability and competitive advantages. Organizations collect data through many sources - Online, Call Center, Sales Leads, Inventory Management. The data collected have degrees of value and business relevance. As data is collected, it is passed through a 'conveyor belt', call the Data Life Cycle Management.
An organization's data life cycle management's policy will dictate the data warehousing design and methodology."
MATHEMETRICA - Services
Data warehouse concepts
Data Warehouse is a central managed and integrated database containing data from the operational sources in an organization (such as SAP, CRM, ERP system). It may gather manual inputs from users determining criteria and parameters for grouping or classifying records.
That database contains structured data for query analysis and can be accessed by users. The data warehouse can be created or updated at any time, with minimum disruption to operational systems. It is ensured by a strategy implemented in a ETL process."