Redação do Site Inovação Tecnológica
25/09/2008
Nós temos uma capacidade inata, e uma tendência quase inconsciente em utilizar essa capacidade, de encontrar padrões em grandes volumes de dados e informações. Foi assim que nossos antepassados traçaram as constelações na infinidade de estrelas que eles observavam no céu, e é assim que nós localizamos um grupo de amigos no meio de um salão lotado.
Novo algoritmo consegue encontrar padrões em dados brutos, identificando a estrutura - ordens lineares, anéis ou clusters - que melhor descreve os dados.[Imagem: Charles Kemp]
Capacidade de ordenação
Seria muito útil se conseguíssemos replicar essa capacidade nos computadores - a Era da Informação está gerando uma quantidade de dados maior do que tudo o que a humanidade gerou ao longo de milênios. Sabemos que essa montanha de dados contém informações valiosas, mas só conseguiremos tirar proveito delas se os próprios computadores forem capazes de capturá-las para nós.
Para que um computador ordene um conjunto de dados, nós devemos encontrar a ordem subjacente a esses dados e então dizer ao computador como ordená-los, por meio de um programa.
Encontrando padrões em dados brutos
Agora, pesquisadores do MIT elaboraram um algoritmo que é capaz de encontrar um padrão nos dados brutos, e então ordená-los segundo esse padrão. "Em vez de procurar por um tipo particular de estrutura, nós criamos um algoritmo mais amplo que é capaz de testar todas essas estruturas e pesá-las umas contra as outras," explica Joshua Tenenbaum, coordenador da pesquisa.
O algoritmo consegue entender vários tipos de estruturas de dados, como árvores, ordens lineares, anéis, hierarquias dominantes, clusters etc. Ele analisa os dados brutos até encontrar a estrutura que melhor os descreve e então ordena os dados seguindo essa estrutura.
Os humanos fazem isso o tempo todo, na vida diária, freqüentemente de forma inconsciente. Várias descobertas-chave na história da ciência também consistiram na localização desses padrões, como na elaboração da Tabela Periódica ou na criação do sistema de classificação das espécies utilizada pela biologia.
Nenhum comentário:
Postar um comentário