Nós temos uma capacidade inata, e uma tendência quase inconsciente em utilizar essa capacidade, de encontrar padrões em grandes volumes de dados e informações. Foi assim que nossos antepassados traçaram as constelações na infinidade de estrelas que eles observavam no céu, e é assim que nós localizamos um grupo de amigos no meio de um salão lotado.
Capacidade de ordenação
Seria muito útil se conseguíssemos replicar essa capacidade nos computadores - a Era da Informação está gerando uma quantidade de dados maior do que tudo o que a humanidade gerou ao longo de milênios. Sabemos que essa montanha de dados contém informações valiosas, mas só conseguiremos tirar proveito delas se os próprios computadores forem capazes de capturá-las para nós.
Para que um computador ordene um conjunto de dados, nós devemos encontrar a ordem subjacente a esses dados e então dizer ao computador como ordená-los, por meio de um programa.
Encontrando padrões em dados brutos
Agora, pesquisadores do MIT elaboraram um algoritmo que é capaz de encontrar um padrão nos dados brutos, e então ordená-los segundo esse padrão. "Em vez de procurar por um tipo particular de estrutura, nós criamos um algoritmo mais amplo que é capaz de testar todas essas estruturas e pesá-las umas contra as outras," explica Joshua Tenenbaum, coordenador da pesquisa.
O algoritmo consegue entender vários tipos de estruturas de dados, como árvores, ordens lineares, anéis, hierarquias dominantes, clusters etc. Ele analisa os dados brutos até encontrar a estrutura que melhor os descreve e então ordena os dados seguindo essa estrutura.
Os humanos fazem isso o tempo todo, na vida diária, freqüentemente de forma inconsciente. Várias descobertas-chave na história da ciência também consistiram na localização desses padrões, como na elaboração da Tabela Periódica ou na criação do sistema de classificação das espécies utilizada pela biologia.
Bibliografia:The discovery of structural formCharles Kemp, Joshua B. TenenbaumProceedings of the National Academy of SciencesAugust 2008Vol.: 105:10687-10692DOI: 10.1073/pnas.0802631105
0 comentários:
Postar um comentário