segunda-feira, 7 de novembro de 2011

Overdose de dados



"Se há alguns anos a falta de dados limitava os avanços da ciência, hoje o problema se inverteu. O desenvolvimento de novas tecnologias de captação de dados, nas mais variadas áreas e escalas, tem gerado um volume tão imenso de informações que o excesso se tornou um gargalo para o avanço científico.
Nesse contexto, cientistas da computação têm se unido a especialistas de diferentes áreas para desenvolver novos conceitos e teorias capazes de lidar com a enxurrada de dados da ciência contemporânea. O resultado é chamado de eScience.
Esse é o tema debatido no livro O Quarto Paradigma – Descobertas científicas na era da eScience, lançado no dia 3 de novembro pelo Instituto Microsoft Research-FAPESP de Pesquisas em TI.


Organizado por Tony Hey, Stewart Tansley, Kristin Tolle – todos da Microsoft Research –, a publicação foi lançada na sede da FAPESP, em evento que contou com a presença do diretor científico da Fundação, Carlos Henrique de Brito Cruz.
Brito Cruz destacou o interesse da FAPESP em estimular o desenvolvimento da eScience no Brasil. “A FAPESP está muito conectada a essa ideia, porque muitos dos nossos projetos e programas apresentam essa necessidade de mais capacidade de gerenciar grandes conjuntos de dados. O nosso grande desafio está na ciência por trás dessa capacidade de lidar com grandes volumes de dados”, disse.
Iniciativas como o Programa FAPESP de Pesquisa sobre Mudanças Climáticas Globais (PFPMCG), o BIOTA-FAPESP e o Programa FAPESP de Pesquisa em Bioenergia (BIOEN) são exemplos de programas que têm grande necessidade de integrar e processar imensos volumes de dados.

“Sabemos que a ciência avança quando novos instrumentos são disponibilizados. Por outro lado, os cientistas normalmente não percebem o computador como um novo grande instrumento que revoluciona a ciência. A FAPESP está interessada em ações para que a comunidade científica tome consciência de que há grandes desafios na área de eScience”, disse Brito Cruz." (fonte: Site Agora Vale)

(data center da Google)


Diariamente vemos avanços significativos em várias áreas técnicas especialmente na área da robótica, mas cada avanço feito pelo homem implica numa nova onda de informações e dados a serem armazenados. Mas não apenas na área técnica vemos essa avalanche de informações, redes sociais, sites de videos, conteúdos dos mais variados tipos são armazenados diariamente. Para se ter uma ideia o Twitter chega a armazenar diariamente 12TB (ou 12 288GB) de dados e se encontra na terceira posição das redes sociais. Hoje sabemos que somos capazes de armazenar um total de 295 exabytes. Para um melhor entendimento, essa é a quantidade suficiente para encher 404 000 000 CD's (que empilhados eles iriam da Terra para a Lua).


Eis aqui os maiores bancos de dados do mundo:


1º World Data Center for Climate  com 92 116 terabytes
2º Nersc -> 83 968 terabytes
3º AT&T -> 323 terabytes
4º Google -> 10 923 terabytes






E por uma questão de curiosidade:
O cerebro humano é capaz de armazenar 2.5 petabytes. Sabe quanto é isso. O mesmo que três milhões de horas de vídeo (mais ou menos 300 anos anos gravando direto).

Nenhum comentário:

Postar um comentário