O Google publicou detalhes sobre sua nova tecnologia de base de dados, batizada de Spanner, que permite o armazenamento de dados através de múltiplos data centas, milhões de máquinas e trilhões de linhas. Mas essa não é apenas uma base de dados maior que o habitual, o Spanner permite que aplicativos que usam a base de dados ditem onde os dados específicos serão armazenados para que se possa reduzir a latência no momento de sua recuperação.
O que faz todo esse conceito funcionar é a chamada True Time API, que combina uma relógio atômico e um relógio GPS para marcar o tempo nos dados para que possa ser sincronizado através do maior número de data centers e máquinas necessárias.
De acordo com o próprio Google, o Spanner evoluiu de uma base de chave-valor versionada similar à Bigtable para um base de dados temporal multiversão. Os dados são armazenanos em tabelas semirrelacionais esquematizadas; os dados são versionados e cada versão é automaticamente marcada com um registro de tempo com o momento de sua submissão; versões antigas dos dados são sujeitas à políticas de coleta de lixa configuráveis; e aplicativos podem ler dados em momentos anteriores. O Spanner suporta também transações genéricas e oferece uma linguagem de consulta baseada no SQL.
Devido à importância da True Time API, o Google possui antenas GPS e relógios atômicos em servidores nos data centers operando com a tecnologia Spanner. A solução é pouco usual, mas as inovações do Google tendem a se espalhar uma vez publicadas.
Para informações completas sobre o Spanner, o documento do Google oferece todas as especificidades da tecnologia. Entre seus diversos recursos, é interessante destacar a capacidade que o Spanner tem de redistribuir dados através das máquinas e data centers para balancear a carga e evitar falhas, o que a torna uma excelente escolha para ofertas de alta disponibilidade e também para aplicativos que precisem de um banco de dados semi-relacional que lide com pedidos de leitura e escrita com grande velocidade.
O Spanner é interessante como uma ferramenta de bases de dados para a era atual de dados em tempo real, mas também indica como o Google está pensando sobre construir uma infraestrutura de computação que é desenvolvida para ser executada em um ambiente dinâmico em que hardware, software e os próprios dados processados estão em constante mudança.
Fonte: gigaom, em inglês.
Caso tenha gostado do post, por favor, prestigie a fonte para este e outros assuntos afins o agradece sua preferência, volte sempre!
CREATION SOURCE: Linux new media
Vivamos a LIBERDADE com total DIGNIDADE!