O Cassandra teve origem no facebook, foi desenvolvido por seus engenheiros, e atualmente se tornou um projeto parte do hadoop, após ter tido seu código fonte aberto. O Cassandra faz parte dos bancos de dados distribuídos, não relacionais, com crescimento escalável, tolerante a falhas; possui réplica do seus dados em vários nós, e descentralizado; não possui um único ponto de acesso.
Conceitos
O Cassandra armazena os dados usando o conceito de chave/valor, assim como o HBase; para aqueles que já usaram, e também usa o conceito de ColumnFamily, que agrupa um conjunto de colunas.
Instalando o Cassandra
No meu caso d:/ambiente/apache-cassandra-0.7.4. O Cassandra precisa de 3 diretórios para: dados, cache e logs, então criei como: D:/ambiente/Cassandra-dados, D:/ambiente/Cassandra-cache e D:/ambiente/Cassandra-logs, respectivamente. O importante aqui é modificar as propriedades no arquivo de configuração /cassandra-0.7.4/conf/Cassandra.yaml, indicando a localização dos diretórios, são elas: data_file_directories, saved_caches_directory e commitlog_directory.
Iniciando o Cassandra
Para iniciar o servidor execute o seguinte comando: cassandra –f do diretório de instalação. Um log será exibido no console como na figura abaixo, e se nenhum erro aparecer, tudo estará funcionado bem.
Usando o Cliente
O Cassandra possui um cliente para linha de comando, vamos ver como este funciona. Para iniciar o cliente, execute o seguinte comando no diretório de instalação: cassandra-cli –host localhost –port 9160.
Crie um keyspace, na própria documentação do Cassandra é feita uma analogia com schema de bancos de dados relacionais, através do comando: create keyspace Pessoas.
Podemos notar que o keyspace foi criado no diretório /cassandra-data definido, como mostrado.
Aqui é necessário definir que você vai usar este keyspace, através do comando: use Pessoas. Após este passo, podemos definir nossa columnFamily, como mostrado na figura abaixo:

home







blog de design do c.e.s.a.r.