Ameixa verde - Greenplum

Ameixa verde
Modelo Produto da VMware
Indústria Tecnologias de big data
Quartel general Palo Alto , Califórnia
Produtos Software de sistema de gerenciamento de banco de dados
Banco de dados Greenplum
Desenvolvedor (s) VMware
Versão estável
6.7.1 / abril de 2020 ; 1 ano atrás ( 2020-04 )
Repositório github .com / greenplum-db / gpdb
Sistema operacional Linux
Modelo Sistema de gerenciamento de banco de dados
Licença Licença Apache 2
Local na rede Internet greenplum .org

Greenplum é uma tecnologia de big data baseada na arquitetura MPP e na tecnologia de banco de dados de código aberto Postgres . A tecnologia foi criada por uma empresa de mesmo nome sediada em San Mateo , Califórnia , por volta de 2005. A Greenplum foi adquirida pela EMC Corporation em julho de 2010.

A partir de 2012, seu software de sistema de gerenciamento de banco de dados ficou conhecido como Pivotal Greenplum Database, vendido por meio da Pivotal Software . A Pivotal abriu o código do mecanismo principal e continuou seu desenvolvimento pela comunidade de código aberto do Greenplum Database e pela Pivotal.

A partir de 2020, a Pivotal foi adquirida pela VMware e a VMware continuou a patrocinar a comunidade de código aberto do banco de dados Greenplum, bem como a comercializar a tecnologia sob a marca VMware Tanzu Greenplum .

Empresa

Greenplum, a empresa, foi fundada em setembro de 2003 por Scott Yara e Luke Lonergan. Foi uma fusão de duas empresas menores: Metapa (fundada em agosto de 2000 perto de Los Angeles ) e Didera em Fairfax, Virginia .

Os investidores incluíram SoundView Ventures, Hudson Ventures e Royal Wulff Ventures. Um total de US $ 20 milhões em financiamento foi anunciado na fusão. A Greenplum, com sede em San Mateo, Califórnia , lançou seu software de sistema de gerenciamento de banco de dados baseado em PostgreSQL em abril de 2005, chamando-o de Bizgres. Rodadas de capital de risco de cerca de US $ 15 milhões cada foram investidas em março de 2006 e fevereiro de 2007.

Em julho de 2006, foi anunciada uma parceria com a Sun Microsystems . A Sun, que também adquiriu a MySQL AB , participou de uma rodada de investimentos de US $ 27 milhões em janeiro de 2009, liderada pela Meritech Capital Partners . O projeto Bizgres incluiu alguns outros membros e foi apoiado por volta de 2008, quando o produto também se chamava "Greenplum". O Sun Fire X4500 era uma arquitetura de referência e usada pela maioria dos clientes até que uma transição foi feita para o Linux naquela época. A Greenplum foi adquirida pela EMC Corporation em julho de 2010, tornando-se a base da divisão de software de big data da EMC . Embora a EMC não tenha divulgado o valor, ele foi estimado em US $ 300 milhões . Os produtos da Greenplum no momento da aquisição eram o banco de dados Greenplum, o Chorus (uma ferramenta de gerenciamento) e os laboratórios de ciência de dados. A Greenplum tinha clientes em mercados verticais, incluindo eBay . Ele se tornou parte da Pivotal Software em 2012.

Uma variante do Apache Hadoop para armazenar dados no sistema de arquivos Hadoop chamado Hawq foi anunciada em 2013. Em 2015, os projetos de software de código aberto GreenplumDB e Hawq foram anunciados.

Tecnologia

O produto de banco de dados Greenplum da Pivotal usa técnicas de processamento paralelo maciço (MPP). Cada cluster de computador consiste em um nó mestre, um nó mestre em espera e nós de segmento. Todos os dados residem nos nós de segmento e as informações do catálogo são armazenadas nos nós mestres. Os nós de segmento executam um ou mais segmentos, que são instâncias de banco de dados PostgreSQL modificadas e são atribuídos a um identificador de conteúdo. Para cada tabela, os dados são divididos entre os nós de segmento com base nas chaves da coluna de distribuição especificadas pelo usuário na linguagem de definição de dados . Para cada identificador de conteúdo de segmento, há um segmento primário e um segmento de espelho que não estão sendo executados no mesmo host físico. Quando uma consulta entra no nó mestre, ela é analisada, planejada e despachada para todos os segmentos para executar o plano de consulta e retornar os dados solicitados ou inserir o resultado da consulta em uma tabela de banco de dados. A Structured Query Language , versão SQL: 2003 , é usada para apresentar consultas ao sistema. A semântica da transação obedece às restrições conhecidas como ACID .

Os concorrentes incluem outros sistemas de gerenciamento de banco de dados MPP fornecidos por fornecedores importantes, como Teradata , Amazon Redshift , Microsoft Azure , Alibaba AnalyticDB e, no passado, IBM Netezza . A concorrência adicional vem de outros concorrentes menores, bancos de dados orientados a colunas , como HP Vertica , Exasol e fornecedores de armazenamento de dados com arquitetura não MPP, como Oracle Exadata , IBM DB2 e SAP HANA .

Greenplum Versão 5

Em setembro de 2017, o Greenplum Database Versão 5 foi lançado. A versão 5 inclui a primeira iteração da estratégia do projeto Greenplum de fundir as versões posteriores do PostgreSQL de volta ao Greenplum e é baseada no PostgreSQL versão 8.3 da versão anterior 8.2. A versão 5 também apresenta a disponibilidade geral do GPORCA Optimizer para otimização baseada em custos de SQL projetada para big data.

Greenplum Versão 6

Em setembro de 2019, o Greenplum Database Versão 6 foi lançado. A versão 6 é baseada no PostgreSQL versão 9.4 e apresenta ganhos massivos no desempenho de OLTP. Greenplum 6 foi revisado na mídia por várias fontes e mencionado por seu alinhamento de código aberto Postgres e por seu desempenho OLTP

Referências