Amundsen é uma descoberta de dados e metadados do motor para melhorar a produtividade dos analistas de dados, dados de cientistas e engenheiros, ao interagir com os dados. Ele faz isso hoje, indexando os recursos de dados (tabelas, painéis, fluxos, etc.) e alimentando uma pesquisa de estilo page-rank baseada em padrões de uso (e.g., as tabelas altamente questionadas aparecem mais cedo do que as tabelas menos questionadas). Pense nisso como pesquisa de dados do Google. O projeto recebeu o nome do explorador norueguês Roald Amundsen, a primeira pessoa a descobrir o Polo Sul.
Amundsen é hospedado pela LF AI & Data Foundation. Ele inclui três micro-serviços, uma biblioteca de ingestão de dados e uma biblioteca comum.
- amundsenfrontendlibrary: Frontend service which is a Flask application with a React frontend.,
- amundsensearch library: Search service, which leverages Elasticsearch for search capabilities, is used to power frontend metadata searching.
- amundsenmetadatalibrary: Metadata service, which leverages Neo4j or Apache Atlas as the persistent layer, to provide various metadata.
- amundsendatabuilder: Data ingestion library for building metadata graph and search index. Os usuários podem carregar os dados com um script python com a biblioteca ou com um DAG Airflow importando a biblioteca.,
- amundsencommon: Amundsen Common library holds common codes among microservices in Amundsen.
- amundsengremlin: Amundsen Gremlin library holds code used for converting model objects into vertices and edges in gremlin. É usado para carregar dados numa infra-estrutura AWS Neptune.
- amundsenrds: Amundsenrds contains ORM models to support relational database as metadata backend store in Amundsen. O esquema em modelos ORM segue a lógica dos modelos de construção de banco de dados., O Amundsenrds será utilizado no compilador de bases de dados e no metadatalibrário para armazenamento e recuperação de metadados com bases de dados relacionais.
página inicial¶
- Python = 3.6 ou 3.7
- Node = v10 ou v12 (v14 podem ter problemas de compatibilidade)
- npm >= 6
- Busca de Visualização: Veja inline resultados de pesquisa enquanto você digita
- Detalhes da Tabela de Página: Visualização de uma Seção / Redshift tabela
- detalhes da Coluna: Visualização de colunas de uma Seção / Redshift tabela que inclui um opcional estatísticas de exibição
- Página de Visualização de Dados: Visualização da tabela de visualização de dados que pode integrar com o Apache Superconjunto ou outras Ferramentas de Visualização de Dados.,
- Tabelas (a partir de Bancos de dados)
- Pessoas (a partir de sistemas de RH)
- Painéis
- Amazon Athena
- Amazon Cola e qualquer coisa construída sobre ele (como Databricks Delta – que é um trabalho em progresso).,
- o Amazon Redshift
- Apache Cassandra
- Apache Druida
- o Apache Hive
- CSV
- Delta Lago
- o Google BigQuery
- IBM DB2
- Microsoft SQL Server
- MySQL
- Oracle (através dbapi ou sql_alchemy)
- PostgreSQL
- em Breve
- Vertica
- floco de Neve
- Modo de Analytics
- Redash
- Tableau
- Apache Fluxo de ar
- Apache Superconjunto
- Amundsen – Lyft da descoberta de dados & metadados (mecanismo de abril de 2019)
- Engenharia de Software Diariamente podcast no Amundsen (abril de 2019)
- Como Lyft Unidades de Dados de Descoberta (julho de 2019)
- Engenharia de Dados podcast na Resolução de Descoberta de Dados Em Lyft (Agosto de 2019)
- Open Sourcing Amundsen: Uma Descoberta de Dados E de Metadados (Plataforma de Outubro de 2019)
- Adicionando a Qualidade dos Dados em Amundsen Programático Descrições por Sam Shuster de Edmunds.,Paisagem
- Lyft do Amundsen: Dados de Descoberta com Built-In de Confiança
- Como encontrar e organizar os dados a partir da linha de comando
- Dados de Descoberta de Plataforma em Bagelcode
- Ferramentas de Catalogação de Dados Equipes
- Uma Visão geral dos Dados de Descoberta de Plataformas e Soluções de código Aberto
- Hacking de Descoberta de Dados no AWS com Amundsen em PROCURAR
- Um passo-a-guia passo a passo implantando Amundsen no Google Cloud Plataforma
- Bang & Olufsen
- Brex
- Pequena
- Cimpress Tecnologia
- Grupo Coles
- Comboio
- Data Corre
- Dcard
- Dedicado Saúde
- Grupo DHI
- Edmunds
- Everfi
- Gosto
- Hurb
- ING
- Instacart
- iRobot
- Flash
- LMC
- Loft
- Lyft
- Merlin
- PicPay
- Plarium Krasnodar
- PUBG
- Rápida
- REA de Grupo
- Remitly
- Quadrado
- WeTransfer
- Dia
Documentação¶
Requisitos¶
Interface de Usuário¶
por Favor, note que a simulação de imagens serviu apenas como demonstração finalidade.página de destino: a página de destino de Amundsen, incluindo 1. barras de busca; 2., popular tabelas utilizadas;
Get Involved in the Community¶
Want help or want to help?Use o botão no nosso cabeçalho para se juntar ao nosso canal slack. As contribuições também são mais do que bem-vindas! Como explicado em CONTRIBUTING.md existem muitas maneiras de contribuir, nem tudo tem que ser Código com novas funcionalidades e correções de bugs, também documentação, como entradas FAQ, relatórios de bugs, blogs compartilhando experiências etc. todos ajudam a mover Amundsen para a frente. Se você encontrar uma vulnerabilidade de segurança, por favor, siga este guia.,
iniciando¶
por favor, visite a documentação de instalação de Amundsen para um rápido início de bootstrap uma versão padrão de Amundsen com dados fictícios.
Visão Geral da arquitectura
por favor, visite a arquitectura para a visão geral da arquitectura Amundsen.
Suporte para Entidades¶
Suporte Integrações¶
Tabela de Conectores¶
Amundsen também pode se conectar a qualquer banco de dados que fornece dbapi
ou sql_alchemy
interface (que a maioria dos DBs fornecer).,
Painel de Conectores¶
ETL Orquestração¶
BI Viz Ferramenta¶
Instalação¶
por Favor, visite a Instalação de linhas de orientação sobre como instalar Amundsen.
Roadmap¶
por favor, visite Roadmap se estiver interessado nos próximos itens do roadmap Amundsen.,
Posts e Entrevistas¶
reuniões com a Comunidade¶
reuniões com a Comunidade são realizados na primeira quinta-feira de cada mês, às 9 da manhã do Pacífico, o Meio-Leste, 6 PM Hora Central Europeia., Link to join
Upcoming meetings & notes¶
you can the exact date for the next meeting and the agenda a few weeks before the meeting in this doc.as notas de todas as reuniões anteriores estão disponíveis aqui.quem usa Amundsen?
Aqui está a lista de organizações que estão usando Amundsen hoje. Se a sua organização utilizar Amundsen, por favor, envie um PR e actualize esta lista.,Bagelcode
o Apache 2.,0 licença.
Deixe uma resposta