Amundsen jest silnikiem wyszukiwania danych i metadanych w celu poprawy wydajności analityków danych, analityków danych i inżynierów podczas interakcji z danymi. Robi to dzisiaj, indeksując zasoby danych (tabele, pulpity nawigacyjne, strumienie itp.) i uruchamianie wyszukiwania stylu page-rank w oparciu o wzorce użytkowania (np., tabele z dużym zapytaniem pojawiają się wcześniej niż tabele z mniejszym zapytaniem). Pomyśl o tym jak o wyszukiwaniu danych w Google. Nazwa projektu pochodzi od nazwiska norweskiego odkrywcy Roalda Amundsena, który jako pierwszy odkrył Biegun Południowy.
Amundsen jest obsługiwany przez AI LF& Data Foundation. Zawiera trzy mikroserwisy, jedną bibliotekę pozyskiwania danych i jedną wspólną bibliotekę.
- amundsenfrontendlibrary: usługa Frontend, która jest aplikacją Flask z interfejsem Reactowym.,
- amundsensearchlibrary: usługa wyszukiwania, która wykorzystuje Elasticsearch do wyszukiwania, służy do wyszukiwania metadanych w interfejsie.
- amundsenmetadatalibrary: usługa metadanych, która wykorzystuje Neo4j lub Apache Atlas jako trwałą warstwę, aby zapewnić różne metadane.
- amundsendatabuilder: biblioteka pozyskiwania danych do tworzenia wykresów metadanych i indeksów wyszukiwania. Użytkownicy mogli załadować dane za pomocą skryptu Pythona z biblioteką lub za pomocą dag Airflow importującego bibliotekę.,
- amundsencommon: Amundsen Common library przechowuje wspólne kody wśród mikroserwisów w Amundsen.
- amundsengremlin: biblioteka gremlina Amundsena przechowuje kod używany do konwersji obiektów modelu na wierzchołki i krawędzie w gremlinie. Służy do ładowania danych do backendu AWS Neptune.
- amundsenrds: amundsenrds zawiera modele ORM do obsługi relacyjnej bazy danych jako zaplecza metadanych w Amundsen. Schemat w modelach ORM jest zgodny z logiką modeli databuilder., Amundsenrds będzie używany w databuilder i metadatalibrary do przechowywania i pobierania metadanych z relacyjnych baz danych.
Strona główna¶
- Python = 3.6 lub 3.7
- Node = v10 lub v12 (v14 może mieć problemy ze zgodnością)
- npm >= 6
- Landing Page: Strona docelowa dla Amundsena, w tym 1. search bars; 2., popularne używane tabele;
- podgląd wyszukiwania: Zobacz Wyniki wyszukiwania inline podczas wpisywania
- strona szczegółów tabeli: Wizualizacja tabeli Hive / Redshift
- szczegóły kolumn: wizualizacja kolumn tabeli hive / Redshift, która zawiera opcjonalny wyświetlacz statystyk
- strona podglądu danych: wizualizacja podglądu danych tabeli, która może zostać zintegrowana z Apache Superset lub innymi narzędziami do wizualizacji danych.,
- tabele (z baz danych)
- ludzie (z systemów HR)
- pulpity nawigacyjne
- Amazon Athena
- Amazon Glue i wszystko, co na nim zbudowane (jak Databricks Delta – która jest w toku).,
- Amazon Redshift
- Apache Cassandra
- Apache Druid
- Apache Hive
- CSV
- Delta Lake
- Google BigQuery
- IBM DB2
- Microsoft SQL Server
- MySQL
- Oracle (through dbapi or sql_alchemy)
- PostgreSQL,
- wkrótce
- Vertica
- płatki śniegu
- Analiza trybu
- Redash
- Tableau
- przepływ powietrza Apache
- Apache Superset
- Amundsen – Lyft ' s data discovery & metadata engine (kwiecień 2019)
- Software Engineering Daily podcast on Amundsen (kwiecień 2019)
- jak Lyft napędza wykrywanie danych (lipiec 2019)
- Podcast Data Engineering o rozwiązywaniu wykrywania danych w lyft (sierpień 2019)
- open sourcing Amundsen: a data discovery and metadata Platform (październik 2019)
- dodanie jakości danych do Amundsen z programowymi opisami sama Shustera z Edmunds.,
- Lyft ' s Amundsen: Data-Discovery with Built-In Trust
- How to find and organizer your data from the command-line
- Data Discovery Platform at Bagelcode
- narzędzia katalogowania dla zespołów danych
- przegląd Platform wykrywania danych i rozwiązań Open Source
- Hacking Data Discovery in AWS with Amundsen at SEEK
- przewodnik krok po kroku Amundsen na platformie Google Cloud
- Bang & Olufsen
- Brex
- Cameo
- Cimpress Technology
- Coles Group
- Convoy
- Data Sprints
- Dcard
- Devoted Health
- DHI Group
- Jeden
- Everfi
- Smak
- Hurb
- ING
- Instacart
- iRobot
- Nocleg
- LM
- Loft
- Lyft
- Merlin
- PicPay
- Plarium Krasnodar
- PUB
- Szybko
- REA Group
- Remitly
- Square
- WeTransfer
- Workday
dokumentacja¶
wymagania¶
interfejs użytkownika¶
należy pamiętać, że makiety obrazów służyły tylko jako cel demonstracyjny.
włącz się do społeczności
chcesz pomóc lub chcesz pomóc?Użyj przycisku w naszym nagłówku, aby dołączyć do naszego kanału slack. Wpłaty są również mile widziane! Jak wyjaśniono w CONTRIBUTING.md istnieje wiele sposobów, aby przyczynić się, to nie wszystko musi być kod z nowych funkcji i poprawek błędów, a także dokumentacji, jak wpisy FAQ, zgłoszenia błędów, blogów dzielenie doświadczeń itp. wszyscy pomóżcie amundsenowi ruszyć naprzód. Jeśli znajdziesz lukę w zabezpieczeniach, postępuj zgodnie z tym przewodnikiem.,
pierwsze kroki¶
aby szybko uruchomić domyślną wersję Amundsen z atrapami danych, odwiedź dokumentację instalacji Amundsen.
przegląd architektury¶
odwiedź Stronę Architektura, aby uzyskać przegląd architektury Amundsena.
obsługiwane podmioty¶
obsługiwane integracje¶
Złącza tabel¶
Amundsen can also connect to any database that provides dbapi
or sql_alchemy
interface (which most DBS provide).,
Złącza do desek rozdzielczych¶
orkiestracja ETL¶
narzędzie BI Viz¶
instalacja¶
proszę odwiedzić wytyczne dotyczące instalacji Amundsen.
Mapa Drogowa¶
Zapraszamy do odwiedzenia mapy drogowej, jeśli jesteś zainteresowany nadchodzącymi punktami mapy drogowej Amundsen.,
wpisy na blogu i wywiady¶
spotkania społeczności¶
spotkania społeczności odbywają się w pierwszy czwartek każdego miesiąca o 9 rano Pacyfiku, południe Eastern, 6 pm czasu środkowoeuropejskiego., Link do przyłączenia się
najbliższe spotkania& uwagi¶
w tym dokumencie możesz podać dokładną datę następnego spotkania i porządek obrad na kilka tygodni przed spotkaniem.
notatki ze wszystkich poprzednich spotkań są dostępne tutaj.
kto używa Amundsena?¶
oto lista organizacji, które korzystają dziś z Amundsena. Jeśli Twoja organizacja korzysta z Amundsen, zgłoś PR i zaktualizuj tę listę.,Bagelcode
Apache 2.,0 licencji.
Dodaj komentarz