Dosłowne tłumaczenie jako "nauka o danych" jest dużym uproszczeniem. Najogólniej rzecz ujmując jest to połączenie matematyki, statystyki, analizy danych, informatyki, ale dużą rolę grają metody sztucznej inteligencji, a głównie technika maszyn uczące się, gdyż Data Scientist zajmuje się analizą danych gromadzonych jako Big data. Data Scientist to zatem nowa specjalność zawodowa, wyrosła na gruncie technologii IT.
Data Science to połączenie wielu dziedzin.
- Matematyka i statystyka
statystyczna analiza danych, eksploracja danych
- Sztuczna inteligencja
uczenie maszynowe w tym procedury klasyfikacji, predykcji, klasteryzacji w zakresie danych numerycznych, tekstowych, graficznych i innych,
- Informatyka
pakiety statystyczne, procedury numeryczne, biblioteki i narzędzia z zakresu uczenia maszyn, obliczenia rozproszone i algorytmy obliczeń równoległych
- Wizualizacja danych
prezentacja danych w czytelnej i przejrzystej formie, znajomość różnych rodzajów wizualizacji w zależności od charakteru danych
- Intuicja w podejściu do Big Data
ta cecha jest dodatkowo wymagana od osób zajmujących się analizami z dziedziny Data Science, to zdolność oceny korelacji, intuicja w doborze modelu danych oraz odpowiednich metod analizy
|