Jak se říká „SW is eating the world“, jenže „Data Science is eating the SW“. Proč tomu tak je?
Než vznikla Data Science a Machine Learning, tak pro každý problém se muselo naprogramovat jeho řešení, pro 5 různých problémů muselo vzniknout 5 programů. Což je nesmírně drahé a taky neefektivní, protože než se nové řešení stihlo nasadit, tak problém se mezitím změnil a mohlo se začít od znovu. Tradiční proces je:
Input => Program => Output
Machine Learning tohle změnil na:
Data + Output => Program
Ano, stačí správná data s informací o požadovaném výstupu a výstupem strojového učení bude program, který se naučí z dat, jak dojít k požadovanému výstupu, a to nejlepší je, že stejný algoritmus může vyřešit všech 5 problému!
To zní moc fajn, problémem ale je, že jenom velice málo firem má zkušenosti, jak tohle dělat v praxi s daty, které jsou všude a nikdy ve stavu vhodném pro analýzu. S procesy, které spoléhají na subjektivní rozhodování a zpožděné reportování skrz nejasné indikátory a to vše udělat tak, aby to neběhalo jenom na PC developera, ale bylo zakomponováno v rámci běžících procesů a SW nástrojů, které firmy používají a které je velice drahé měnit.