Kom i gang med Data Science

Dette indlæg markerer starten på en ny vidensrejse og en serie af indlæg om min kommende erfaring med Data Science.

Rambøll og DANSK IT udgav fornylig rapporten Business Technology: strategi, trends og erfaringer – IT i praksis. Heri kan man blandt andet læse at en væsentlig barriere for en succesfuld udnyttelse af (Big) Data i Danmark skal findes i mangel på faglige kompetencer indenfor områderne matematik, databehandling og visualisering. Rapporten er ikke frit tilgængeligt, men du kan læse mere her.

Jeg anser det for mit personlige ansvar at holde mig orienteret og følge med i den teknologiske udvikling. IT er ikke et statisk felt, hvor man kan nøjes med at lære en gang for alle. Et af formålet med min blog er at fastholde og dokumentere min egen læringsproces. En af mine inspirationskilder er “Ten Simple Rules for Lifelong Learning, According to Hamming” af Thomas C. Erren, Tracy E. Slanger, J. Valérie Groß, Philip E. Bourne og Paul Cullen.

I denne forbindelse har jeg fokus på regel 4:

Focus on the Future but Don’t Ignore the Past

Jeg er helt sikker på at rapporten har ret. Data analyse vil blive en vigtig kompetence at besidde i den nærmeste fremtid. Hvis du har kigget bare en lille smule på data science har du sikkert allerede set Drew Convays venn diagram:

venn diagram

Med en baggrund i matematik, statistik og IT er mine forudsætninger på plads. Så nu handler det bare om at komme i gang.

Den konkrete plan

Jeg har tidligere fulgt et enkelt Coursera kursus “Data Analysis” med en bred introduktion til emnet. Nu ønsker jeg at gå mere systematisk til værks, og det er derfor min plan at følge en sammenhængende række af kurser omkring Data Science. Programmet består af 10 kurser indenfor områderne: R programmering, visualisering, statistisk inferens, regression og machine learning.

Hvis tiden tillader det, vil jeg også udforske emner med inspiration i agenda for et tilsvarende program udbudt af Center for Videreuddannelse under DTU. Her er man i dette efterår startet op med et 13-ugers kursus i Big Data målrettet mod erhvervslivet.

Data Science vinder også frem andre steder i uddannelsessektoren. Dette efterår gennemføres kurset Social Data Science første gang på Økonomisk Institut, KU. Kurset er open source, og pensum minder rigtig meget om emnerne i programmet på Coursera.

Hvis man ønsker at modtage et ægte bevis for deltagelse i kurserne koster det 49 USD per kursus. Selve undervisningsmaterialet er open source. Der er opstået et community omkring specialiseringen som også har en GitHub side med masser af ekstra materialer.


Please create issues at the Github repo Twitter.

Edit page on GitHub. Please help me to improve the blog by fixing mistakes on GitHub. This link will take you directly to this page in our GitHub repository.

There are more posts on the front page.

Creative Commons License
Content of this blog by Carsten Jørgensen is licensed under a Creative Commons Attribution 4.0 International License.