Data Mining & Exploration
Sensoren, API's, web scraping. Er zijn steeds meer bronnen waar data vandaan kan komen. Het ophalen en parsen van deze data (in welke vorm dan ook) staat centraal in de module Data Mining. Je hoe je op een zinvolle manier de databronnen aan elkaar knoopt.
Het beoordelen van de kwaliteit van je data staat centraal bij de module data exploration. Exploratory data analysis is de eerste stap in een goed gebruik van de data voor andere doeleinden. Het credo garbage in, garbage out geldt zeker op het gebied van data science. Je leert de grootste valkuilen te vermijden. Denk hierbij bijvoorbeeld aan het identificeren van outliers.
Handig om te weten
Start | September en februari |
---|---|
Lesdata | Neem voor meer informatie contact op met de opleiding |
Studie-investering | 15 uur per week (inclusief colleges) |
Kosten | € 3850 (vrij van btw) |
Deelnemers | 6 - 18 |
Locatie | Koningsbergerstraat 9 Utrecht |
Diploma | Certificaat met de studie-investering |
Prijsinformatie | Bekijk de mogelijkheden voor een tegemoetkoming in de studiekosten. |
Persoonlijk advies
We helpen je graag verder! Neem contact op voor antwoord op je vragen over de opleiding en je toelaatbaarheid.
Aanmelden
Zin om te beginnen met deze opleiding?
Opleidingsinhoud
De mastermodule Data Mining & Exploration bestaat uit twee delen: de module Data Mining en de module Exploratory Data Analysis.
Een verplicht onderdeel van deze mastermodule is een opleidingsdag in Consultancy & Persoonlijke vaardigheden.
De volgende onderwerpen komen aan bod, waarbij theorie en praktijk worden continu afgewisseld:
- Exploratory data analysis in R
- Advanced statistics
- Importeren van data
- Acquireren van data / Scraping van websites
- Web APIs / Data Sources
- Visualisaties (intro tot {ggplot2})
- Modelleren van data
Tijdens de mastermodule krijg je klassikaal onderwijs. Daarbij deel je ook jouw praktijkervaring met de andere deelnemers. Een module wordt afgesloten met een schriftelijk tentamen, een paper of presentatie en een opleidingsdag Consultancy en Persoonlijke Vaardigheden.
Je leert (in R):
- de data kwaliteit te beoordelen;
- geavanceerde statistiek toe te passen;
- data te verzamelen vanuit verschillende bronnen;
- om data te visualiseren (t.b.v. data exploratie).
Docenten
De colleges worden voor een groot deel verzorgd door (gast)docenten uit het bedrijfsleven. Hierdoor sluit de inhoud steeds naadloos aan op de (complexe) vraagstukken uit de hedendaagse markt. Inhoudelijk is de opleiding nauw verbonden met de lectoren van Hogeschool Utrecht in het betreffende onderzoeksgebied en mede daardoor van hoog niveau.
Toelating
Om de mastermodule Data Mining & Exploration te volgen, heb je een hbo-werk- en denkniveau nodig, plus minimaal twee jaar relevante werkervaring op hbo- of wo-niveau.
We gaan graag met je in gesprek om je vragen over de opleiding te beantwoorden en je toelaatbaarheid vast te stellen, op basis van je CV tijdens het intakegesprek. Je meldt je hiervoor aan via de persoonlijk advies button onderaan de pagina.
Na deze opleiding
Wanneer je de mastermodule Data Mining & Exploration succesvol hebt afgerond, ontvang je een certificaat van Hogeschool Utrecht. Wil je na deze module verder studeren? Volg dan een post-hbo-leergang of kies voor de Master of Informatics - Applied Data Science.
Je weet:
- hoe je de data op kwaliteit moet beoordelen;
- hoe je geavanceerde statistiek toe moet passen;
- hoe je data kunt verzamelen vanuit verschillende bronnen;
- hoe je om data kunt visualiseren.
Eén van de unieke kenmerken van deze mastermodule is dat zij onderdeel is van een post-hbo-leergang en de Master of Informatics - Applied Data Science. De master is door de NVAO geaccrediteerd en daarmee ook internationaal erkend. Wil je je na de module verder ontwikkelen? Dan is een leergang of de master een logische vervolgstap.
Overige informatie
De mastermodule Data Mining & Exploration kost € 3850, vrij van btw. Hier zijn de lesmaterialen bij inbegrepen.
In de module zijn theorie en praktijk direct aan elkaar gekoppeld. Dit maakt de studie bijzonder effectief en levert voordelen op voor jou en je organisatie. Om een wisselwerking te creëren tussen het toepassen van de verworven kennis in de praktijk en de inbreng van je kennis en ervaring tijdens de lessen, dien je een relevante werkplek te hebben.
Wanneer je besluit na één mastermodule de post-hbo-opleiding te vervolgen dan is je investering: € 6600 (totale investering post-hbo-opleiding € 10.350).
Mocht je besluiten na één mastermodule de master te vervolgen dan is je investering: € 17.750 en € 500 voor de studiereis (totale investering master € 21.500 exclusief studiereis).
Alle bedragen zijn vrij van btw en inclusief boeken en readers.
Hogeschool Utrecht organiseert geregeld 'De Master Spreekt...' events.
Aankomend event
Nieuwe events worden hier aangekondigd zodra ze bekend zijn.
Vorige events
In deze reeks vonden eerder plaats: De Master spreekt...
- Over Enterprise Architectuur
- Over Business modeling & EA
- Over Business Rules Management
- Over Lean Management
- Over Business Case & Agile
- Over Application Portfolio Management
- Over Digitale Waardeketen
- Over De toekomst (10 jarig congres Master the future)
- Over Trends in Enterprise Architectuur
- Over Business Models
- Over Privacywet 2018
- Over De 7 lessen in BPM
- Over Lean Six Sigma en Data Science
- Over Succesvolle digitale transformatie
- Over Ethiek in de digitale wereld
- Over Data Science
- Over Cyber Security
- Over Next Level Project Management
- Over Mensgerichte Process Mining
- Over Datagedreven innovatieve diensten in de ICT Valley
-
Over Juridisch en ethisch verantwoord toepassen van algoritmen
- Over Data: Just Do It
Blijf op de hoogte over het ICT Deeltijd Onderwijs van Hogeschool Utrecht en wat daarmee samenhangt en volg ons op LinkedIn. Hier kondigen wij ook onze “De Master Spreekt Events” aan.
Waarom data mining & exploration bij de hu
-
Stroom door naar een post-hbo-leergang of master
Wil je na deze module verder studeren? Dan kun je doorstromen naar een post-hbo-leergang of de Master of Informatics.
-
Vergroot je netwerk
Je hebt veel contact met vakgenoten en docenten. Hierdoor bouw je aan een sterk netwerk.
-
Volg praktijkgericht onderwijs
Je ervaringen zijn input voor de lessen die je volgt. En wat je leert pas je meteen toe in je werk.
Deze opleiding is ook onderdeel van:
Direct contact
Micky Lammertink
Arjen leerde programmeren in R en gebruikte dit voor zijn onderzoek
Arjen Davids (26 jaar) startte in september 2019 met de opleiding Master of Informatics – Applied Data Science. Arjen werkt (sinds 5 jaar) als dataspecialist bij het Mulier Instituut. Dit bedrijf draagt met sportonderzoek bij aan goed onderbouwd beleid, gericht op de bevordering van sport, sportief bewegen en versterking van de sportsector in Nederland.
Naar Masterniveau (MsC)
Arjen vertelt: “Ik heb altijd al affiniteit gehad met IT. Na mijn HBO-opleiding Sport, Gezondheid en Management, en een paar jaar werkervaring bij het Mulier Instituut wilde ik me verder verdiepen en verbreden in data. Hogeschool Utrecht startte in 2019 met deze opleiding in deeltijd, waarbij ik werk- en studie met elkaar kon combineren. Ideaal. Ik breng door middel van de Master of Informatics (MSc) mijn kennis op het gebied van data naar masterniveau”.
Data Mining & Exploration
Arjen is aan zijn laatste mastermodule begonnen en volgt de onderzoekleerlijn.
In één van de modules, Data Mining & Exploration, wordt geleerd om te programmeren in R. In deze mastermodule worden verschillende onderwerpen met betrekking tot data behandeld: verzamelen, laden, koppelen, samenvoegen tot een dataframe, sorteren, analyseren en visualiseren. In ieder college wordt een hoofdstuk uit het digitale boek toegelicht. Ieder hoofdstuk bevat een script: bestaande stukken code. De handleidingen worden aangeleverd en er is veel te vinden op internet. Het programmeren bestaat uit kopiëren van codes, die aanpassen en aanvullen. Maar ook zelf codes schrijven. Het resultaat is een visualisatie van eigen data.
Deelnemers brengen een casus in vanuit de eigen organisatie. De eindopdracht bestaat uit het beantwoorden van een onderzoeksvraag middels (open) data die wordt geanalyseerd in de programmeertaal R, met als resultaat een omgeving waarin de resultaten zijn gevisualiseerd. Arjen onderzocht het aantal sportaccommodaties op stedelijkheidsniveau binnen gemeentes.
Zijn conclusie was dat uit deze eerste analyse geen zichtbaar verschil bestaat in het aantal hockey-, tennis- en voetbalaccommodaties in gemeenten in relatie tot de stedelijkheid en WOZ-waarde (WOZ = Waardering Onroerende Goederen, ofwel huizenprijzen).
Python en R
In de opleiding Master of Informatics – Applied Data Science wordt naast R ook geleerd om in Python te programmeren. Arjen vindt het zeer zinvol om tenminste 2 talen aangeboden te krijgen tijdens de studie. “Al was het maar om te leren welke mogelijkheden beiden bieden en te kunnen beoordelen wanneer welke taal toe te passen. Ik weet nu ook welke extra mogelijkheden R biedt t.o.v. SPSS, waar ik tot nu mee werk.”
Samenwerking
Deze module wordt gegeven door Marc Teunis. Marc is werkzaam bij Hogeschool Utrecht, zowel bij het Institute for Life Sciences en Chemistry als bij het Lectoraat Innovative testing in Life Sciences & Chemistry. Marc is bioloog en doet momenteel onderzoek naar de bruikbaarheid van machine learning en deep learning voor het voorspellen van veranderingen in fysiologie en van toxicologische eigenschappen van stoffen. Ondanks dat dit een ander vakgebied is dan waar IT-professionals mee bezig zijn, zijn de principes overeenkomstig en zorgt kruisbestuiving voor een impuls. Een mooi voorbeeld van samenwerking tussen verschillende instituten binnen Hogeschool Utrecht.
Er is regelmatige terugkoppeling met de docent “Marc weet veel over R en legt goed en duidelijk uit. Hij is goed bereikbaar en reageert snel. Ik heb veel geleerd tijdens deze module”, zegt Arjen.