Kursen ger doktorander praktiska verktyg för att effektivt använda digitala resurser och tekniker som stöd för forskning och hög forskningskvalitet. Innehållet omfattar verktyg, tips och metoder som utgör industristandard inom såväl akademi som näringsliv. Undervisningen ges av experter från Chalmers e-commons – Chalmers digitala forskningsinfrastruktur.
Kursen består av tolv separata moduler, där varje modul behandlar ett ämne under en heldag. Undervisningen sker på introduktionsnivå med fokus på att ge en översikt och hjälpa deltagarna att ta de första stegen inom respektive område. För godkänd kurs krävs deltagande i minst tio av de tolv modulerna.
Om du vill kunna tillgodoräkna kursen formellt inom forskarutbildningen behöver du diskutera det med din handledare.
Planering
Kursen ges i form av veckomoduler under höstterminen 2024. Varje modul omfattar en heldag, med start fredagen den 20 september. Den avslutande modulen äger rum fredagen den 6 december.
För mer information, och anmälan, kontakta Leon Boschman (leon.boschman@chalmers.se).
Moduler
Kursen består av följande 12 moduler:
1. Unix Shell (Bash)
Unix-terminalen är ett kraftfullt verktyg som ofta används inom beräkningsvetenskap. De flesta superdatorer tillåter endast en terminalmiljö och inget grafiskt användargränssnitt. Att ha erfarenhet av att använda terminalen är viktigt för att arbeta med HPC-anläggningar. Det är också nödvändigt för att köra lite mer avancerade analysskript.
Efter modulen kommer eleverna att känna till några grundläggande kommandon i Bash och hur man navigerar i en terminal.
2. Grundläggande python
Python är ett allsidigt programmeringsspråk som används i stor utsträckning inom området dataanalys, vetenskaplig beräkning och maskininlärning.
Denna modul syftar till att lära eleverna grunderna i Python och hjälpa dem att sätta upp en Python-miljö på sin egen bärbara dator.
De kommer att göra detta i en nybörjarvänlig Jupyter Notebook-miljö.
Efter modulen kommer eleverna skriva och köra en liten Jupyter Notebook som använder funktioner, listor, dictionaries etc.
3. Strukturerad dataanalys
I denna modul kommer studenterna att lära sig hur man skriver en återanvändbar dataanalys i Python. De kommer att lära sig grunderna i pandor, numpy och scipy för att arbeta med tabell- och numeriska data. Dessutom kommer de att lära sig grunderna för att skapa ett återanvändbart arbetsflöde.
4. Datavisualisering
Eleverna kommer att få lära sig olika strategier för datavisualisering. De kommer att lära sig om visualiseringsprinciper och viss teori, bästa praxis och hur man gör visualiseringar tillgängliga för personer med till exempel färgblindhet.
De kommer också att lära sig hur man gör visualiseringar i python med branschstandard plotting-bibliotek.
Vi kommer också att presentera InfraVis, den nationella infrastrukturen för datavisualisering, och hur man ansöker om visualiseringsstöd.
5. Högpresterande datorsystem
I den här modulen kommer eleverna att lära sig skillnaden mellan datoranvändning på sin bärbara dator och på ett högpresterande datorkluster.
De kommer att lära sig om strategier för att utnyttja HPC-kluster optimalt och hur de kan använda HPC i sitt eget forskningsprojekt.
6. Forskningsdatahantering
Studenterna kommer att lära sig om bästa praxis för hantering av forskningsdata. Detta kommer att innefatta ett tillvägagångssätt för att göra forskningsdata FAIR (finnbar, tillgänglig, interoperabel, återanvändbar). De kommer också att lära sig om GDPR-efterlevnad och datalivscykelhantering.
7. Versionskontroll och kodsamarbeten
Eleverna kommer att lära sig om git versionskontroll, som är ett decentraliserat versionskontrollsystem som ofta används för källkod och andra vanliga textfiler. Dessutom kommer de att lära sig om versionskontroll i en samarbetsmiljö där flera forskare arbetar med samma filer.
8. Skriva läsbar kod
Här diskuterar vi hur eleverna kan se till att koden de skriver är lättläst, med en tydlig och lätt att följa logik. Detta kommer att hjälpa till att få konsekventa resultat från dataanalyser.
9. Använda Python Notebooks för kommunikation
Anteckningsböcker är ett utmärkt verktyg för att kommunicera vetenskapliga och vetenskapliga resultat. I den här modulen kommer vi att lära eleverna hur man använder de interaktiva funktionerna i Jupyter notebook som ett effektivt kommunikationsmedel.
10. Digital projektledning
I denna modul kommer studenterna att lära sig hur man effektivt arbetar med digitala projekt, speciellt anpassade för vetenskaplig dataanalys. Vi kommer att diskutera användningen av mjukvaruversionering, effektivt samarbete och att se till att projektet kan tas över av kollegor.
11. Introduktion till maskininlärning & AI
Vi diskuterar grunderna i maskininlärning och AI, och vad olika typer av problem kan lösas med dessa tekniker. Vi kommer också att diskutera hur dessa metoder skulle kunna användas inom sina egna områden.
12. AI:s etik
Användningen av AI, och särskilt generativ AI, kommer med en mängd etiska dilemman. Vi kommer att göra eleverna medvetna om dessa dilemman och diskutera hur de tillämpar sitt eget arbete.