Logboek

Mijn dagelijkse notities in relatie tot mijn interesses en werk: een mix van hoger onderwijs, neurodiversiteit, inclusie, studiesucces, data science, AI, Machine Learning en coderen in R.

Juli

Zondag | 02-07-2023

Juni

Donderdag | 08-06-2023

  • De Staat van De Haagse: De afgelopen weken gewerkt aan een onderzoeksprogramma voor onderzoek naar kansengelijkheid aan De Haagse Hogeschool

  • Databases: dm - package om verschillende tabellen in R eenvoudiger met elkaar te verbinden en deze verbindingen te visualiseren.

  • File handling: purrr::walk() this way - Voorbeeld voor het gebruik van purrr om bestanden te maken.

  • Benchmarking en performance: het tictoc package en bench package om de tijd voor en na een stuk code te meten. Zie ook Writing performant code with tidy tools.

Mei

Vrijdag | 19-06-2023

Zondag | 14-05-2023

  • Visualisaties: ggflowchart voor het maken van flowcharts in ggplot.

Woensdag | 10-05-2023

  • Visualisaties: cord diagrammen met behulp van het circlize package. Hierover is een heel boek geschreven door de developer, Zuguang Gu.

Dinsdag | 09-05-2023

  • Visualisaties: netwerk analyses met ggnet.

April 2023

Maandag | 24-04-2023

  • GIS:
    • Afgelopen week veel bezig geweest met GIS mogelijkheden. Ik werk aan een handleiding voor het maken van geografische analyses op studiedata.
    • Tutorial voor het maken van landkaarten van Manuel Teodoro Tenango. Maakt slim gebruik van tekstuele functies.
  • Markdown: Daarnaast de afgelopen twee weken veel gewerkt aan het genereren van rapporten met behulp van markdown en pandoc. Deze vul ik met een serie analyses in ggplot op instroomdata.
  • R: Mooie nieuwe functionaliteit in R 4.3.0 voor het doorgeven van waarden in een pipe. Deze kunnen geplaatst worden naar een andere positie dan de eerste via een underscore.

Zondag | 16-04-2023

Donderdag | 13-04-2023

Zondag | 09-04-2023

Zaterdag | 08-04-2023

Dinsdag | 04-04-2023

Zondag | 02-04-2023

Maart 2023

Vrijdag | 31-03-2023

Dinsdag | 28-03-2023

Maandag | 27-03-2023

Vrijdag | 24-03-2023

  • Autisme:
    • Impact van Covid op schoolgaande kinderen met autisme - Simpson, K., & Adams, D. (2022). Brief Report: Covid Restrictions had Positive and Negative Impacts on Schooling for Students on the Autism Spectrum. Journal of Autism and Developmental Disorders, 1–7. doi: 10.1007/s10803-022-05451-z - Geeft een gemengd beeld van positieve en negatieve ervaringen van ouders met schoolgaande kinderen met autisme. Interessant is de opmerking over de gemiste kans om het ‘hidden curriculum’, het totaal aan impliciete sociale regels en normen in de schoolomgeving (Reicher, 2020), te leren kennen.
  • Coding:
  • Statistiek:
    • TidyDensity - package om verschillende analyses eenvoudig te visualiseren van verschillende distributies (evt. met simulaties): density, quantielen, probability, qq plot.

Donderdag | 23-03-2023

  • Visualisaties:

    • ggbump - package om bumpcharts te maken in ggplot

Zondag | 19-03-2023

Zaterdag | 18-03-2023

  • Autisme: Prachtige column van schrijver en dichter Erik Jan Harmens in het NRC. Leeftijd: 49. Diagnose: autisme “De meeste mensen zijn als huizen. Van steen, met hier en daar een raam. Mensen zoals ik zijn als kassen. Rondom ons enkel glas. We nemen alles waar, ook hoe anderen ons waarnemen. Daarop passen we ons gedrag aan, net zolang tot het matcht.”

Woensdag | 15-03-2023

Dinsdag | 14-03-2023

Maandag | 13-03-2023

Zondag | 12-03-2023

Zaterdag | 11-03-2023

Donderdag | 08-03-2023

  • Trends: Akcaova, G. (2023). SURF Tech Trends 2023 (pp. 1–87). Doorgenomen.

Dinsdag | 07-03-2023

  • Visualisaties: Chart Guide. Aanvulling op onderstaande visualisatie ecosystement.

Maandag | 06-03-2023

  • AI in hoger onderwijs: Walker, J., & Baten, D. (2022). Promises of AI in Education, Discussing the impact of AI systems in educational practices. SURF. - gelezen.

Zondag | 05-03-2023

Zaterdag | 04-03-2023

Vrijdag | 03-03-2023

Donderdag | 02-03-2023

Woensdag | 01-03-2023

Februari 2023

Dinsdag | 28-02-2023

Visualisaties:

Maandag | 27-02-2023

Zondag | 26-02-2023

  • AI: Generative AI Won’t Revolutionize Search — Yet: artikel van HBR over vertical Large Language Models (LLM). Er zijn 5 vragen die we moeten stellen om te bepalen of een LLM geschikt is voor een domein. TB: Vooralsnog maakt dit dat onderwijsbeleid en -begeleiding dit niet zijn, maar onderwijs zelf inhoudelijk mogelijk wel (toevoegingen van mijn hand):
    1. Vereist de taak of het proces traditioneel uitgebreid onderzoek of diepgaande vakkennis? - Ja, voor Learning Analytics (LA) en onderwijs
    2. Is het resultaat van de taak samengestelde informatie, inzicht of kennis waarmee de gebruiker actie kan ondernemen of een beslissing kan nemen? - Ja, voor LA en onderwijs
    3. Bestaan er voldoende historische technische of feitelijke gegevens om de AI op te leiden tot een expert op het verticale zoekgebied? - Nee, voor LA; mogelijk Ja, voor onderwijs
    4. Kan het LLM met een passende frequentie worden getraind met nieuwe informatie, zodat het actuele informatie verstrekt? - Ja, maar voor LA complex in trage systemen zoals het hoger onderwijs, wel mogelijk voor uitgevers op onderwijs
    5. Is het legaal en ethisch verantwoord dat de AI leert van de opvattingen, aannames en informatie in de trainingsgegevens en deze herhaalt en bestendigt? - Dit is nog onzeker voor LA en vraagt om nader onderzoek; dit geldt ook voor onderwijs
  • Gelijke kansen:
    • Het onderwijssysteem moet radicaal anders - Interview in De Groene Amsterdammer met Maxe de Rijk, die een boek schreef over haar vmbo-kansklas.
    • Lees dit. Je bent toch niet dom?! - Artikel van Johannes Visser in De Correspondent over meritocratie in het onderwijs.
    • Een rechtvaardige wereld begint níét bij gelijke kansen in het onderwijs - Artikel van Johannes Visser in De Correspondent over gelijke kansen en onderwijsexpansie in het onderwijs: “Socioloog Louise Elffers noemt onderwijsbeleid gericht op gelijke kansen daarom ‘een slang die zichzelf in de staart bijt’. Die slang ziet er zo uit: gelijkekansenbeleid -> diploma-inflatie -> onderwijsexpansie -> ongelijke kansen -> meer gelijkekansenbeleid -> diploma-inflatie -> onderwijsexpansie -> ongelijke kansen.”.
  • Onderwijsvernieuwing: Van Gool, R. (2019, May 8). Futuristische retoriek of evidence-based? 19–20(2019). - Interessant artikel in De Groene Amsterdammerover onderwijsvernieuwing in relatie tot de begrippen ‘evidence-based’ en ‘evidence-informed’. “Van ‘kennis centraal’ tot ‘21st-century skills’: discussies over onderwijsmethoden worden zelden beslecht. Hoewel sommige innovaties hun vruchten zeker afwerpen, blijft de doorstroom van wetenschap naar praktijk weerbarstig.”
  • Data literacy: Datacamp. (2023). The State of Data Literacy 2023 (p. 1-59). Interessant rapport van Datacamp met trends in Data Literacy; helaas wel achter een marketing wall en alleen met resultaten uit de UK en US. Ook nuttig is het data competency framework dat in het rapport wordt genoemd.

Zaterdag | 25-02-2023

Vrijdag | 24-02-2023

Donderdag | 23-02-2023

  • Evidence based / evidence informed:
    • How can I become a numbers person. Mooi interview van Neil Richards met Selena Frisk over haar boek “I’m not a numbers person: How to make good decisions in a data-rich world”. Interessante beeldspraak over data informed versus data driven (vergelijking met een paard op een racebaan met en zonder oogkleppen).
      “When a horse wears blinkers, the blinkers are beside their eyes and the idea is that it shuts out the context and what’s happening around them so they don’t get distracted. The idea is that they’re focusing on the finish line and they’re trying to get there; that’s their focus. But the position that they finish in the race is completely dependent on the stuff that’s happening around them. 

      For me that’s what data driven is, and data informed is when the blinkers are off. 

      We look at the numbers, we triangulate the data, so we’re making decisions across a number of different sets of information. We’re looking at elements like point in time and longitudinal. We’re considering the context of–it might be the financial climate, it might be geography, it might be seasonal, or it might be the strengths of the team that you’re working with. Any of those other contextual factors–some of which you could argue fits into the qualitative data piece as well– that contextual understanding to inform the decisions that you’re making alongside the numbers. We’ve got to keep humans in the analysis – in the decisions.”

    • Uit haar boek vind ik dit ook interessant model.

    • Verder een interessant verschil tussen data literacy en data fluency.

  • Visualisaties: Is white space always your friend? Mooie blogpost over de waarde van annotaties in grafieken van Neil Richards.

Woensdag | 22-02-2023

  • Text mining: Text mining in R for the social sciences and digital humanities. Verschillende methoden met tutorials om text mining toe te passen in de sociale wetenschappen.
  • Visualisaties:
    • Chart Chooser - hulpmiddel voor het kiezen van een visualisatie afhankelijk van het soort data. Deze website bevat een toelichting en uitwerking van deze charts in Tableau.

    • From data to viz: Gaat een stuk verder dan het bovenstaande model, met voorbeelden van projecten en data.

  • Presentaties: Extreme Presentation Method - methode voor aansprekende, actiegerichte presentaties.
  • Visualisaties: Weissgerber, T. L., Milic, N. M., Winham, S. J. & Garovic, V. D. Beyond Bar and Line Graphs: Time for a New Data Presentation Paradigm. Plos Biol 13, e1002128 (2015). Studie naar alternatieve weergave van onderzoeksdata (met name bij kleinere aantallen en paired findings). Cédric Scherer heeft op deze figuren een aantal suggesties voor verbetering gemaakt.

Dinsdag | 21-02-2023

  • Visualisaties: Data Communication - Heel interessante presentatie over best practices in visualisaties en hoe grafieken opinie kunnen beïnvloeden van Cédric Scherer. Zie in het bijzonder pagina’s 39 en volgende.

Maandag | 20-02-2023

  • Autisme: Flegenheimer, C., & Scherf, K. S. (2022). College as a Developmental Context for Emerging Adulthood in Autism: A Systematic Review of What We Know and Where We Go from Here. Journal of Autism and Developmental Disorders, 52(5), 2075–2097. https://doi.org/10.1007/s10803-021-05088-4. Overzichtsstudie van studiesucces en interventies in vergelijking met neurotypische studenten. Goede aanknopingspunten voor vervolgonderzoek.

Zondag | 19-02-2023

  • Visualisaties:
    • Tableau en ggplot: Tableau color palettes voor ggplot - een uitleg over de kleurenpalettes voor Tableau voor ggplot
    • BBC Cookbook - uitwerking van een cookbook voor ggplot van de BBC. Een prachtig voorbeeld van een systematische uitwerking van grafieken. Begonnen met een versie voor De HHs / het hoger onderwijs.

Zaterdag | 18-02-2023

Vrijdag | 17-02-2023

Donderdag | 16-02-2023

Maandag | 13-02-2023

  • ADHD: Afgerond Faraone, S. V., Asherson, P., Banaschewski, T., Biederman, J., Buitelaar, J. K., Ramos-Quiroga, J. A., … Franke, B. (2015). Attention-deficit/hyperactivity disorder. Nature Reviews Disease Primers, 1(1), 15020. doi: 10.1038/nrdp.2015.20. Primer over ADHD.
  • Onderwijsbeleid: Begonnen aan Copier, J. Tussen idealen en dwalingen. Verhalen over onderwijs. (Garant, 2022).

Zaterdag | 11-02-2023

  • Graphs: The Trick That Solves Rubik’s Cubes and Breaks Ciphers (Meet in the Middle) - leuke uitleg van het oplossen van graphs aan de hand van een Rubik’s kubus.
  • Leerstijlen: The Biggest Myth In Education - Video over het niet bestaan van leerstijlen. Gebruikte literatuur.
    • Pashler, H., McDaniel, M., Rohrer, D., & Bjork, R. (2008). Learning styles: Concepts and evidence. Psychological science in the public interest, 9(3), 105-119. — https://ve42.co/Pashler2008

    • Willingham, D. T., Hughes, E. M., & Dobolyi, D. G. (2015). The scientific status of learning styles theories. Teaching of Psychology, 42(3), 266-271. — https://ve42.co/Willingham

    • Massa, L. J., & Mayer, R. E. (2006). Testing the ATI hypothesis: Should multimedia instruction accommodate verbalizer-visualizer cognitive style?. Learning and Individual Differences, 16(4), 321-335. — https://ve42.co/Massa2006

    • Riener, C., & Willingham, D. (2010). The myth of learning styles. Change: The magazine of higher learning, 42(5), 32-35.— https://ve42.co/Riener2010

    • Husmann, P. R., & O’Loughlin, V. D. (2019). Another nail in the coffin for learning styles? Disparities among undergraduate anatomy students’ study strategies, class performance, and reported VARK learning styles. Anatomical sciences education, 12(1), 6-19. — https://ve42.co/Husmann2019

    • Snider, V. E., & Roehl, R. (2007). Teachers’ beliefs about pedagogy and related issues. Psychology in the Schools, 44, 873–886. doi:10.1002/pits.20272 — https://ve42.co/Snider2007

    • Fleming, N., & Baume, D. (2006). Learning Styles Again: VARKing up the right tree!. Educational developments, 7(4), 4. — https://ve42.co/Fleming2006

    • Rogowsky, B. A., Calhoun, B. M., & Tallal, P. (2015). Matching learning style to instructional method: Effects on comprehension. Journal of educational psychology, 107(1), 64. — https://ve42.co/Rogowskyetal

    • Coffield, Frank; Moseley, David; Hall, Elaine; Ecclestone, Kathryn (2004). — https://ve42.co/Coffield2004

    • Furey, W. (2020). THE STUBBORN MYTH OF LEARNING STYLES. Education Next, 20(3), 8-13. — https://ve42.co/Furey2020

    • Dunn, R., Beaudry, J. S., & Klavas, A. (2002). Survey of research on learning styles. California Journal of Science Education II (2). — https://ve42.co/Dunn2002

Vrijdag | 10-02-2023

Donderdag | 09-02-2023

  • ADHD:
    • Begonnen aan Faraone, S. V., Asherson, P., Banaschewski, T., Biederman, J., Buitelaar, J. K., Ramos-Quiroga, J. A., … Franke, B. (2015). Attention-deficit/hyperactivity disorder. Nature Reviews Disease Primers, 1(1), 15020. doi: 10.1038/nrdp.2015.20. Primer over ADHD.

    • Eerste cartoon van een kind met ADHD: The story of Fidgety Phil (Duitsland, 1844).

Woensdag | 08-02-2023

  • CBS: CBS Urban Data Center/Den Haag. Sinds 2017 werken de gemeente Den Haag en het CBS samen in het CBS Urban Data Center/Den Haag. Het Urban Data Center heeft de volgende doelen:

    • Nóg beter gebruik te maken van beschikbare data over Den Haag, om effectiever beleid te kunnen maken dat beter past bij wat de stad nodig heeft. Vraagarticulatie en het toevoegen van maatschappelijke waarde spelen hierbij een belangrijke rol.

    • Het versterken van het datagedreven werken binnen de gemeente Den Haag.

Dinsdag | 07-02-2023

Maandag | 06-02-2023

Zaterdag | 04-02-2023

  • Fairness: Hoofdstuk 2: When is automated decision making legitimate? van Barocas, S., Hardt, M., & Narayanan, A. (2019). Fairness in Machine Learning Limitations and Opportunities. fairmlbook.org. Retrieved from http://www.fairmlbook.org

Vrijdag | 03-02-2023

  • Autisme: Abstract ingediend voor een posterpresentatie voor het Nationaal Autisme Congres op 17 maart 2023.

Donderdag | 02-02-2023

  • Gelijke kansen: Begonnen aan Segeren, E. (Ed.). (2021). Gezichten van een onzeker bestaan. Raad voor Volksgezondheid & Samenleving.
  • Gelijke kansen: 2 fascinerend artikelen over gelijke kansen.
    • Geest, M. van der. (2020, October 2). Arme mensen gaan zes jaar eerder dood – waarom doen we daar niets aan? Retrieved February 2, 2023, from https://www.volkskrant.nl/cultuur-media/arme-mensen-gaan-zes-jaar-eerder-dood-waarom-doen-we-daar-niets-aan~b34e97d06/
    • Jongers, T. ‘S. (2021, June 25). ’Als je met 10-0 achterstand begint, is hogerop komen geen klim op een ladder. Het is een tunnel waarin je moet blijven kruipen.’ Retrieved February 2, 2023, from https://www.volkskrant.nl/columns-opinie/als-je-met-10-0-achterstand-begint-is-hogerop-komen-geen-klim-op-een-ladder-het-is-een-tunnel-waarin-je-moet-blijven-kruipen~b41eb81b/
  • Fairness: Introductie uitgelezen van Barocas, S., Hardt, M., & Narayanan, A. (2019). Fairness in Machine Learning Limitations and Opportunities. fairmlbook.org. Retrieved from http://www.fairmlbook.org.

Woensdag | 01-02-2023

  • Fairness: Tutorial over Fairness in ML. Fairness, part 1 - Moritz Hardt - MLSS 2020, Tübingen
    • Disparate treatment (procedurele gelijkheid) versus disparate impact (gelijke uitkomsten). Er zit spanning tussen deze 2: om de laatste te kunnen realiseren moet je onderscheid kunnen maken tussen groepen.
    • Failure of fairness through unawareness. Kenmerken verwijderen lost unfairness niet op; het kan ze juist groter maken. Voorbeeld van 1 day delivery van Amazon in Boston. > idee: dit uitwerken aan de hand van kaarten van Den Haag.
    • Wat kunnen we doen:
      • Fairness criteria in classificatie toepassen
      • Causale modellen van besluitvorming
      • Dynamische modellen van socio-technische systemen
  • Fairness: Begonnen aan Barocas, S., Hardt, M., & Narayanan, A. (2019). Fairness in Machine Learning Limitations and Opportunities. fairmlbook.org. Retrieved from http://www.fairmlbook.org. (Preface en introductie)
  • ChatGPT: Osch, T. V. (2023, January 17). Van Eliza naar ChatGPT: de stormachtige ontwikkeling van taalmodellen. Retrieved February 1, 2023, from https://communities.surf.nl/artificial-intelligence/artikel/van-eliza-naar-chatgpt-de-stormachtige-ontwikkeling-van. Duidelijke uitleg van taalmodellen/transformers.
  • AI in het onderwijs: Hooge, E., Leeuwen, M. V., Molenaar, I., & Bos, N. (2022). Inzet van intelligente technologie (pp. 1–75). Den Haag: Onderwijsraad. Retrieved from Onderwijsraad website: https://www.onderwijsraad.nl/publicaties/adviezen/2022/09/28/inzet-van-intelligente-technologie. AI wordt en actor in het onderwijs. Het verlicht, maar maakt de taak voor een docent ook complexer. Beschrijft goed de toegevoegde waarde van de docent. Een goede overzichtsstudie van voor- en nadelen en toepassingen in Nederland.
  • Gelijke kansen: Podcast ‘Ieder Talent Telt’ beluisterd.
  • Fairness: Gosiewska, A., Gacek, A., Lubon, P., & Biecek, P. (2019). SAFE ML: Surrogate Assisted Feature Extraction for Model Learning. arXiv. doi: 10.48550/arxiv.1902.11035. Doorgenomen nieuwe pagina toegevoegd aan projecten op basis van dit artikel.

Januari 2023

Dinsdag | 31-01-2023

  • AI: Welcome to the Wet Hot AI Chatbot Summer - Verschil tussen aanpak OpenAI en Google in de aanpak van AI. Google gaat langzamer te werk om de impact van nieuwe technologie beter een plek te geven en te voorzien van ethische randvoorwaarden.
  • ChatGPT: ChatGPT Is Making Universities Rethink Plagiarism
    • Nieuw is dat er niet van een persoon is wordt gestolen/overgenomen, maar van een ding. Bestaand plagiaat beleid houdt daar nog geen rekening mee. Bij de komst van Wikipedia was er overigens ook de zorg dat dit een gamechanger zou zijn.
    • “The world of higher education is playing a familiar game of catch-up, adjusting their rules, expectations, and perceptions as other professions adjust, too. The only difference now is that the internet can think for itself.” “In the midst of fundamental change in both the academic and technological spheres, universities are forced to reconsider their definitions of academic integrity to reasonably reflect the circumstances of society. The only problem is, society shows no stagnance.”
    • “The tool’s popularization just calls for greater focus in evaluating the intent behind students’ violations. Warfield explains that students who turn in essays entirely produced by AI are categorically different from those who borrow from online tools without knowledge of standard citations.”
  • Code: Tips for organising your R codeover het gebruik van een default theme voor een organisatie (zie paragraaf 3).
  • Quarto: Building a reporting infrastructure with Quarto. Een toelichting op een reporting straat voor het publiceren van onderzoeksrapporten met behulp van Quarto.
  • Quarto: Diagrams. Uitwerking van de mogelijkheden om diagrammen op te nemen in Quarto.

  • Balancing: Gebruik het package jointVIP om features te vinden die voor balancing van belang zijn.

  • Learning Analytics: Aldowah, H., Al-Samarraie, H., & Fauzy, W. M. (2019). Educational data mining and learning analytics for 21st century higher education: A review and synthesis. Telematics and Informatics, 37, 13–49. doi: 10.1016/j.tele.2019.01.007 - doorgenomen. Overzichtsartikel.

  • Studiesucces: Overzichtsartikel gelezen over de ontwikkeling van de termen student retention en student engagement.Tight, M. (2020). Student retention and engagement in higher education. Journal of Further and Higher Education, 44(5), 689–704. doi: 10.1080/0309877x.2019.1576860. Interessant voor InR.

  • Taxonomie: Naar aanleiding van Balanced Learning Design cursus de nieuwe versie van Bloom’s taxonomie doorgenomen. Wilson, L. O. (n.d.). Anderson and Krathwohl Bloom’s Taxonomy Revised.

  • Fairness: Jacobs, A. Z., & Wallach, H. (2021). Measurement and Fairness. Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, 375–385. doi: 10.1145/3442188.3445901. Interessant voor InR. Gaat in op soorten construct validity van metingen en de betekenis van het construct ‘fairness’. “Measure are more then a creation of society, they create society.”

  • Fairness: Deon framework verder doorgenomen: checklist en voorbeelden.

Maandag | 30-01-2023

  • Visualisaties:
  • Visualisaties: ShowYourStripes. Indrukwekkende visualisatie van temperatuurverschillen in de afgelopen 125 jaar.
  • Visualisaties: VIZ PALETTE - tool om effect van kleurenpallet op kleurenblindheid mee te testen; de kleuren van deze site blijken goed te werken voor alle vormen van kleurenblindheid.

Zondag | 29-01-2023

  • Coding: Best practice in coding - gebruik van prefixes bij variabelen.
    • For data: dta_
    • Temporary files: tmp_
    • Statistical summaries: sum_
    • Models (such as lm models): mod_
    • Custom functions: fn_
    • Plots and visualization: plt_
    • Lookup and referecne tables: lkp_
    • Results and Analysis: rlt_
    • Consistency and accuracy checks: chk_
  • Website: Verder gewerkt aan de Over pagina.
  • Slimme AI:
  • Fairness in werkgeverschap: Wie denkt er aan jou als je baas een algoritme is? - interview met Claartje ter Hoeven, onderzoekerster bij de EUR naar microworkers / ghost workers, over platformwerkers.
  • Learning Design:
    • Geweldige TED-talk van Sir Ken Robinson. Knelpunten in het onderwijsssyteem (No Child Left Behind).
    • Drie zaken drijven ons leren:
      • 1) diversity versus conformity (10% van de kinderen heeft ADD - they are ‘suffering’ from childhood). Kunt spreekt talenten aan, die anders niet aangeraakt worden (are left untouched).

      • 2) curiosity (engine of achievement) versus compliance - docenten staan centraal (facility learning); het verschil in de taak en de achievement (de taak = engagement, het resultaat = de achievement) - testing is in de plaats gekomen van learning (zou ondersteunend moeten zijn); it should support learning, it should not obstruct it.

      • 3) Human life is inherently creative (imagining alternatives and possibilities) versus standardisation.

      • Noodzaak: aandacht voor het individuele kind, investering in docenten, verantwoordelijk neerleggen bij de school om het gedaan te krijgen

  • Visualisaties:

Zaterdag | 28-01-2023

Vrijdag | 27-01-2023

  • Fairness: Opiniestuk over dataminimalisatie. Schipper, M. (n.d.). Voor- en nadelen data: Moeten we meer of minder verzamelen voor een eerlijkere samenleving? — Lilith. Retrieved January 27, 2023, from Voor- en nadelen data: Moeten we meer of minder verzamelen voor een eerlijkere samenleving? — Lilith website: https://www.lilithmag.nl/blog/voor-en-nadelen-data. Bevat een aantal interessante voorbeelden van afwegingen.
  • Fairness: Performing a Fairness Assessment doorgenomen (Fairlearn).
  • Statistiek: Mooie uitleg over de confusion matrix aan de hand van Aesops fabel over ‘The boy who cried “Wolf”’

  • Visualisaties: Headliner package om dynamische teksten te genereren voor ggplot.

Donderdag | 26-01-2023

  • Learning Design: Divjak, B., Grabar, D., Svetec, B., & Vondra, P. (2022). Balanced Learning Design Planning: Concept and Tool. Journal of Information and Organizational Sciences, 46(2), 361–375. https://doi.org/10.31341/jios.46.2.6. Uitwerking van concepten achter tooling om LD te combineren met LA. Zie ook https://learning-design.eu/en/index.

  • Multiple testing: Gebruik het wildwrwolf package om te corrigeren voor multiple testing op basis van Romano-Wolf. Andere mogelijk methoden: Westfall & Young met het wildwyoung package. Beide van Alexander Fischer.

  • Fairness: Discussie-avond bijgewoond over Racisme in data en digitalisering van Pakhuis de Zwijger.

Woensdag | 25-01-2023

  • Fairness:
    • Overzicht van een aantal Fairness frameworks.
    • Eerste hoofdstuk van FairLearn User Guide doorgenomen: Fairness in Machine Learning.
      • Geeft een aantal ‘harms’ die kunnen optreden: allocation harm (het verschillend toewijzen van resources / voordelen) en quality-of-service harm (de kwaliteit van dienstverlening verschilt), stereotyping harms (zoekresultaten die stereotype voorbeelden geven) en erasure harms (groepen worden uitgesloten van resultaten omdat er geen data over is). De 1e twee zijn het best te meten.

Dinsdag | 24-01-2023

  • Causality: Webinar gevolgd van de KNAW over causaliteit: Causaliteit in economie, informatica, logica en taalkunde.
    • Stanford - Guido Imbeans

    • Randomized Controlled Trials (efficacy of honey to improve sleep quality); voor complexe projecten is dit niet mogelijk (de treatment kan toch indirect de control groep beïnvloeden - spillover). Does not work for observational studies.

    • UvA - Sara Maglicacane

  • Learning Analytics: Basisartikel over de lay of the land voor Learning Analytics.
  • Implementatie: Kennisgemaakt met Arun Rampersad die een heel interessant model heeft gemaakt over de ontwikkeling en implementatie van data oplossingen: zie “Zicht opAlgoritmen”.

Zondag | 22-01-2023

  • Fairness:
    • Verder gewerkt aan artikel van Mehrabi. Collectie aangelegd van artikelen over fairness.
    • Zou, J., & Schiebinger, L. (2018). AI can be sexist and racist — it’s time to make it fair. Nature, 559(7714), 324–326. doi: 10.1038/d41586-018-05707-8. Gelezen. Een aantal mooie praktijkvoorbeelden van biases (foto van de Indische bruid) en mogelijkheden om die tegen te gaan.
    • Verma, S., & Rubin, J. (2018). Fairness Definitions Explained. 2018 IEEE/ACM International Workshop on Software Fairness (FairWare), 1–7. doi: 10.23919/fairware.2018.8452913. Aan begonnen. Uitwerking van het begrip fairness naar verschillende statistisch modellen aan de hand van de German Credit Database.

Zaterdag | 21-01-2023

  • Learning Technology: The Most Persistent Myth- “The job of the teacher is to guide the social process of learning.” - een video n.a.v. het blog van Nynke Kruiderink over de invloed van technologie op onderwijs.
  • Learning Design: Naar aanleiding van een presentatie van Bart Rienties: verbeter het lesontwerp van een cursus ondersteund door data - mogelijk met behulp van Balanced Design Planning. Mogelijke literatuur:

  • Synthetic data: Met uncovr/conjurer is het mogelijk om vanuit een model de achterliggende data te genereren (van bedrijf FOYI). Zie How to generate data from a model – Part 1 en Part 2.
  • Sport: Fascinerend filmpje (How Hidden Technology Transformed Bowling) over de interactie tussen een bowlingbal (materiaal en zwaartepunt), de baan (de mate van olie op de baan) en de pins (de hoek waarin de pins geraakt worden). Je zou dit kunnen zien als een manier om over studenten na te denken hoe zij door hun studie gaan; dit verschilt per student afhankelijk van de persoonlijke eigenschappen, de conditie en interactie met de baan, de pins (wat is het doel) en de bowler (de docent).

  • Website: Integratie met Netlify en zoekmachine Algolia. Domeinnaam hapax-anlaytics.nl gekocht.

Vrijdag | 20-01-2023

  • Visualisaties: Demo van de OU voor een process mining dashboard met Qliksense en add-on Vizlib.
  • HHs: Gewerkt aan onze nieuwe Gedragscode Privacy & Ethiek Studiedata.
  • VU: Voorbereidingen voor onderzoek naar studenten met ADD/ADHD.

Donderdag | 19-01-2023

  • SURF SIG Learning Analytics: Bijeenkomst bijgewoond en deelgenomen aan de Studiedata Informatiehub werksessie in het kader van de digitaliseringsimpuls.
  • Fairness: Begonnen aan Mehrabi, N., Morstatter, F., Saxena, N., Lerman, K., & Galstyan, A. (2021). A Survey on Bias and Fairness in Machine Learning. ACM Computing Surveys, 54(6), 1–35. doi: 10.1145/3457607

Woensdag | 18-01-2023

  • Fairness: Seminar Fairness in Machine Learning and Operations Research bijgewoond (van de VVSOR).
    • Lezing 1 - An overview  of fairness in machine learning, and insights from insurance practice - Rogier Emmen - ORTEC

      • Gebruik features van een model om de variabele waarvoor je wil corrigeren te voorspellen.
      • Fairness measures: demographic parity (same amount of observations each), equal opportunity (same true positive proportions), equalized odds (same true and false positives proportions).
      • TB: Discriminations - to be able to discriminate is important in machine learning. It is inherent to the technique.
      • Suggestie voor een artikel: Mehrabi, N., Morstatter, F., Saxena, N., Lerman, K., & Galstyan, A. (2021). A Survey on Bias and Fairness in Machine Learning. ACM Computing Surveys, 54(6), 1–35. doi: 10.1145/3457607 (in papers)
    • Lezing 2 - Oops and optimality - Vincent Warmerdam

      • Geeft voorbeelden van de chickens dataset (lijkt sterk op uitvalsgrafieken)
      • Gebruik bij modelleren verschillende seeds en combinaties van cross validation.
      • Zelden worden constraints toegevoegd aan modellen. Gebruik die wel (geeft voorbeeld van vectoren).
      • Er is trade-off tussen fairness en accuracy.
      • Zie website FairLearn om fairness beter te verwerken in algoritmes.
      • Personal notes: indrukwekkend persoonlijk verhaal (anecdotisch materiaal helpt om een punt duidelijk te maken).
      • Deon: an ethics checklist for data scientists (“command line tool that allows you to easily add an ethics checklist to your data science projects”).
    • Lezing 4 - Fairness in forensic science - Marjan Sjerps (NFI/UvA)

      • Eerst blind vergelijken (net als vrouwe justitia). Daarna pas de envelop openen met de contextuele informatie

      • Objectifying interpretation of evidence (niet termen ‘zwak’ of ‘sterk’ maar een nummer) - likely ratio framework

      • Zie slide 11 - met de LR worden de rollen gescheiden. De rechter bepaalt op basis van de beschikbare informatie de priors, dan volgt de onafhankelijke LR van de forensic expert, waarna de rechter de posteriors kan bepalen.

      • Vervolgvragen van de rechter: kunnen we deze getallen vertrouwen en wat was de methode?

      • Dit is te ondervangen met een validatie studie (Van Es et al, 2017)

    • Vijfde lezing - How OR can help understand fairness trade-offs in complex practical problems - Thomas Breugem - Tilburg University

      • Health Delivery 1. Family planning in Africa
        • Vertical fairness - varying treatment for varying needs

        • Probleem: donororganisatie willen dat het aantal kwetsbare clienten dat geholpen wordt toeneemt, maar dat staat op gespannen voet met OR (optimalisatie)

        • Heeft een model gemaakt dat de trade-off berekent tussen high-impact en volume

      • Railway Crew planning 2. Train crew planning
        • Vraag: is attractiveness (van een rooster) gelijk aan fairness?

        • Is equality desirable?

        • Be careful not to overoptimize fairness

        • Questionable whether fair rosters are desirable for all employees

  • Trends: Trendverkenning studiedata van SURF doorgenomen. Akcaova, G., Baten, D., Poot, G., & Vermaas, K. (2023). Trendverkenning studiedata: een exploratie van opkomende waarden & behoeften rondom studiedata (pp. 1–49). SURF.

Dinsdag | 17-01-2023

  • Statistiek: Verwerkt gewerkt aan easystats.
    • Effect size. Handig is dat je ook een interpretatie kan uitvragen op basis van verschillende “rules of thumb”.

    • Parameters biedt mogelijkheden om de parameters van modellen te printen. Met de functie select_parameters() worden automatisch de beste parameters gekozen afhankelijk van het model dat is gebruikt.

    • Performance. Heel interessante en handige functionaliteit om assumpties te testen en modellen te vergelijken.

Zondag | 15-01-2023

  • Website:
    • Verder gewerkt aan mogelijkheden om de namen en logo’s van De HHs en VU goed weer te geven.
    • Publicatie via Github naar Netlify.
  • Statistiek: Easystats uitgeprobeerd: reports package. Geeft goede samenvattingen in het Engels (in lopende tekst, tabellen). Daarnaast: correlation,

`Table: Summary of Posterior Distribution

Parameter Median 95% CI pd ROPE % in ROPE Rhat ESS
(Intercept) 4.30 [4.14, 4.46] 100% [-0.10, 0.10] 0% 1.000 3521.00
Petal.Length 0.41 [0.37, 0.45] 100% [-0.10, 0.10] 0% 1.000 3384.00
  • Statistiek: Bayesian statistiek - website van de UvA over bayesiaanse statistiek.

    • Zie met name de uitleg over een herberekening van de onderbouwing van de cognifitieve dissonantie theorie van Festinger uitgevoerd in JASP: Ly, A., Raj, A., Etz, A., Marsman, M., Gronau, Q. F., & Wagenmakers, E.-J. (2018). Bayesian Reanalyses From Summary Statistics: A Guide for Academic Consumers. Advances in Methods and Practices in Psychological Science, 1(3), 367–374. doi: 10.1177/2515245918779348 (in papers)

    • De analyse van dit artikel herhaald in JASP aan de hand van de uitleg.

Zaterdag | 14-01-2023

  • Future trends: Why the Future Doesn’t Need Us. Dystopisch artikel over de toekomst van de mensheid in relatie tot robotica, nano-technologie, bio-engineering (GNR technologie - genetics, nano, robots) uit 2000.
    • Waarom we eventueel een dystopische toekomst niet merken is omdat het zich gradueel voltrekt en we eraan wennen. Nieuw is dat ze voor een brede groep ontwikkelaars ter beschikking komen i.t.t. de ontwikkeling van kernwapens of kernenergie. Ontwikkelingen zullen rond 2030 samenkomen.
    • We moeten ons de vraag stellen hoe we het beste met deze nieuwe technologieën kunnen co-existeren.
    • Overige technologieën: bio-engineering (cloning, ontwikkeling nieuwe planten, voorkomen of genezen van ziektes, overwinnen van ouderdom door genetic engineering), nano-technologie (assemblers). Het risico vormt “the power of destructive self-replication in genetics, nanotechnology, and robotics (GNR)” die niet in handen van overheden is maar van commerciële bedrijven.
    • Hij put er hoop uit dat we in staat zijn geweest andere technologieën die bedreigend zijn aan banden te leggen of ervoor kiezen ze niet te ontwikkelen (zoals biologische wapens).
  • AI: Stop Tinkering with AI. Artikel van Davenport en Mittal over 10 randvoorwaarden voor een succesvolle implementatie van AI.
    • 1) Know What You Want to Accomplish (Standaardisatie van informatie), 2) Work with an Ecosystem of Partners, 3) Master Analytics, 4) Create a Modular, Flexible IT Architecture, 5) Integrate AI into Existing Workflows, 6) Build Solutions Across the Organization, 7) Create an AI Governance and Leadership Structure, 8) Develop and Staff Centers of Excellence, 9) Invest Continually, 10) Always Seek New Sources of Data.
  • Statistiek: easystats package maakt snelle samenvattingen van data eenvoudig (easystats: Quickly investigate model performance). Is eigenlijk een verzameling van packages om snel te kunnen modelleren.

  • Voorspellingen van succes: Alyahyan, E., & Düştegör, D. (2020). Predicting academic success in higher education: literature review and best practices. International Journal of Educational Technology in Higher Education, 17(1), 3. doi: 10.1186/s41239-020-0177-7. Uitstekend samenvattend paper over mogelijkehden voor het bouwen van voorspellende modellen. Misschien goed om te gebruiken in inaugurele rede. In papers.

Vrijdag | 13-01-2023

  • Git: Initiële commit gemaakt naar Github repo.

Woensdag | 11-01-2023

Dinsdag | 10-01-2023

  • Deep Learning en Learning Analytics: een vergelijkend onderzoek van deep learning en machine learning in Learning Analytics toont aan dat ML modellen even goed voorspellen en beter uitlegbaar zijn.

    • Doleck, T., Lemay, D. J., Basnet, R. B., & Bazelais, P. (2020). Predictive analytics in education: a comparison of deep learning frameworks. Education and Information Technologies, 25(3), 1951–1963. doi: 10.1007/s10639-019-10068-4. In papers.
  • Trends: Kevin Kelly: The Case for Optimism.

    Ubiquitous AI - Up until the industrial revolution anything that humans made, including cities and roads, had to be made with the energy of organic muscles (human or animal), which was drastically limited. With the advent of cheap artificial power, we could erect tall skyscrapers, vast continental railroads, immense factories, and mass manufacturing -- all way beyond what meat muscles could do. We have started to do the same with our natural thinking muscles, by seeding the world with artificial intelligences. A zoo of hundreds of different species of new types of mind will be working with humans to solve problems. These non-human minds (sometimes with bodies we call robots) will do work humans don’t want to do, or can’t do. Humans and AIs together will co-create new desires and new jobs. The long-term driver of progress -- automating physical jobs -- will continue, and then begin to take over non-physical chores as well. The three chief consequences of AI will be the liberation of humans from their unwanted jobs, the explosion of new services and formerly impossible products that are co-created with AIs, and new occupations and desirable tasks for humans. AIs and robots are designed for efficiency and productivity, while these millions of new human jobs are primarily tasks where inefficiency is tolerated. To excel in innovation, entrepreneurship, art, caring, hospitality, science and discovery, humans must try things that don’t work, embrace failures, encourage small talk and playfulness -- all inefficient. Efficiency is for robots. Ubiquitous AI is the most optimistic force we can imagine.

Maandag | 09-01-2023

  • AI: Artikel van TED talks over de problemen die er waren met volledig autonoom rijden door Janelle Shane.
    • Een probleem was het terugschakelen van de autonome functie naar de chauffeur. Deze had zo lang niets gedaan, dat een ingreep te laat kwam. Ook had AI niet geleerd alle mogelijkheden te herkennen (zoals een kangoeroe of een vrachtwagen van de zijkant).

    • In het bijbehorende filmpje (The danger of AI is weirder than you think) gaat Shane erop in dat AI goed aangeleerd moet worden wat restricties (!) zijn, anders zal het op elke mogelijke manier voldoen aan de opdracht die we geven. “It’s entire world is the data that I gave it.” AI zelf heeft geen besef van wat goed of fout is; dit wordt gevoed (of niet) door de ontwerper/programmeur. Zo heeft een facebook algoritme als opdracht zoveel mogelijk kliks te genereren; negatieve content genereert meer kliks.

  • Autisme: Interview voor het blad Autisme van de NVA.
  • AI: Why we need to create AI that thinks in ways that we can’t even imagine (23 mei 2017)“AI could just as well stand for”alien intelligence.” We have no certainty we’ll contact extraterrestrial beings in the next 200 years, but we have almost 100 percent certainty that we’ll manufacture an alien intelligence by then.” - Kevin Kelly - TED betoogt dat we met AI andere vormen van intelligentie zullen ontwikkelen die we met menselijke intelligentie niet kunnen bedenken. Deze zijn gespecialiseerd op specifieke domeinen.
    • Humans are for inventing new kinds of intelligences that biology could not evolve. Our job is to make machines that think different — to create alien intelligences.

    • Artificial intelligence will help us better understand what we mean by intelligence in the first place. In the past, we would have said only a superintelligent AI could beat a human at Jeopardy! or recognize a billion faces. But once our computers did each of those things, we considered that achievement obviously mechanical and hardly worth the label of true intelligence. We label it “machine learning.” Every achievement in AI redefines that success as “not AI.”

    • But we haven’t just been redefining what we mean by AI — we’ve been redefining what it means to be human.

    • Bijbehorende TED talk: How AI can bring on a second Industrial Revolution (dec 2016)

      • We weten niet hoe een druppel precies van de berg afgaat, maar wel welke kant het opstroomt.

      • 1) We zullen varianten van cognition ontwikkelen op verschillende domeinen. Dit is nu ook al zo; bij mensen, maar ook bij dieren. Een eekhoorn heeft een fenomenaal geheugen voor noten. Op sommige domeinen zal dat worden, op andere niet. De vraag is of dit ook voor het onderwijsdomein zal gaan gelden. Zij worden niet afgeleid. We zullen zoveel mogelijk soorten ontwikkelen.

      • 2) De eerste industriële revolutie was artificial power. De tweede industriële revolutie wordt de toevoeging van AI daarin toe: “we’re going to cognify it”.

      • 3) Als we dit belichamen hebben we een robot. Deze zullen nieuwe zaken gaan doen, waarvan we nog niet wisten dat we die nodig hadden, net zoals dit is gedaan met automatisering. Mensen zijn heel goed in zaken die niet efficiënt zijn - zo leren we, door het maken van fouten. Efficiëntie is voor robots. Het beste wordt een hybride oplossing - hoe goed je met deze bots kan samenwerken.

Zondag | 08-01-2023

  • AI: De cursus De AI-cursus voor onderwijs van de AI-coalitie gevolgd.

    • Track #1 | Onderwijsdilemma’s.

    • Track #2 | Mogelijkheden van AI in het onderwijs: Inge Molenaar: 1. Detecteren, 2. Interpreteren (kennis, motivatie, emotie), 3. Handelen (pedagogisch-didactisch).

    • Track #3 | Hoe werkt AI in het onderwijs? Over adaptiviteit: van stap-, naar taak-, naar curriculum-adaptiviteit.

    • Track #4 | AI in je onderwijs, verwachtingen VO. AI in je onderwijs, verwachtingen VO. “Learnbeat en Bettermarks zijn de meest bekende voorbeelden van software in het VO waarin AI wordt toegepast. Ook bij het pakket zoals Memrise zit AI achter de motorkap.” Koen Strauss - oprichter van Learnbeat komt aan het woord.

    • Track #5 | Overzicht krijgen met dashboards. Vier mogelijkheden: informeren, adviseren, begeleiden, voorschrijven van handelingen.

    • Track #6 | De veranderende rol van de docent. Legt de relatie tussen de rol van de leerkracht en het besturen van een auto (zie onder).

    • Mooi filmpje over het perspectief van de docent.

    • Track #7 | Uitdagingen met AI. AI kan leiden tot meer kansengelijkheid: leerlingen kunnen in hun eigen tempo de lesstof volgen (wat leidt tot meer motivatie) en het pygmalion effect (dat een docent of ouders een student onbewust bevooroordelen) treedt niet op.

    • Bijdrage aan kansenongelijkheid: ongelijke verdeling van toegang tot digitale middelen, leerlingen die meer zelfsturing kan handelen leert ook sneller (verschillen worden groter), zwakkere leerlingen kunnen niet leren van de snellere leerling (cohesie in een klas neemt af), risico dat leerlingen geconfronteerd worden op basis van oude data (nadeel van profilering - recht om vergeten te kunnen worden).

    • Track #8| Een kijkje in de toekomst en zelf aan de slag.

    • Aankondiging van het Nationaal Onderwijs Lab AI (platform voor onderwijs en wetenschap).

  • AI: Visualisatie van de EPRS, Europese Commissie van de mate van toepassing van AI op de weg.

  • AI in hoger onderwijs: Special van European Journal of Education (Vol 57, Issue 4) 2022 over AI in het onderwijs.

  • AI in onderwijs: Molenaar, I. (2022). Towards hybrid human‐AI learning technologies. European Journal of Education, 57(4), 632–645. doi: 10.1111/ejed.12527 gelezen. In Papers.

    • Ilustraties van Radboud Universiteit.

      • Presentatie van het 6 kolommen model:

      • Vragen: Is dit ook toepasbaar voor het hoger onderwijs? In welke mate is het onderscheid ‘stap, taak, curriculum’ voldoende? Hoort daar niet het 4e niveau ‘life long learning’ bij?

Zaterdag | 07-01-2023

  • AI: QuilBot - AI tool om parafraseringen te maken. Wordt gepresenteerd om tekst van ChatGPT aan te passen, zodat plagiaat-detectie door Google niet te doen is.,
  • AI en ChatGPT: Een video over het maken van een website voor schoenen met behulp van AI. Pretty impressive. Tools die gebruikt zijn: Midjourney, ChatGPT en Editor X.

  • Visualisatie: TidyTuesday website. Bevat een lijst met boeken om betere visualisaties te leren maken.
  • AI: Podcast De Technoloog | BNR van 13 december 2022: Ook de natuurkunde krijgt hulp van kunstmatige intelligentie met Max Welling, hoogleraar machine learning aan de UvA.
    • Belangrijk is dat we werken aan vertrouwen in algoritmes, omdat het steeds moeilijker of al onmogelijk is om ze noch te begrijpen. Vergelijkbaar met het in een vliegtuig stappen; daar hebben we vertrouwen in omdat de certificering goed is.

    • Kunnen we neurale netwerken ook inzetten voor het voorspellen van succes in het hoger onderwijs? Wat is daarvoor nodig. Welling noemt dit het 5e paradigma, waarbij simulaties een essentiële rol spelen.

  • Visualisatie: Het showtext package maakt het mogelijk om externe fonts in R images te gebruiken.
  • Visualisatie: Het thematic package maakt het mogelijk om eenvoudig thema’s aan te passen voor ggplot / shiny op basis van algehele settings…

Vrijdag | 06-01-2023

  • Website: Verder gewerkt aan de ‘over’ pagina en eerste opzet van het blog.

Donderdag | 05-01-2023

  • Website: Geoefend met Quarto en het uitzoeken van een pallet.

  • CV: Georiënteerd op CV’s in Quarto. Het vitae package lijkt interessant.

Woensdag | 04-01-2023

  • fAIr: Mitigating Bias in Artificial Intelligence is onderdeel van Haas School of Business (University of California, Berkeley) - Center for Equity, Gender & Leadership. Hebben een playbook ontwikkeld. Rapport opgenomen in papers: Smith, G., & Rustagi, I. (2020). Mitigating Bias in Artificial Intelligence (p. 62). Berkeley Haas Center for Equity, Gender and Leadership.
  • Netwerk analyse: nnet - Network Analysis and Community Detection

  • Clustering: tidyclust - The goal of tidyclust is to provide a tidy, unified interface to clustering models. The packages is closely modeled after the parsnip package.

  • Power: Berekenig van power met het pwrss package. Zie het vignette voor voorbeelden.

  • Heatmap: funkyheatmap package: Provides functions for generating heatmap-like visualizations for benchmark data frames, which can be fine-tuned with annotations for columns and rows.

  • Visualisatie: ggpcp v0.2.0: Provides a Grammar of Graphics implementation of parallel coordinate plots that incorporates categorical variables into the plots in a principled manner.

  • Reviews: Voor LAK23 en voor Psychology in the Schools.

Dinsdag | 03-01-2023

  • GIS: Eerste kaartje van Den Haag gemaakt!

Maandag | 02-01-2023

Zondag | 01-01-2023

December 2022

Zaterdag | 31-12-2022

  • fAIr: Boek aangeschaft over fair AI. Lobel, O. (2022). The Equality Machine: Harnessing Digital Technology for a Brighter, More Inclusive Future. Verder gelezen (circa helft)

Dinsdag | 27-12-2022

  • Multiaccuracy boost: een methode om bias te corrigeren op minderheidsgroepen. Zie mcboost.

Maandag | 26-12-2022

  • fAIr: Boek aangeschaft over fair AI. Lobel, O. (2022). The Equality Machine: Harnessing Digital Technology for a Brighter, More Inclusive Future. PublicAffairs.

  • Blog: Met distill, github en netlify kan je een blog maken (video) of met quarto.
  • Artikel: Baarsma, B., Haar, B. T., Wijnands, B., Blom, F., Wijers, H., Winter, J., … Veeken, R. V. der. (2021). De datagedreven toekomst.nl (pp. 1–56). Denkwerk. Retrieved from Denkwerk website: https://denkwerk.online/rapporten/de-datagedreven-toekomstnl-februari-2021/. Hoofdstukken 5-7 gelezen.
  • Artikel: Baarsma, B., Haar, B. T., Wijnands, B., Blom, F., Wijers, H., Winter, J., … Veeken, R. V. der. (2021). De online wereld.nl: hoe we grip terugpakken op onze online wereld (pp. 1–64). Denkwerk. Retrieved from Denkwerk website: https://denkwerk.online/rapporten/de-online-wereldnl-februari-2021/. Gelezen; met name interessant is het idee van de s-curve.

Zondag | 25-12-2022

  • Artikel: Baarsma, B., Haar, B. T., Wijnands, B., Blom, F., Wijers, H., Winter, J., … Veeken, R. V. der. (2021). De datagedreven toekomst.nl (pp. 1–56). Denkwerk. Retrieved from Denkwerk website: https://denkwerk.online/rapporten/de-datagedreven-toekomstnl-februari-2021/. Tot en met hoofdstuk 4 gelezen.
  • Data pipeline: Targets package om meerdere stappen achter elkaar te automatiseren en te kunnen herhalen. Zie voor een voorbeeld: A journey with Targets. ROpenSci. Uitgeprobeerd: te complex.

Zaterdag | 24-12-2022

Vrijdag | 23-12-2022

  • Coding: Rhino - een package om gemodulariseerde/objectgeöriënteerde Shiny code te ontwikkelen; het gebruikt daarvoor het box package.

Donderdag | 22-12-2022

  • Promotie A4: proof drukversie verbeterd.

Zondag | 18-12-2022

  • Visualisatie: Mooie visualisatie over Messi van The xG Philosophy.

  • Model calibration: Nieuw package, probably, in tidymodels om modellen te calibreren. The goal of model calibration is to ensure that the estimated class probabilities are consistent with what would naturally occur.
  • Spatial: Een overzicht van verschillende packages op basis van de UK.

Donderdag | 15-12-2022

  • RVerbalExpressions - The goal of RVerbalExpressions is to make it easier to construct regular expressions using grammar and functionality inspired by VerbalExpressions. Usage of %>% is encouraged to build expressions in a chain like fashion.

Zondag | 04-12-2022

November 2022

Dinsdag | 29-11-2022

Zaterdag | 26-11-2022

Zondag | 21-11-2022

  • Corona: artikel over achterstand in het po. Onderzoek wijst uit: de leervertraging door de schoolsluitingen loopt op. Veldhuis, P. (2022, November 18). Onderzoek wijst uit: de leervertraging door de schoolsluitingen loopt op - NRC. Retrieved November 20, 2022, from https://www.nrc.nl/nieuws/2022/11/17/onderzoek-wijst-uit-de-leervertraging-door-de-schoolsluitingen-loopt-op-a4148607.

  • Gelijke kansen: Inaugurele rede van Carla Haelermans. Haerlemans, C. (2022). Computer says no! Over technologie en ongelijkheid in het onderwijs. doi: 10.26481/spe.20220930ch. Contact mee opgenomen via LinkedIn.
  • Autisme: Rebuttal 3 voor A4 afgerond en naar Sander verstuurd.

Zaterdag | 19-11-2022

  • Tidymodels: hoofdstuk 10 - Resampling for Evaluating Performance. Behandelt bias - idee voor inauguratie - zouden we met resampling binnen het onderwijs kunnen werken, bijv. met klassen? Dat geeft minder bias. Onderscheid tussen low bias models (random forest) en high bias models (lm). De low bias doet het slechter bij een test set, omdat het - zonder sampling - altijd de perfecte verdeling voor de trainingset kan nabootsen. Met x-fold en stratificatie lossen we dit probleem op. Idee > dit kan het onderwijs leren van ML. Je zou op die manier studentengroepen kunnen indelen. Een goede fold is 10; repeats worden uitgevoerd om de noise te reduceren (standaard errors). Een alternatief is bootstrapping (sampling met replacement). Bij tijdsseries kan je gebruik van maken van rolling forecasts resampling. Tijdswinst is te behalen met parallel processing.

Vrijdag | 18-11-2022

  • Visualisaties: ggblanket package - een wrapper om ggplot met een eenvoudiger interface.
  • Visualisaties: simplevis package om de stijl van visualisaties te vereenvoudigen.

  • Tijdseries: grates package om tijdsintervallen eenvoudig te kunnen indelen en viusaliseren.

Donderdag | 17-11-2022

  • Autisme: A4 commentaar van de editor verwerkt.

Woensdag | 16-11-2022

  • Text analysis: Hoofdstuk 2 gelezen van Supervised Machine Learning for Text Analysis in R - Tokenization. Gebruik voor tokenization de packages tokenizers (Mullen et al. 2018) and spaCy (Honnibal et al. 2020). Bevat code om tekst uit hoofdstukken te nesten (2.2). Dit kan je eventueel gebruiken om zinnen te scheiden die ‘hostile’ zijn of niet.

  • Benchmarking: gebruik het bench package om benchmarking uit te voeren:

    bench::mark(check = FALSE, iterations = 10,
      `corpus` = corpus::text_tokens(hcandersen_en$text),
      `tokenizers` = tokenizers::tokenize_words(hcandersen_en$text),
      `text2vec` = text2vec::word_tokenizer(hcandersen_en$text),
      `quanteda` = quanteda::tokenize_word(hcandersen_en$text),
      `base R` = strsplit(hcandersen_en$text, "\\s")
    )
    
    #> # A tibble: 5 × 6
    #>   expression      min   median `itr/sec` mem_alloc `gc/sec`
    #>   <bch:expr> <bch:tm> <bch:tm>     <dbl> <bch:byt>    <dbl>
    #> 1 corpus       75.9ms     81ms     11.9     4.58MB     1.33
    #> 2 tokenizers   96.2ms    104ms      9.54    1.01MB     2.38
    #> 3 text2vec     78.5ms     82ms     11.9    15.61MB     1.33
    #> 4 quanteda    163.2ms    172ms      5.69     8.7MB     1.42
    #> 5 base R      294.1ms    302ms      3.15   10.51MB     2.10
  • Text analysis: Een Nederlandse taallijst voor tokenization is gemaakt door de KU-Leuven: RobBERT.

Dinsdag | 15-11-2022

  • Tidymodels: Improvements to model specification checking in tidymodels - artikel over de manier waarop tidymodels het wisselen tussen verschillende implementaties van een model mogelijk maakt met parsnip en hoe - door de foutmeldingen - duidelijk wordt gemaakt wat je aanvullend moet doen om het werkend te krijgen.

  • Tidymodels: brulee 0.2.0 - goed voorbeeld van een recipe aan de hand van het brulee package.

    “brulee contains several basic modeling functions that use the torch package infrastructure, such as: neural networks, linear regression, logistic regression, and multinomial regression.”

  • Tidymodels: bundel - package om een model te bouwen en te bundelen inclusief referenties, zodat je dat portable maakt.

    The bundle package provides a consistent interface to capture all information needed to serialize a model, situate that information within a portable object, and restore it for use in new settings.

  • Tidymodels: censored - parsnip extensie voor survival analyses.
  • Tidymodels: agua - package om h2o functionaliteit te kunnen gebruiken.
  • Tidymodels: spatialsample - package om samples op basis van GIS te organiseren en visualiseren.
  • Tidymodels: bonsai - parsnip extensie voor tree models.
  • Text analysis: hoofdstuk 1 gelezen van Supervised Machine Learning for Text Analysis in R - Language and modeling.
  • Weighting: Blog van Tidyverse over de ondersteuning van case weights.

Maandag | 14-11-2022

  • Tidymodels: hoofdstuk 8 over Feature Engineering with recipes afgerond.
  • Balans: themis - package om disbalans op te lossen.
  • Balans: Zie ook het artikel over het SMOTE algoritme (Synthetic Minority Over-sampling Technique): Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research, 16, 321–357. doi: 10.1613/jair.953.

Zondag | 13-11-2022

  • Responsible AI: DALEX uitproberen aan de hand van de Titanic data

Zaterdag | 12-11-2022

Vrijdag | 11-11-2022

Donderdag | 10-11-2022

  • HHs: Lectorale rede van Lampros

Woensdag | 09-11-2022

Dinsdag | 08-11-2022

Maandag | 07-11-2022

Zondag | 06-11-2022

  • Visualisaties: R graphics cookbook - werkt ggplot2 uit
  • Missingness: Package om missende waarden te analyseren: naniar
  • Validatie: Datavalidatie Cookbook van Mark van der Loo (validate package)
  • Bias: fairmodels: a Flexible Tool for Bias Detection, Visualization, and Mitigation in Binary Classification Models - interessant artikel over het modelleren van fairness om bias tegen te gaan: Wiśniewski & Biecek, “The R Journal: fairmodels: a Flexible Tool for Bias Detection, Visualization, and Mitigation in Binary Classification Models”, The R Journal, 2022. Idee voor een vervolgonderzoek naar bias in hoger onderwijs (vergelijken met analyses op veroordeelden). Dit in verband brengen met studentenwelzijn - subsidieaanvraag bij NRO?
  • Explanatory Model Analysis: in het verlengde van fairmodels is er een groep van packages om modellen beter uit te leggen (DrWhy) met een bijbehorend boek: Explanatory Model Analysis.
  • Responsible AI: methode om van een blackbox model alsnog naar een explainable model te komen: Simplify your model: Supervised Assisted Feature Extraction for Machine Learning. Zie ook het stripboek en de bijbehorende tutorial van de UseR2022 conferentie.

  • Tools: Student feedback: Student Pulse (Gorm Eriksen)
  • Drift: het probleem dat modellen na Covid anders presteren heet drift. Om dit te berekenen gebruik het drifter package.
  • Data cleaning: stringr::str_squish - verwijdert leading en trailing spaces

Zaterdag | 05-11-2022

  • 3D visualisatie: Presentatie over 3D animatie van een roller coaster door data
  • Visualisaties: Visualisaties in python.
  • Samenwerking: Openscapes - Samenwerkingsmethode voor data science teams
  • Quarto: Video over de mogelijkheden van Quarto
  • VU - autisme: Gewerkt aan rebuttal 2 voor A4 (submission naar Autism).
  • Data cleaning: cleaner - package om data te checken en cleanen.
  • Visualisaties: R-charts com - verzamelwebsite met plots via ggplot
  • Illustraties: Allison Horst - open source tekeningen bij data science en populaire packages.

Vrijdag | 04-11-2022

Donderdag | 03-11-2022

  • Studiesucces: Praktijkgidsen OU voor effectief studeren (thinkfest) - #studiestrategie

  • Student Agency: Onderzoek van Jeanine Haenen onder studenten bij faculteit x? Misschien kunnen Student Agenda meenemen in Machine Learning modellen (thinkfest).

Woensdag | 02-11-2022

  • Quarto: Gallery bekeken en presentaties met reveal.js.
  • Missingness: Artikel over missing data gelezen (pp 151-156). Little, T. D., Jorgensen, T. D., Lang, K. M., & Moore, E. W. G. (2014). On the Joys of Missing Data. Journal of Pediatric Psychology, 39(2), 151–162. doi: 10.1093/jpepsy/jst048
    • UITZOEKEN: p 154: Wat is het verschil tussen inclusive en non-inclusive implementation van MI of FIML?
  • Tidymodels: Hoofdstuk 3 en 4 gelezen van Tidy modeling with R.

Dinsdag | 01-11-2022

Oktober 2022

Maandag | 31-10-2022

Tidy Modeling with R

Zondag | 30-10-2022

  • Dit logboek is bedoeld om bij te houden welke ideeën ik heb voor mijn lectoraat. Het is ook bedoeld voor mijzelf om Quarto aan te leren.
  • In de week van 24 oktober 2022 ben ik begonnen mijzelf weer in te werken in het vakgebied, na ongeveer 2 jaar tijd in mijn andere baan als directeur OKC gewerkt te hebben.
  • Ik heb een aantal bookmarks verzameld aan de hand van R-packages. Daar zitten meerdere interessante packages bij. Ik zie met name mooie kansen voor GIS, visualisaties (in afbeeldingen en tabellen), rapportages en boeken in Quarto.