Hei, den siste tiden har flere besøkt sidene på som omhandler AI/KI på digitalpedagogen.no. Sidene ble skrevet før jeg ble ferdig med masteren. Perspektivene, kunnskapen og alt annet har utviklet seg betydelig. Jeg lar sidene alikevel være oppe en stund til, men KIskolen.no er nok mer givende. |
For å forstå kunstig intelligens er det viktig å ha kunnskap om hva den er bygget av og hvordan den trenes. To sentrale begreper som man må kunne for å forstå AI er datasett og algoritmer.
Datasett – treningsgrunnlaget
Innenfor AI refererer datasett til en samling av data som brukes til å trene maskinlæringsmodeller og muliggjøre læring gjennom eksempler. Et datasett består av datapunkter, også kjent som prøver eller observasjoner, sammen med tilhørende egenskaper eller funksjoner som beskriver hver prøve. For å illustrere dette kan man tenke seg datasettet som oppskrifter på kaker, hvor hver oppskrift har merkelapper som søt, mektig, stor, liten, hvit, rosa og alle andre mulige måter man kan beskrive en kake på.
Dette gir nødvendige treningsdata for å lære AI-modeller hvordan de skal utføre spesifikke oppgaver. Gjennom å trene modellene på et mangfold av data, kan modellene lære mønstrene og relasjonene innenfor dataene.
Disse dataene utgjør grunnlaget for maskinlæringsalgoritmer, og muliggjør generalisering av tidligere erfaringer for å ta beslutninger. Kvaliteten og relevansen til egenskapene som hentes fra datasettet, påvirker i stor grad hvor bra AI-systemene blir. Datasett er også avgjørende for kontinuerlig læring, slik at AI-modeller kan tilpasse seg og forbedre seg over tid.
Selv om datasett er avgjørende for AI, bringer de også med seg visse utfordringer. Det er viktig å sikre kvalitet og pålitelighet i dataene som inngår i datasettet. Ukorrekte, skjeve eller ufullstendige data vil føre til feilaktige resultater. Viss AI-en blir trent opp på at 2+2 = 7, så vil den regne feil videre også.
En annen utfordring er risikoen for forutinntatthet i dataene. Datasett kan utilsiktet gjenspeile forutinntatte holdninger til stede i datainnsamlingen, som sosiale, kulturelle eller historiske fordommer. Det er derfor nødvendig å være oppmerksom på og redusere forutinntattheter for å unngå diskriminering i AI-systemer.
Dessuten er det viktig å sikre variasjon i datasettene. Datasett bør inneholde et bredt spekter av prøver som representerer hele spekteret av det problemområdet man ønsker å trene modellene på. Mangelen på variasjon kan begrense AI-modellenes evne til å generalisere og resultere i skjeve eller begrensede prediksjoner.
Størrelse på datasettene har også betydning for ytelsen til AI-modeller. Utilstrekkelige data kan føre til at modellene har problemer med å generalisere godt etter at den er trent opp. Datasett utgjør treningsgrunnlaget for AI, og gir mulighet for maskinlæringsmodeller å lære, tilpasse seg og ta informerte beslutninger.
Det som får noe til å skje – algoritmer
Algoritme er også et sentralt begrep når man skal forstå kunstig intelligens. I vår digitale tidsalder er algoritmer en integrert del av vår hverdag, selv om mange av oss kanskje ikke er bevisst på det. Fra anbefalingssystemer på sosiale medieplattformer til søkemotorer og datamaskinprogrammer, er algoritmer avgjørende for å lage løse ulike oppgaver. Et dataprogram som Word er en algoritme som er strengt definerte rammer hvor de som har utviklet programmet har bestemt hva programmet skal gjøre. En algoritme som skal lære nye ting er programmert med løsere rammer.
Hva er en algoritme?
En algoritme kan beskrives som en rekke med instruksjoner eller regler som en datamaskin følger for å løse et problem eller utføre en bestemt oppgave. Du kan tenke på det som en kakeoppskrift som beskriver trinnene som må følges for å oppnå et ønsket resultat (kake). Algoritmer kan være enkle eller komplekse, avhengig av oppgaven de er designet for å løse.
Det høres kanskje abstrakt og fjernt ut, men du som menneske utfører algoritmer hver eneste dag. La oss se på et eksempel for å bedre forstå hvordan algoritmer fungerer. Tenk deg at du skal lage en algoritme for å brygge en kopp kaffe. Instruksjonene kan se slik ut:
- Fyll vannkokeren med vann.
- Plasser kaffen i filteret.
- Hell det varme vannet over kaffen.
- Vent til kaffen drypper ned i kannen.
- Server og nyt!
I dette enkle eksemplet er instruksjonene såkalt lineære og følger en bestemt rekkefølge. Det ville også vært vanskelig å begynne med å servere kaffen før den er laget. Algoritmer kan imidlertid være mye mer komplekse, med ulike betingelser, gjentakelser (løkker) og beslutninger avhengig av ulike situasjoner.
Så hva har algoritmer med kunstig intelligens å gjøre?
Kunstig intelligens (AI) er et felt som stadig utvikler seg og forandre måten vi samhandler med teknologi. Sentralt i AI-løsninger ligger algoritmene, som utgjør hjernen til intelligente systemer. De gir instruksjoner til datamaskiner og maskinlæringsmodeller om hvordan de skal analysere datasettene de er trent på, og trekke konklusjoner. Algoritmene identifiserer mønstre, foretar prediksjoner, tar beslutninger og løser problemer.
Oppsummering
Datasett og algoritmer jobber sammen for å trene og forbedre AI-modeller. Datasettet er samlingen av data som brukes til å lære modellen, mens algoritmen er den matematiske prosessen som analyserer dataene og tilpasser modellen for å generere ønskede resultater.
Først må man samle inn relevante data som representerer problemet eller oppgaven som skal løses. Dette datasettet kan bestå av tekst, bilder, lyd, tall eller andre typer data. Datasettet må også forberedes ved å rengjøre det for feil, manglende data og støy som kan påvirke modellens ytelse negativt.
Når datasettet er klart, brukes det til å trene modellen ved hjelp av en spesifikk algoritme. Algoritmen analyserer og generaliserer dataene for å identifisere mønstre og sammenhenger. Modellen justerer seg selv for å øke nøyaktigheten. Under treningen bruker algoritmen ofte en del av datasettet som opplæringsdata, og en annen del som kontrollerer opplæringen for å vurdere hvor god modellen er.
Etter treningen må modellen evalueres ved å bruke et testsett som den aldri har sett før. Dette er en viktig del av prosessen for å vurdere modellens evner, og dens evne til å håndtere nye, ukjente data. Algoritmen analyserer modellens resultater og ytelse basert på mål som er satt på forhånd. En bra algoritme justerer seg selv for å bli bedre. Hvis modellen ikke gir tilfredsstillende resultater, kan man gå tilbake og justere datasettet eller eksperimentere med forskjellige algoritmer. Det kan også være nødvendig å samle inn et bedre datasett.
Ved å samarbeide på denne måten hjelper datasett og algoritmer hverandre med å forbedre modellens evner til å generalisere og takle nye situasjoner.
Oppgaver
Oppgave 1
Lag ordbank ut fra teksten
Begrep | Forklaring |
Algoritme | |
Datasett | |
AI-modell | |
Generere | |
Maskinlæring | |
Oppgave 2
1.11
A) Forklar med et eksempel hva en algoritme er
B) Forklar med egne ord hva et datasett er
C) Hvordan kan et datasett være dårlig?
D) Forklar hvordan algoritmer trenger datasett
Oppgave 3
1.12 Har du noen spørsmål til teksten?
1.13 Begreper for videre utforsking
Lineær regresjon, beslutningstrær, støttevektor, klyngemetoder, nevrale nettverk, generalisere