Jump to content

Driftsrapport/V2025

From Programvareverkstedet

Ting drift potensielt kanskje har gjort siden forrige halvårsmøte

  • 2-3 nye driftsmedlemmer
  • Vi har tatt i bruk de tre maskinene fra Omega Verksted; Bubbles, Blossom og Buttercup
    • Hver av maskinene er Dell R730, med omtrent 40 kjerner, 90GB RAM og 2 GPU-er av Nvidia GRID K2, Nvidia GTX Titan X og Nvidia Tesla M10, altså ikke toppmoderne, men betydelig raskere enn det vi har fra før
    • De er konfigurert i et PVE virtualiseringscluster, så vi kan kjøre VM-er og ha redundans.
      • Inntil videre oppfører de seg relativt standalone, da vi ikke har felles lagring for å migrere VM-er mellom tjenere
    • Vi har hatt behov for sprekere og mer moderne maskinvare, og det ble antydet fra Omega Verksted at dette bør gjøre at vi pensjonerer de eldste og minst effektive maskinene etter hvert
  • Ny Matrix-Discord-bridge, OOYE tar over for mx-puppet-discord
  • Ludvigsen har tatt over kroppen til eirin
  • Knutsen og Ludvigsen er oppgradert til nye FreeBSD-versjoner
  • Kommode har tatt over git-hosting fra Bekkalokk
    • Det gjør at vi tåler AI-scraping mye bedre enn i fjor
    • Kommode er den første ekte prodtjenesten på det nye powerpuffclusteret
    • Den har hatt noen innkjøringsproblemer og lider av at vi har for lite disk
  • Lupine-{1,2,3,4,5} er satt opp som Gitea CI/CD-runners
    • Dette lar både drift og alle andre medlemmer automatisere, teste og bygge prosjektene sine rett i Gitea
  • Ildkule har fått noen nye overvåkningsmål (både tjenere som lupine-\*, og tjenester som exim)
  • Ny backupserver; Principal er gjenfødt, i kroppen etter Venture
    • En del sentrale tjenere blir backet opp automatisk med rsync, og daglig rapport blir sendt på e-post
    • Ikke alle tjenester og tjenere er inkludert enda, de fleste NixOS-boksene mangler
  • Vi har installert nye salt-pakker på flere bokser, som gjør at Debian-servere igjen får automatiske oppdateringer, passwd-fil som inkluderer nye brukere, og ellers holder seg synkroniserte
    • Det innebærer et flytte til broadcom-pakker i broadcom-repoet, som vi i utgangspunktet har vært skeptiske til, men det ser ut til å fungere fint inntil videre
  • NixOS-maskinene er oppgradert til NixOS 25.05
  • Vi har hatt strømbrudd, både på brus og i gruvedrift
    • Begge krevde manuell håndspåleggelse, men alt kom opp rimelig fort
  • Vi har filtrert et avdød medlems hjemmemappe for å sende det til de som har skifteattesten.
    • Vi vil ha en policy om å kanskje ikke gjøre det i fremtiden
  • Annen planlegging og spekulering
    • Vi har sett på å gjenopplive dvask, med ny software, og enten et annet sted eller med andre vifter
    • Diskusjonene om ny lagringsboks og tilhørende harddisker fortsetter. Vi trenger sårt ny VM-lagring og backup
    • Vi er ikke flyttet av NTNU StackIT-regionen som skal legges ned enda, så ildkule & co. må fortsatt migreres. Ukjent tidsfrist.

Kilde: https://md.dodsorf.as/nOp_wDaoSIGd9TNWHqT1Sw