Image
Koenraad de Smedt, Antske Fokkens, Bjørn Høyland, Stephan Oepen, Jarle Ebeling

Disse gleder seg stort over åpningen av LAP. Her inne fra tungregneanlegget Abel. Fra venstre Emanuele Lapponi (UiO), Koenraad de Smedt (UiB), Antske Fokkens (University of Amsterdam) , Bjørn Høyland (UiO), Stephan Oepen (UiO) og Jarle Ebeling (USIT)

Splitter ny portal - nå kan alle bruke avansert språkteknologi

Den ferske språkteknologi-portalen LAP er på lufta. Med den får også de som ikke er IT-eksperter, som forskere innen politikk og humanistiske fag, et kraftfullt teknologisk verktøy i hendene.

Med LAP får forskere og andre som er interessert i å analysere språk tilgang til tungregning rett fra nettleseren. Tidligere har man måttet ta i bruk kommandolinjer og programmering.

Det var en stolt professor Stephan Oepen fra språkteknologigruppa ved Institutt for informatikk som nylig åpnet den nye portalen.

Brukervennlig

– Med LAP har alle som ønsker å analysere store mengder språkdata fått et brukervennlig nettbasert verktøy, sier han.

LAP (Language Analyses Portal)

  • LAP er en webportal som gjør at ikke-teknologer kan kjøre avanserte språkanalyser av enorme mengder tekst gjennom bruk av tungregnekapasitet.
  • LAP er utviklet av språkteknologigruppa  ved Institutt for informatikk (Language Technology Group) og USIT (Universitetets senter for IT) og ble åpnet i september 2016.
  • LAP er også en del av CLARINO-prosjektet (Common Language Resources and Technology Infrastructure in Norway) og det europeiske CLARIN-initiativet.

Sjekk LAP-tjenesten her

Språkteknologi er et forskningsområde i grenselandet mellom informatikk, psykologi og lingvistikk for å kunne forstå og tolke menneskelig språk.

Google Translate er et eksempel på resultatet av språkanalyse.

Hvis man for eksempel tar mål av seg å tolke store mengder av teksten som finnes på world wide web trengs avanserte analytiske verktøy og store superdatamaskiner.

Med LAP får man tilgang til dette uten teknologiske barrier, nemlig beregninger på tungregneanlegget Abel på UiO via nettleseren.

Da portalen nylig ble gjort fritt tilgjengelig for alle fortalte to ikke-teknologiske forskere hvordan den vil være nyttig i deres arbeid. 

språkteknologi

De var invitert som representanter for målgruppene for LAP, nemlig forskningsområdene som gjerne kalles for Computational Social Sciences og Digital Humanities på engelsk.

Tungregning avslører debatter

Professor Bjørn Høyland ved Institutt for statsvitenskap ved UiO påpeker at portalen vil være et veldig nyttig verktøy for å kunne klassifisere politikere og partier basert på analyse av språkføringen deres.

Et eksempel han viste til er konsekvensene av den nye valgreformen i Norge i 1919. Det innebar blant annet at enmannskretsene ble erstattet av valgdistrikter med flere mandater.

Forskerne studerte data fra alle parlamentsdebatter fra 1906 til 1940.

Det viste seg at det ble mer er diskusjon om budsjetter, høyesterett, lønninger i offentlig sektor, gjeld. Debattene ble mer partistyrt enn valgkretsstyrt.

– Men vi trenger mer raffinerte verktøy for å kunne gå i dybden på denne typen slike analyser. Da vil tungregningsverktøy som LAP være til stor nytte, sa Høyland.

Å lese mellom linjene

språkteknologi

En annen som gleder seg til å ta LAP i bruk er språkforsker Antske Fokkens ved Universitetet i Amsterdam.

Hun har spesialisert seg på databasert lingvistikk, og mener at bruk av LAP bidrar til at det blir lettere å lese mellom linjene.

Med språkteknologisk analyse og tungregning kan man finne ut mye om hvordan historikere, sosiologer, forskere, medier og andre omtaler ulike temaer. Man kan få svar på spørsmål som:

  • Omtaler media systematisk annerledes om spesielle etniske grupper?
  • Er det forskjeller på mediene i hvordan de omtaler ulike grupper?
  • Hva er det som gjør at de blir omtalt ulikt?
  • Hva sier det om samfunnet vårt?

Et av prosjektene hun har sett på er hvordan hvite og svarte mistenkte forbrytere omtales. Forskningen viser blant annet at det er flere og sterkere negative omtaler av svarte mistenkte.

Les også på Titan.uio.no:

Vil redde nordiske språk i dataalderen: Skal forskning på storskala språkteknologi overlates til Google og Facebook og de andre IT-gigantene alene?

Lingvistikk, statistikk og franske hatter: Du har kanskje hørt at datamaskiner kun kan gjøre beregninger basert på 0 og 1. Med språkteknologi, kan datamaskiner bruke 0 og 1 til å forstå menneskespråk.

Kontakt:

Professor Stephan Oepen ved Institutt for informatikk