torsdag 23. oktober 2008

Tvungen selverkjennelse


(fra xkcd.com)

Youtube-kommentarer er berykta på internettet for å være selve bunnslammet; det man finner der er egnet til å få det mest positive menneskesyn til å forvitre og svinne hen til fordel for et kynisk syn på menneskeheten. Både form og innhold er ofte så absurd at det ikke med sin beste vilje er mulig å tolke de kommunikative intensjonene til avsenderen (hvis det er noen der i det hele tatt).

haha no offense to black ppl but heres a halloween joke ok a baby was given wings by god so the baby asked god "does this mean im an angel?" and god laughed & said "nah niggah youre a bat happy halloween"

Subscire then

sheesh ur so fat and curly-haired u lesbian freak

do they cut them selfs no MCR IS NOT EMO!!!!!!!

Xkcd har kommentert dette tidligere:



Men siden life imitates art, som man sier, har youtube nå lansert en audio preview-funksjon, slik at man kan velge å høre en elektronisk stemme lese opp det man har skrevet før man eventuent publiserer det. Så er jo spørsmålet om de som ikke har noe intelligent å si, kommer til å bruke denne funksjonen eller ikke... En slik funksjon hadde forøvrig vært nyttig på norske nettavisers kommentarfunksjon.

tirsdag 21. oktober 2008

Microsoft tar patent på sensur

Ifølge denne artikkelen har Microsoft registrert patent på en teknologi som skal kunne gjenkjenne og sensurere banning i tale. Filteret skal kunne brukes for eksempel hos kundesentre som man ringer til, slik at hvis kunder banner og sverter til de ansatte, blir dette automatisk sensurert (eller omvendt, hvis en ansatt banner til en kunde), enten ved å bli gjort uhørlig eller uforståelig. Onlinespill som har chattefunksjoner der man snakker med hverandre istedenfor å skrive vil også være et mulig bruksområde for programvaren.

Talegjennkjenningsprogramvarene jeg har vært borti har ikke fungert så veldig bra. Folk snakker forskjellig, har ulike dialekter, snakker utydelig og så videre. Som regel har systemene en begrenset mengde ord og uttrykk til rådighet som de gjenkjenner. Å skulle plukke ut ord og fraser fra en kontinuerlig talestrøm er veldig vanskelig for en maskin.

I dette innlegget skrev jeg om the clbuttic mistake, et fenomen der sensureringsfiltre bytter ut ikke bare de stygge ordene, men alle bokstavsekvensene som matcher det stygge ordet, sånn at assassinate blir buttbuttinate og constitution blir consbreastution. Det største problemet for et tale-ordfilter blir nettopp dette, fordi tale ikke har tydelige mellomrom mellom ordene sånn som skrift har. Hva gjør filteret når det hører ord som assumption? Eller shiitake (en sopp)? Eller noen har en litt avvikende uttale av continue?

torsdag 16. oktober 2008

Pass opp for rullestol-ryttere

Når vi kommuniserer, bruker vi ofte språk. Men ikke alltid. Noen ganger bruker vi bilder, eller visuelle symboler. Som regel går dette greit, men noen ganger må man spørre seg: Hæ?

onsdag 15. oktober 2008

Stupe opp og stupe ned



Fra Aftenpostens nettutgave 14. oktober. Børsen stupte...ned? I motsetning til de gangene børsen stuper opp?

søndag 12. oktober 2008

Søndags morra morro


(Trykk på bildet for å se en større versjon - fra xkcd.com.)

Selv om Klingon ikke tilhører den finsk-ugriske språkfamilien, er det likevel et interessant språk. Det er et konstruert språk, laget av en lingvist - Marc Okrand, på oppdrag fra Paramount Pictures. Klingonene er en rase med romvesener i tv-serien og filmene om Star Trek, og Okrand skapte bevisst et språk som hadde mange uvanlige trekk, for å understreke at språket ikke er menneskelig. Fonemsystemet inneholder for eksempel uvanlige kombinasjoner av lyder - det har en [v] men ikke en [f], og har ingen velare plosiver (som [k] og [g]). Målet med dette er at språket skal høres fremmed ut.

Også syntaktisk er Klingon designa slik at det skal være så uvanlig som mulig - ordrekkefølgen er OVS, en av de sjeldneste rekkefølgene i menneskelige språk. Her er en video der Mark Okrand forteller om hvordan Klingon ble til. Den er litt lang (21 minutter), men veldig interessant.

fredag 10. oktober 2008

I can see forever, lol


Dette bildet av Chomsky vakte munterhet på forrige språkprat, så jeg poster det her, for the lulz som man sier. For de som ikke visste det, det er to referanser å skjønne her. For det første er bildet (og teksten) en referanse til dette bildet, som er populært på internettet:


For det andre er det en referanse til en artikkel Chomsky skreiv sammen med Mark Hauser og Tecumseh Fitch i 2002 der de legger fram en hypotese om at rekursivitet er den eneste egenskapen som er unik for språk

(For å være presis, det de sier er: "We hypothesize that the faculty of language [in its narrow sense] only includes recursion and is the only uniquely human component of the faculty of language" (Chomsky et al. 2002: 1569).)

Vrangt og vanskelig

De som leser Aftenposten (og sannsynligvis de som ikke leser den) kjenner til Per Egil Hegge, språkspaltist. Den 10. oktober skriver herr Hegge blant annet følgende:

Informasjonsskriv skal helst være både lettfattelige og utvetydige. En pasient ved et av våre større sykehus leste i en brosjyre etter en operasjon for grå stær: «Det er normalt å være lyssky. Du kan bruke solbriller hvis du synes det er ubehagelig ...»

Problemet kan sammenfattes slik: Man skal passe på hva et uskyldig ord som «det» viser tilbake til. Her går det an å lese det slik at det å bruke solbriller er ubehagelig. Man skal sant å si være litt vrang for å lande på det synspunktet, men hvis det er én ting denne spalten ikke mangler, er det vrangvillige lesere.

Det skal ikke stor fantasi, og heller ikke store medisinske kunnskaper, til for å forstå at det er ubehagelig med den lysømfintlighet som kan forekomme etter inngrep i øyet.

Kanskje jeg er en vriompeis, men jeg syns Hegge med vilje leiter etter måter å feiltolke setninga på (noe han selv innrømmer). Så hvorfor i det hele tatt nevne det? Hvem i alle dager får utdelt en brosjyre fra sykehuset der det står «Det er normalt å være lyssky. Du kan bruke solbriller hvis du synes det er ubehagelig ...», og tenker OMG! Jeg kan bruke solbriller hvis jeg synes det er ubehagelig å bruke solbriller!? Dette er en absurd tanke.

Jeg kan ikke en gang se at en sånn tolkning er "semantisk grammatisk", for å bruke en term jeg fant på akkurat nå. La oss se på setninga i isolasjon:

??Du kan bruke solbriller hvis du synes det er ubehagelig

Merkelig setning, som jeg tror de fleste hadde stussa over hvis de hadde støtt på uten kontekst. Hva med denne:

Du kan bruke solbriller hvis du synes det er behagelig

Her er det mye mer sannsynlig at man tolker setninga slik at 'det' viser til 'å bruke 'solbriller'. Jeg tror problemet med Hegges påstand er at selv om det i de fleste tilfeller stemmer at man skal tenke over hva man refererer til med ord som 'det', forsvinner poenget når det er opplagt at setningen i isolasjon ikke gir noen mening - i slike tilfeller tvinges det fram en annen tolkning av 'det'.

torsdag 9. oktober 2008

Språkprat!

Jeg kom nettopp hjem fra det mest eksellente arrangementet i historien: språkprat - temakvelder om språk som arrangeres av språkstudenter ved universitetet i Oslo (hovedsaklig lingvistikkstudenter). Vi skal prøve å få til månedlige møter, der en eller flere frivillige holder innlegg om hva de måtte ønske som har (løselig) med språk å gjøre.

Denne gangen var det Jenny Graver som holdt innlegg, om sitt doktorgradsprosjekt om den syntaktiske utviklingen fra passiv til upersonlig i irsk. Det var vanskelig, men spennende!

I tillegg fortalte jeg litt om denne bloggen, og prøvde å rekruttere folk til å skrive her. Jeg har sendt ut e-post-invitasjoner til de jeg har adressene til (så sjekk e-posten deres!), men hvis noen fler vil ha mulighet til å poste, så send meg en mail på elipanne (at) gmail.com, så legger jeg dere til som bidragsytere!

100,000,000 ord for snø, men ingen ord for "lettlurt"

Ifølge denne bloggen vet alle at samene har 60 ord for snø. Jeg må innrømme at jeg ikke visste det, men så kan jeg heller ikke noe særlig samisk. Jeg kan imidlertid nok om språk (og om folks behov for å si dype og innsiktsfulle ting om språk) til at alarmklokkene umiddelbart begynner å kime når jeg leser påstander som dette.

En myte som har blitt så etablert i kulturen at den nærmest er en opplest og vedtatt sannhet, omhandler en annen folkegruppes utallige ord for snø, nemlig eskimoene. Jeg tør vedde på at man kan slenge ut et hvilket som helst antall ord for snø, og de fleste vil nikke klokt og si ja og ha. KFUK/KFUM-speidernes nettside slår blant annet fast at "Eskimoene har over hundre ord for snø (men ingen ord for krig)."

Problemet er at det ikke stemmer. Laura Martin, en antropolog ved Cleveland State University, publiserte en artikkel i American Anthropologist i 1986 (Nr. 88, 418-423), der hun avkrefter myten og forklarer hvordan den har oppstått. Geoffrey K. Pullum oppsummerer i sin bok the great eskimo vocabulary hoax:

The tale she tells is an embarrassing saga of scholary sloppiness and popular eagerness to embrace exotic facts about other people's languages without seeing the evidence. The fact is that the myth of the multiple words for snow is based on almost nothing at all. [...] People cannot be persuaded to shut up about it either. (Pullum 1991: 162/165)

Pullums essay kan leses her, og han oppsummerer mytens reise fra Franz Boas' handbook of north American indians (året er 1911, antallet ord for snø: 4) via Benjamin Lee Whorfs artikkel "Science and linguistics" (året er 1940, antall ord for snø: 7), og videre og videre, til hele 50 i Lanford Wilsons "the fifth of july" (1978) og ikke færre enn 100 i en artikkel i New York Times i 1984. Men som Rolf Theil skriver:

Grønlandsk [har] berre to ord for snø - quanik 'snø som fell' og aput 'snø som ligg på jorda' (Theil 2007: 211).

Myten om alle ordene for snø har muligens oppstått fordi eskimospråkene er såkalt polysyntetiske, det vil si at hvert ord som oftest består av mange morfemer. De har et stort antall bøyingsaffikser, og kan ofte uttrykke det som tilsvarer en hel setning på norsk ved hjelp av ett ord. Å telle "ord" for noe som helst på slike språk sier derfor like lite som å telle setninger på norsk.

Ok, så eskimoenes ord for snø er en myte. Hva så? Med det mener jeg, hvis det hadde vært sant, og eskimoene hadde hatt en milliard trilliard ord for snø, hva så? Hadde det vært så veldig interessant? Folk som holder på med hester har mange ord for alle de små bøylene og stroppene på salen, ord for mannehester, damehester, kastrerte mannehester, hester med forskjellig mønster på pelsen, ord for gangartene til hesten og så videre og så videre. Ord jeg ikke kan. Whoop-dee-doo. Folk som er interesserte i bondage har sannsynligvis masse ord for alle de små lærpiskene og duppedittene sine, uten at det er særlig oppsiktsvekkende.

Dette er kjernen i myten om eskimoene og snøen deres. Man tror at man deler en fundamental innsikt om folks natur gjennom denne påstanden. Folk har mange ord for ting som er viktige for dem, derfor har eskimoene (og samene, ifølge linken på begynnelsen av denne posten) mange ord for snø, tyskerne har mange ord for byråkrati, latinamerikanerne har mange ord for...å danse salsa? Uantett hva en kultur er kjent for, så har de i folks generelle oppfatning mange ord for dette fenomenet. Det har blitt en klisjé; noe man sier for å påpeke egenskaper ved en gruppe heller enn å si noe genuint om de språklige kjennetegnene deres. Faktisk er det uttrykk som dette som er opphavet til uttrykket snowclones, via uttrykk som følgende (hentet fra Language Log):

If Eskimos have dozens of words for snow, Germans have as many for bureaucracy. [The Economist, October 11th, 2003, p. 56, col. 2]

Slike uttrykk gjenspeiler en tankegang om at språket og tanken er tett sammenvevd og at hvordan folk snakker sier noe om hvordan de tenker, eller til og med styrer hvordan de tenker eller ser verden (i sin sterkeste form er denne hypotesen kjent som Sapir-Whorf-hypotesen). En slik påstand er problematisk, i hvert fall i sin sterkeste form. Det har ikke blitt påvist noen særlig effekt av en slik type. Jeg sier ikke at det ikke finnes noen slik effekt, men det er en sterk tendens til å bare anta at den er der, og å anta det på en svada-aktig og banal, og ofte veldig romantiserende måte, særlig overfor folk som sees på som "naturfolk", som eskimoer og samer.

Samisk har innpå 60 ord for "snø" alt etter hvilken tilstand den befinner seg i. For mennesker ute i naturen er det en kode til forståelse i ethvert slikt ord [...]. Rikdommen på naturord kan også brukes i overført betydning til å gjelde forhold mellom mennesker, mellom mennesker og dyr, mennesker og samfunn osv. [...] Gjennom språket transformeres således informasjoner av livgivende betydning for samene. (http://alligatorill.blogspot.com/2005/10/vet-du-at-det-finnes-60-ord-for-sn-p.html, mine uthevinger)
Vet dere hva annet som transformeres gjennom språket? Ren og skjær svada av livgivende betydning for bloggere. Ugh.

onsdag 8. oktober 2008

Suspekt dokke?

Hva i all verden er det denne dokka sier?



Dette høres ut som et tilfelle av auditiv pareidolia for min del. Jeg har hørt på klippet mange ganger, og kan ikke si meg enig i at det er opplagt at den sier "islam is the light". Siden jeg leste før jeg så klippet at det var det dokka sa, hører jeg at det kan tolkes slik, men jeg er usikker på at jeg ville hørt det hvis jeg ikke hadde blitt påvirka på forhånd. Men som for alle slike fenomener, når man først har hørt eller sett det en gang, klarer man ikke å la være å høre det. Som i Dido-sangen "thank you", der jeg veit at hun synger "morning rain drops on my window", men jeg likevel hører det jeg hørte første gang jeg hørte sangen, nemlig "I wanna make love to my window".

Legg også merke til reporterens kommentar - "this doll is spouting more hate than love". Hvis dokka sier "islam is the light" (noe jeg mener er tvilsomt) - er det virkelig hatefullt? Virkelig? Kanskje i overkant ømfintlig, men ok.

All your morpheme are belong to us



Frasen på skiltet er en snowclone, en konstruksjon som minner om et idiom, men der ett eller flere (eller alle) av ordene kan byttes ut med det man kunne ønske. I dette tilfellet er det uttrykket all your base are belong to us som har blitt en snowclone. Denne bisarre setningen stammer fra det japanske sega-spillet Zero Wing, og spredte seg på internett via Something Awful-forumene. Frasen er dermed et eksempel både på såkalt Engrish (ikke-standard varianter av engelsk, ofte fra asiatiske land) og på et internet meme; en betegnelse på en frase, et bilde eller lignende som sprer seg via internett.

søndag 5. oktober 2008

Auditiv pareidolia og Boten Anna

Mennesker er esperter i å finne mønstre. Vi ser jomfru Maria i kaffeflekker, oppfatter mønstre i lottotall, og oppfatter ord i ren støy. Pareidolia er en term som betegner dette fenomenet, som kan være visuelt så vel som auditivt. Visuell pareidolia ser vi blant annet i "fjeset på Mars", det berømte bildet tatt av romsonden Viking 1 i 1976.



En særlig underholdende form for auditiv pareidolia kjenner vi blant annet fra åpen post, der sanger på diverse språk fikk norske tekster:



Når man ikke kjenner språket det blir sunget på, er det veldig lett å reanalysere det man hører og presse det inn i det norske lydsystemet. Men hva skjer hvis man kjenner både originalspråket og språket i undertekstene? Jeg fant en engelsk-tekstet versjon av landeplagen Boten Anna på youtube:



Konklusjonen er at det er ganske forstyrrende, som en auditiv versjon av en Necker-kube - se på undertekstene og du hører engelsk, lukk øynene og du hører svensk.

fredag 3. oktober 2008

Fly for kun n krone!


Er dette et eksempel på sms-språk (lol), eller er det et avansert tilbud som er rettet spesielt mot matematikere? Hvem vet?

torsdag 2. oktober 2008

Ondlings

Ei venninne av meg har lenge vært forkjemper for å fylle et leksikalsk hull i norsk: det motsatte av yndlings. Yndlingsfargen din er den fineste fargen du veit, yndlingsboka er den beste boka, men vi har ikke noe tilsvarende uttrykk for det motsatte - og det er her ondlings kommer inn: som en betegnelse på det verste man vet innen en kategori. Forøvrig må vi vel nesten kalle ondlings og yndlings for prefikser og ikke ord, siden de ikke kan stå aleine, men må feste seg på andre ord. Uansett, ondlings er mitt yndlingsprefiks. Jeg vil anbefale alle å bruke det.