tirsdag 30. september 2008

mandag 29. september 2008

Vi vil ha luff!

Etter at jeg diskuterte hyperkorrigering i dette innlegget, minnet moren min meg på en morsom episode fra da lillebroren min var liten.

Siden han er vokst opp på østlandet, har broren min østlandsdialekt, i motsetning til meg og mamma som snakker slik de gjør i Kvinesdal. Han var dermed vant med at der jeg og mamma sa o (som i ost, IPA [u]), sa han ofte u (som i hus, IPA [ʉ]) - han sa "buss", vi sa "boss", han sa "luft", vi sa "loft". Så hvis han hørte mamma eller meg si et ord med o (IPA [u]), fungerte det i de fleste tilfeller greit å bytte den ut med en u (IPA [ʉ]) for ham.

Helt til den dagen han overappliserte regelen og spurte om han kunne få ei skive med "luff".

lørdag 27. september 2008

lol+pusekatt+semantikk=caturday

Hvem elsker vel ikke lolcats? Ingen, det er hvem. Selv om noen hevder at de er avleggs, og bare sååå 2006, synes jeg de fremdeles er morsomme. Og når de har lingvistiske begreper i seg kan det vel ikke bli bedre? Nei. Det kan det ikke. Så behold: Semantics cat!

lørdag 20. september 2008

Få deg litt morson og ta deg en god durs

Internett er en vidunderlig ting, fordi det gir oss tilgang til språkdata som vi ellers ikke ville sett, eller som ville tatt mye lenger tid å samle inn. Ta en kikk på disse setningene, som jeg i et anfall av akutt nysgjerrighet har spadd fram:

  • der bodde vi på 4 manns rom med felles durs og toalett
  • 2 stk leiligheter med durs wc soverom stue kjøkken 4 sengeplasser.
  • mange huskyer som kommer på dyrehjem fordi eieren ikke klarer og gi den nokk morson
  • Det ble dagens morson. Kjenner det var uvante muskler for jeg er litt støl i ryggen :)
  • Farget de for hånd med turs og gelepenn(sort og,hvit)
  • kan dere ikke heller ta en turs og tegne en fin bart isteded mens han sover
  • Bærs og tiss er ikke morsomt
  • Hva kan du og bærsj og tiss? Spørsmål 1/5. Kan man vaske doen med bærsj. JA !! NEII !!!
  • Kjæresten min har røyka noen ganger, hars eller et eller annet dop saker. ..
  • windows sier marskin er infisert av virus men ingen av virus kontrollene finner det

Durs, morson, bærs(j), hars og marskin -- hva skal dette bety? Første gang jeg observerte dette fenomenet, gikk jeg på barneskolen, og jeg husker at jeg syns jeg det var veldig merkelig at mine klassekamerater insisterte på å skrive bærs eller bærsj framfor den (for meg) mer logiske skrivemåten bæsj. Først mange år senere skjønte jeg hva som er grunnen til at noen legger inn en (for meg) overflødig <r> i ord som dette.

Det mine klassekamerater hadde til felles, og som gjorde at de fant skrivemåten naturlig mens jeg ikke gjorde det, var dialekten. Jeg er fra sørvestlandet, men flytta tidlig til østlandet og gikk på skole der. I østnorsk uttales fonemsekvensen [ɾ]* + [s] som [ʃ], en postalveolar frikativ, den samme lyden som i sky, sjukehus og dusj. På østnorsk uttales altså ordet <kurs> som [kʉ:ʃ], mens det på min dialekt uttales [kʉ:ɣs] (for de som ikke er IPA-savvy, østnorsk <kurs> har bare 3 ulike lyder i , k-u-sj, mens jeg har 4, k-u-r-s).

Østlendinger står derfor overfor en komplikasjon når de vil skrive ord som inneholder fonemet [ʃ]: de kan ikke vite (med mindre de har lært seg hvordan ordet skrives), om det skal inneholde en
<rs>-sekvens eller en <sj>-sekvens. Den logiske konsekvensen ville vært at de skriver ordene i samsvar med sin egen uttale; <vers> som <væsj>, <kurs> som <kusj> og så videre. Men det er ikke dette som skjer; det er faktisk det motsatte -- ord som ikke har noen r i noen norsk dialekt får denne satt inn, slik at resultatet blir durs, morson, marskin etc.

Hva skyldes dette? Fenomenet kalles hyperkorrigering, og oppstår når talere "retter" på noe som i utgangspunktet er riktig, fordi de er usikre på reglene og gjerne vil være "korrekte". I tilfeller som dette er talerne usikre på stavemåten, men de vet at ord de selv uttaler med [
ʃ] ofte skrives med <r>. Derfor setter de inn en <r> for å være på den sikre sida. Eksemplene over har mange trekk som tyder på at de er skrevet av folk som ikke er stø i rettskriving generelt (men tydeligvis stø nok til at de faktisk har lagt merke til fenomenet med den ustyrlige r-en og derfor stapper den inn der de håper den hører hjemme).

Jeg trekker tre konklusjoner fra dette: 1) Som voksen og klok har jeg endelig fått svar på noe jeg lurte veldig på da jeg var liten, 2) folk utviser kompleks og fascinerende språklig adferd, og 3) Frøken Detektiv og mysteriet med den ustyrlige r-en høres ut som ei fantastisk bok.


*IPA-tegnet for den østlandske uttalen av
<r>

fredag 19. september 2008

Kerning og fnising

Selv om typografi ikke direkte har noe med lingvistikk å gjøre, var denne morsom nok til at jeg ikke klarte å la være:


For de som ikke ser det (jeg skjønte det heller ikke med en gang), det skal stå FINAL REGISTRATION. Det er egentlig ikke fonten i seg selv som skaper den uheldige effekten, men det at bokstavene står for tett sammen. Kerning kalles det når man øker avstanden mellom to tegn for å unngå en slik effekt, og F-en og I-en her burde absolutt ha vært kernet.

Adgang forbudt for adjektiver!

Det finnes mange ordklasser, hver til sitt bruk. Forskjellige, men alle nyttige og nødvendige. Hvem hadde ant at i noen deler av verden praktiseres ordklasse-apartheid?


Det er på tide at noen tar dette opp med det internasjonale samfunnet, slik at vi kan iverksette økonomiske sanksjoner mot de som diskriminerer ord på grunnlag av klasse.

tirsdag 16. september 2008

Flere generøse peniser

I et tidligere innlegg skrev jeg om en penis som liker å spandere øl på folk. Det viser seg at fenomenet er mer utbredt enn jeg hadde trodd, noe jeg oppdaget ved å lese Elyse Sewell sin Livejournal. Der fant jeg et bilde tatt i Hong Kong:




Teksten på T-skjorta er "My dick would like to buy you a drink". På engelsk høres ikke dette like syntaktisk pussig ut som den norske "min penis vil spandere deg en drink", fordi verbet buy, ulikt det norske spandere, ofte brukes ditransitivt. Hvor smakfullt det er, kan jo i og for seg fremdeles diskuteres.

mandag 15. september 2008

En Sisyfosansk oppgave

Jeg har alltid likt Animaniacs, og kom over dette klippet på youtube forleden dag:



Morsomt, men jeg klarer ikke la være å være en kjip festbæsjer. Tittelen på klippet er "All the words in the English language". En bedre tittel ville vært "all the words in an English dictionary". Hvorfor det? Rett og slett fordi ingen ordbok inneholder absolutt alle ordene i et språk. Det fins ordbøker med større og mindre utvalg, men å inkludere ALLE ord er en håpløst ambisiøs oppgave. Hvis en slik ordbok hadde eksistert, ville den vært uhorvelig diger. Kanskje ikke uendelig stor, men såpass at den absolutt ikke ville latt seg trykke i noe bokformat vi kjenner.

Hva skyldes dette? Med ett ord: produktivitet. Da snakker jeg ikke om den typen produktivitet man vanligvis mangler i dagene før man skal levere en oppgave, når FreeCell og minesveiper framstår som forlokkende og meningsfulle aktiviteter. Nei, jeg snakker om lingvistisk produktivitet, den egenskapen ved språk som gir oss muligheten til å si ting som ikke har blitt sagt før (noen vil hevde at dette er en ganske viktig egenskap, andre ser ikke ut til å benytte seg av den særlig mye). Poenget er i alle fall at ordene i et språk ikke er en fast mengde: vi er i stand til å benytte oss av mønstre for å lage nye ord etter hvert som vi får behov for dem, ved hjelp av forskjellige teknikker. En slik teknikk er affigering, der man setter et prefiks eller et suffiks på et ord. Ta et ord som snill. Et pent og pyntelig adjektiv. Legg til suffikset -het, og vi ender opp med substantivet snillhet. Gjenta med alle adjektiv du kan komme på, og vips har du dobbelt så mange ord som du hadde til å begynne med. Suffikset -het er relativt produktivt, det vil si at vi kan feste det på mange ord. Andre suffikser er mindre produktive, som -ne, som lager verb av visse adjektiver:

gul --> gulne
svart --> svartne
blå --> blåne

men ikke:

lilla --> *lillane
brun --> *brunne
(asterisken betyr at et ord ikke er mulig, det er ugrammatisk)

I tillegg til affigering som en kilde til nye ord, har mange språk muligheten til å lage sammensetninger, der to eller flere selvstendige ord settes sammen til ett. I norsk er denne prosessen ekstremt produktiv. For å bevise dette har jeg gått inn på vg.no og notert alle sammensetningene jeg ikke har hørt før:

pornoprins
nettpornoprins
forsvarsrot
spillmonster
uroby
flyporno
hockeystart
blåtungesmitte
gassbilregler
smugrøykeslåsskamp

Hører disse ordene hjemme i ei ordbok? Umiddelbart vil jeg si nei. Ordene er fullt ut forståelige på grunnlag av de enkelte ordene de er bygd opp av (og der man er usikker vil man ha konteksten til å hjelpe seg). Kun hvis et ord blir etablert, det vil si at det blir brukt av flere, over en viss tid, vil det kunne bli oppført i ordboka. Og ord som ikke brukes, vil forsvinne.

fredag 5. september 2008

Nesten, men ikke helt

Oversettelse er som tidligere nevnt vanskelig. Ikke bare skal man velge et ord som er leksikalsk riktig, men man bør også overveie å bruke et ord i samme register som man forsøker å oversette fra.

Det er ikke ræger alt som lukter

I et tidligere innlegg var jeg inne på snowclones, eller fru Blom-uttrykk som vi kan kalle dem på norsk -- faste uttrykk der ett eller flere av ordene kan fylles ut med det som måtte behage taleren. Ofte kommer disse uttrykkene fra forskjellige former for populærkultur, selv om selve uttrykket kan overleve lenge etter at opphavet har sunket ned i glemselen. Fru Blom-uttrykket er selv et ypperlig eksempel på dette; det lever i beste velgående selv om lystspillet det opprinnelig kom fra er ukjent for de aller fleste.

Et uttrykk som (i alle fall for meg) fremdeles er lett å koble til sitt opphav, kommer fra Ringenes herre, og lød opprinnelig det er ikke gull alt som glimrer. Et google-søk gir oss følgende gullkorn:

  • Det er ikke fluer alt som flyr
  • det er ikke Google alt som glimrer.
  • det er ikke hyperaktivt alt som beveger seg
  • Det er ikke fett alt som glinser
  • Det er dessverre ikke lydløst alt som lukter.
  • det er ikke ost alt som smelter.
  • Det er ikke ræger alt som lukter

Sist men ikke minst:

  • Det er ikke rompehull alt som promper

Den foreløbig hypotetiske norske snowclones-databasen kommer i alle fall ikke til å mangle grove eksempler, takk og pris.

onsdag 3. september 2008

You should never buttume anything!

Geoffrey Pullum posta på Language Log i går om det som refereres til som clbuttic idiocy. Hva slags idioti er det snakk om? La meg presentere noen setninger jeg har funnet på internettet:

  • Congratulations on your self-fulfilling buttumption.
  • Let me first explore its buttumption, and then consider its factual claims.
  • Please pardon this post if it came out sounding sbutty.
  • She was too clbutty for that sh*t and never belonged.
  • YOU made the buttertion thus the burden of proof is on YOU.
  • Good news for the Consbreastution on Australia Day.

Hva er det som foregår her? Den oppvakte leser har allerede skjønt det: overivrige leksikalske filtre, også kalt nanny-bots, har vært på ferde. Mange nettsider sensurerer automatisk ord som av ulike grunner oppfattes som grove, blant dem ass og tit, og bytter dem ut med mer "familievennlige" ord, i disse tilfellene butt og breast. Problemet oppstår når slike filtre ikke bare bytter ut tekststrenger som har mellomrom før og etter seg, men strenger med de aktuelle bokstavene som er del av andre, helt uskyldige ord.

Det fins mange eksempler på nettet, som man kan finne ved å ta et ord som inneholder en av de aktuelle tekststrengene, bytte den ut med sin mindre grove motpart, og bruke google. En god del av treffene er omtale av slike fenomener, ikke bruk av selve ordene, men også selve bruken av ordene er lett å finne fram til. En av mine favoritter er buttbuttinate (og den beslektede buttbuttination), som vi ser under. En klbuttiker!

  • [D]o the acts of the human plants validate buttbuttination and torture?
  • [W]hy did the Iraq regime try to buttbuttinate George Bush?
Les mer om the clbuttic mistake her.

tirsdag 2. september 2008

Destroyed in the translation

Jeg kom over ei stilig nettside i dag (som jeg forøvrig la til i listen av linker på høyre side av bloggen). Lost in translation består av et program som lar deg taste inn ord, fraser og setninger, som den så oversetter til fem forskjellige språk, og tilbake til engelsk igjen, med en tur innom engelsk mellom hvert av de fem språkene. Frasen lost in translation ender for eksempel opp som destroyed in the translation. Prosessen er som følger:

English: Lost in translation

French: Détruit dans la traduction

English: Destroyed in the translation

German: Zerstört in der Übersetzung

English: Destroyed in the translation

Italian: Distrutto nella traduzione

English: Destroyed in the translation

Portuguese: Destruído na tradução

English: Destroyed in the translation

Spanish: Destruido en la traducción

English: Destroyed in the translation

Det er det første steget, fra engelsk til fransk, som er ansvarlig for forskjellen mellom den opprinnelige og den "ødelagte" frasen. Når frasen oversettes til fransk, kommer det inn en bestemt artikkel "la", som ikke er idiomatisk i engelsk. Valget av verbet détruit, som kan oversettes tilbake til engelsk "destroyed", er den andre tingen som gjør frasen uidiomatisk når den oversettes til engelsk igjen.

Språkene programmet sender frasene og setningene gjennom, er veldig like hverandre, noe som kan forklare hvorfor frasen over ikke led en verre skjebne enn den tross alt gjorde. Hva hvis vi i tillegg tvinger en uskyldig frase gjennom virkelig fremmede språk, som kinesisk, japansk og koreansk? Heldigvis for oss er dette en mulighet hos Lost in translation:

English Text:
Lost in translation

Japanese: 変換で失われる

English: It is lost with conversion

Chinese: 它丢失以转换

English: It loses converts

French: Il détruit des convertis

English: It destroys converted

German: Es zerstört umgewandelt

English: It destroys converted

Italian: Distrugge convertito

English: It destroys converted

Portuguese: Destrói convertido

English: It destroys converted

Spanish: Destruye convertido

English: It destroys turned

Her har det skjedd mye mer på veien enn da vi bare oversatte mellom nært beslekta språk - ingen overraskelse. Hvis vi prøver oss på en setning som can I have a cup of coffee?, får vi I can have a coffee cup? Sammensetning istedenfor den vanlige preposisjonsfrasen, og noe underlig ordstilling, men fullt forståelig for den velvillige. Med kinesisk, japansk og koreansk med på veien, blir setninga til I possibly make the examinación of the coffee?

Vi prøver oss til slutt på en litt lengre setning, et sitat fra Albert Einstein:

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former.

Resultatet blir:

Only two citizens of infinites, are the empty person of the external
time from the layer to others are stupid, I were not emergency before
an interested party.