onsdag 31. desember 2008

Gått nyttår!

Te alle lesare a lingvismeblåggen vil æg ønska gått nyttår! Å så vil æg oppfårdra alle bidragsydaran te å påsta et bilde a noe som e lingvistisk i kværdagen dei sin, å te å je enn ortografisk framstilling a dialekta si. Her e mitt bidrag: ett bilde a mæg me lingvistikk-kåppen min:

søndag 28. desember 2008

World scale language faculty?

Ville du studert engelsk ved dette fakultetet? Det er tross alt i verdensklasse, unnskyld, verdensskala...

Hva er lingvistikk og hvorfor er det så stilig?

Noe av det morsomste med lingvistikk som fag, er hvor bredt det er. Det vitenskapelige studiet av menneskelige språk spenner over så mye at jeg tror man kan si at det er den mest "tverrfaglige" vitenskapen. Fra akustisk fonetikk, som har mye til felles med fysikk, via artikulatorisk fonetikk, der man driver forholdsvis mye med anatomi, til sosiolingvistikk, som grenser mot sosiologi, psykolingvistikk som grenser mot psykologi, og så videre og så videre. Man har også en kjerne med de delene som er rent lingvistiske, altså morfologi, syntaks, fonologi og så videre. Her ser man på språket som system, og prøver å beskrive det på best mulig måte. Rundt disse kjernedisiplinene har man som sagt mange overlappende fagfelt som til sammen vel må sies å grense mot de aller fleste andre vitenskaper.

Som lingvist har man dermed muligheten til å velge og vrake blant det man måtte finne mest interessant. Er du naturvitenskaplig eller matematisk anlagt? Da er fonetikk eller datalingvistikk noe for deg! Er medisin og biologi din greie? Da kan vi friste med nevrolingvistikk, klininsk lingvistikk og språkevolusjon. Liker du rare mennesker med skumle tatoveringer og lendeklede? Kombiner lingvistikk og antropologi og dra på feltarbeid for å beskrive et utdødende språk. Liker du historie? Da er kanskje historisk lingvistikk noe for deg. Og så videre og så videre. Kort sagt: lingvistikken har noe for alle! Illustrasjon under (klikk for større versjon).

søndag 21. desember 2008

Det store vokalskiftet og tyrannosaurus rex

Hvem hadde alt at T-rex var vitne til det engelske vokalskiftet?

(Trykk på bildet for å se en stor versjon)

lørdag 13. desember 2008

Å oppholde seg

VG nett melder i dag at "brannvesenet mener at det ikke oppholder seg flere døde i bygningen". Riktignok er det refleksive verbet oppholde seg ifølge ordboka synonymt med å befinne seg, men ord er sjelden helt synonyme. I dette tilfellet er det en liten nyanse som skiller dem: å oppholde seg må man være i live for å kunne gjøre. Jeg vil tro at man må være et menneske også; det skurrer litt å si at "kuene oppholder seg i fjøset".

Når man først har kommet inn i det noe morbide tankesettet der døde mennesker kan henge rundt og oppholde seg, er det også lett å oppdage at VGs overskrift har to tolkningsmuligheter: "Døde på flukt fra flammene". Avisoverskrifter mangler ofte subjekt, og hvis man legger til et underforstått subjekt "mennesker", er setninga grei. Hvis man derimot tolker døde som en substantivisk bruk av adjektivet død, og tar det for å være subjekt, blir saken en annen.

fredag 12. desember 2008

Å sjørøve


Dagbladet på nett har i dag en interessant overskrift, som dere ser på bildet til høyre. Det interessante (språklig sett) er ordet sjørøvet, perfektum partisipp av det som må være verbet å sjørøve. Verbet er en sammensetning av substantivet sjø og verbet røve, og er et eksempel på en sammensetningstype som er ganske spesiell. Eirik Bäcklund kaller den for nomeninnkorporering i sin hovedfagsoppgave "Da sto jeg der og pølsesvettet". Norsk har ganske mange slike sammensetninger, blant annet knivstikke, drapstrue og promilleteste, og Bäcklund argumenterer for at vi har å gjøre med en produktiv orddanningsprosess. Akkurat verbet sjørøve er nok tilbakedanna fra sjørøver, i likhet med støvsuge fra støvsuger, men det finnes også substantiv-verb-sammensetninger som ikke har kommet inn i språket på denne måten. Eirik beskriver hvordan denne typen sammensetninger ofte begynner karrieren sin som partisipper som brukes adjektivisk, som for eksempel brannforsikret, som i et brannforsikret hus. Deretter fylles paradigmet ut med finitte former. I min masteroppgave kaller jeg dette fenomenet for "smutthullsprinsippet" - en verbal sammensetning blir etablert i en form (ofte en infinitt form, altså partisipp eller infinitiv), og smetter deretter inn i de andre formene i paradigmet. Verb-verb-sammensetninger følger ofte et tilsvarende mønster, men de begynner i infinitiv og sprer seg derfra.

Når det gjelder substantiv-verb-sammensetninger, som sjørøve er et eksempel på, har de bestemte relasjoner mellom forleddet og etterleddet, altså substantivet og verbet. I sjørøve sitt tilfelle er relasjonen sted, røvingen foregår på sjøen. Andre sammensetninger med denne relasjonen (fra Eiriks oppgave) er parkeringsplassbulke og rævpule (ja, han har med dette verbet i oppgaven! Dere som ikke har lest den - gjør det!)

onsdag 10. desember 2008

Marina Orlova, kjendisfilolog

Mer enn 131 millioner ganger har videoene til Marina Orlova blitt sett på nettstedet youtube. Kanskje ikke så uvanlig i sin alminnelighet, men ganske uvanlig for en filolog. Orlovas videoer, som har blitt superpopulære, tar for seg opprinnelsen til forskjellige ord, fra hverdagsord som Ok, til mer uvanlige ord som antidisestablishmentarianism, og idiomer som "let the cat out of the bag".

Her er en video der Orlova forklarer opprinnelsen til ordet taxi.

torsdag 4. desember 2008

Myggen, den styggen

En ny kjønnssykdom herjer landet. Mycoplasma genitalium er navnet på bakterien som forårakser uhumskhetene. Den er nært beslekta med klamydiabakterien, gir lignende symptmer, men påvises ikke av de samme testene. Ifølge Dagbladet.no er omtrent 7000 nordmenn smitta av styggedommen.

Hvorfor skriver jeg om dette på en blogg som handler om språk? Fordi sykdommen selvfølgelig må ha et navn. Tidligere har jeg beklagd meg over kommentarene under artiklene i nettaviser, og derfor ble jeg i dag positivt overraska over et gullkorn under Dagbladets artikkel. Under signaturen Mygg kommer dette forslaget:

Hvorfor ikke bare kalle sykdommen Myggen.
Du stikker - det gir kløe.

Mycoplasma genitalium - My. gen. Eller Myggen om du vil. Et eksellent navn på en kjip sykdom.

onsdag 26. november 2008

Kom nærmere...

Det ser ut til at det har blitt et fast innslag her på bloggen å påpeke tilfeller av feilslått kommunikasjon.

Bildet til høyre viser et fantastisk eksempel på et tilfelle der plassering av en plakat, sammen med en tvetydighet mellom en bokstavlig og en metaforisk tolkning, skaper en uforutsett konsekvens.

onsdag 19. november 2008

Ikke-komposisjonalitet gir overskrift utilsiktet betydning

Denne artikkelen fanget oppmerksomheten min da jeg vandret ensom langs internettets store, golde stepper:

Mobsters Give Head to Shopkeeper


A gang described as “idiots” by local police in Northern Italy tried to frighten a shopkeeper into paying protection money by sending him a severed donkey’s head.

The donkey however did not belong to the shopkeeper and did not upset him in the slightest. The wannabes were apparently attempting a copycat extortion racked taken from the popular Hollywood movie The Godfather.

A police spokesperson told reporters ,"But the man didn't know the donkey, he didn't own the donkey, he doesn't care about donkeys. It didn't make sense. It was the work of idiots."


I tillegg til at historien er morsom i seg selv (å kalle disse skurkene for idioter må vel regnes som en grov underdrivelse), setter overskriften en ekstra piff på saken. Det å gi noen et hode er uskyldig nok på norsk, men på engelsk er å "give head" et idiom som ikke er komposisjonelt, det vil si at det har en konvensjonell betydning ut over betydningen til verbet give og substantivet head.

mandag 17. november 2008

Bruker vi oss språk eller språket?

Last språktprat, after Eli Anne and Laila's presentations on constructions, we ended up talking about benefactive constructions of the kind "jeg tar meg en tur" or "jeg spiser meg en brødskive".
Spanish is quite productive in the use of this structure, but some dialects have proven to have expanded the distribution of this construction: El Pais of Spain today has a fantastic example of this. Obama is quoted saying: "Tenemos que gastarnos dinero para sortear la recesion", lit.: "We have to spend us money to overcome recession". This is the suggested translation for "...we're gonna have to spend money now to stimulate the economy." The meaning of the benefactive construction is never clearer than here and not predictable from the syntactic composition VERB+REFL.
For me, as a native speaker of Spanish with a rather different dialect, it was hard to get the meaning of the construction at once. I think that what bothered me was the undetermined object "dinero" (money). If the construction would have been "Tenemos que gastarnos EL dinero... (def)" it would have sounded more acceptable. But I understand that this would have been a wrong translation since we are talking about spending money in general and not any particular amount. So, is determination essential to the benefactive generally and Spain is innovative in this use?
How does this work in the Norwegian examples? Is it possible to use this construction in Norwegian in other cases than the named above?

Looking forward to the Julefest!!

søndag 16. november 2008

Frisører og parykker

Som tidligere påpekt i bloggen her, er det slett ikke alltid at kommunikasjon ved hjelp av visuelle symboler fungerer like bra. Hvilket budskap er det for eksempel som skal overbringes til kundene når en frisør reklamerer med et skilt med tegning av en mann i parykk?

Dog will bight

Det er søndag, og jeg befinner meg på Blindern, helt aleine på et timelærerkontor for å forberede forelesning i ex.fac språk. Denne gangen skal jeg plage studentene med temaet språkendring, og håper å finne mange gode eksempler jeg kan vise dem. Men før jeg begynner på arbeidet, måtte jeg selvsagt kaste bort litt tid på internettet. Heldigvis for leserne av Lingvisme førte min prokrastinering til et godt funn. Bildet til høyre viser en noe original staving av "bite", nemlig "bight". Engelsk er berykta for å ha en veldig lite gjennomsiktig ortografi, eller sagt på en annen måte, man staver ord på de best absurde måter. Skriftspråk er alltid mer konservativt enn talespråk, noe som fører til at det "henger etter" -- talespråket endres, mens stavemåten ikke gjør det, noe som blant annet fører til "stumme bokstaver", som reflekterer en tidligere uttale av ordet. Vi har en del av disse i norsk også, men heldigvis ikke i like stor grad som i engelsk. Forfatteren av skiltet på bildet har åpenbart stavet ordet i analogi med "blight" og "tight", som rimer på "bite" men som skrives annerledes.

torsdag 13. november 2008

Språkprat igjen!

Da var språkprats temakveld om konstruksjonsgrammatikk vel overstått, og oppmøtet var over all forventning! Jeg (Eli Anne) snakka litt om hva konstruksjonsgrammatikk er (egentlig Jennys bit, men hun var desverre sjuk i dag). Så presenterte jeg to konstruksjoner; way-konstruksjonen og "verbe seg til MÅL-konstruksjonen". Laila la fram "konstruksjoner på hjernen" og snakka om den psykolingvistiske realiteten til konstruksjoner. Det var gøy, og etterpå ble det litt diskusjon. Sånt varmer et lingvisthjerte!

Det faglige innholdet var meget bra.


Og selvsagt gikk vi og var sosiale på pøbben etterpå!

I can has lolcat-speak?

Bilder av søte pusekatter (eller andre dyr, blant annet hvalrosser) har lenge florert på internettet, gjerne med en tekst under. Ofte framstilles det som om det er kattene som er avbildet som sier det som står under bildet, som i klassikeren til høyre. Bildene (eller kattene på bildene) kalles lolcats, eller lolkatter på norsk, etter akronymet LOL som står for laugh out loud. Kattene snakker ikke perfekt engelsk, men feilene de gjør er systematiske, som å bruke -z som den eneste flertallsendelsen, og has i stedet for have. Det finnes til og med et verktøy for automatisk oversettelse fra engelsk til lolcat! Can I have a cheeseburger blir til I can has cheezburger, hello blir til y halo thar, og good bye blir til gud bai.

Og selvfølgelig finnes det meta-lolkatter; lolkatter som kommenterer lolcat-speak:

tirsdag 11. november 2008

Spam og detektivabeid

Jeg gikk nettopp inn i spamfolderen min, og der fant jeg noe som først gjorde meg perpleks, men som så viste seg å være skrevet i en hemmelig kode. Jeg følte meg som Mikke Mus som finner den skjulte beskjeden i en melding fra Spøkelseskladden!

Jeg åpna altså mailen og så dette:
who is your favorite? Vanquish
Introduced
Attachd
Gull
Repasture
Attachd
Longst
Embracements
Vanquish
Introduced
Tyrants
Repasture
Attachd
Contez
Introduced
Attachd
Longst
Introduced
Swindle
there is only one ...
Ingen bilder, ingen lenker, ingen oppfordring om å kjøpe noe eller sende 10 000 kroner til en konto i Nigeria. Den kommunikative intensjonen ved mailen var umulig å fastslå. Ville spammerne bare sende meg en poetisk melding å friske opp morgenen min med?

Men så oppdaget jeg koden. Så enkelt at det er genialt. Forbokstavene danner nemlig ord, og her er meldingen som ligger bak det bisarre "diktet":

who is your favorite?
VIAGRA
LEVITRA
CIALIS
there is only one ...

Navnene på tre potensmedisiner! Spammere er sleipe altså! Men jeg blei faktisk litt smigra ... de stoler altså så mye på detektivferdighetene mine at de sender meg en kodemail! Nå skal det sies at dette kanskje egentlig ikke var intensjonen, for webmail stripper vekk HTML i mailer, så ved nærmere øyensyn var det ei lenke gjemt i mailen, som dukka opp som et vedlegg. Men likevel! Kanskje dette er en fruktbar spamme-strategi? De som dekoder slike meldinger blir muligens så fornøyde med seg selv at de ender opp med å kjøpe litt viagra?

mandag 10. november 2008

Xenolingvistikk

Tidligere på Lingvisme har jeg skrevet om Klingon, et konstruert språk som skal snakkes av romvesener og derfor har mange trekk som er sjeldne for menneskelige språk: et uvanlig foneminventar, OVS-ordstilling og så videre. Man kan jo lure på om det virkelig lar seg gjøre for mennesker å designe et språk som ikke er menneskelig -- per definisjon kanskje en umulig oppgave. Hvis det finnes intelligente skapninger andre steder i universet, har de språk? Det virker rimelig å si at det er en stor sjanse for at de har det, men vil det være et språk vi mennesker kan lære oss? Eller i det hele tatt kjenne igjen som et språk?

En ting er at det sikkert vil være umulig for oss mennesker å uttale mange av lydene i et slikt utenomjordisk språk, for romvesener selvsagt ikke har den samme anatomien som oss. Det er ikke engang sikkert at de bruker de samme organene til å kommunisere med som de bruker til å puste og spise med slik som vi gjør. Kanskje de har et mer spesialisert taleorgan plassert et annet sted på kroppen? Kanskje de kommuniserer med lysglimt? Kanskje de kommuniserer med lyder så høyfrekvente eller lavfrekvente at vi mennesker ikke kan høre dem? Kanskje de kommuniserer med elektriske impulser? Uansett hvilken måte de bruker til å utveksle kommunikative signaler med, så er det et spørsmål som er enda mer fascinerende ved tanken på slike språk: vil mennesker være i stand til å forstå det konseptuelt sett, uavhengig av om vi kan oppfatte det rent fysisk? Kanskje er tankeprosessene til en rase som ikke er fra jorden så fremmede, og språket så langt utenfor det vi har på jorda at vi ikke vil kunne ha kapasitet til å lære det?

I språktypologi studerer man strukturelle likheter og forskjeller mellom språk. Målet er å kunne si noe om hva som er universelt for menneskelige språk. Hvilke aspekter ved språk er bestemt av våre kognitive evner og hvilke er bestemt av kulturelle faktorer? Vi kan komme et stykke på vei til å besvare disse spørsmålene, men det er alltid problemer. Hvis vi ikke finner et trekk i noe språk i verden, er det fordi det ikke er mulig for menneskelige språk å ha dette trekket, eller er det tilfeldig at vi ikke finner det? Kanskje et språk som døde ut for 20 år siden hadde nettopp dette trekket? Å få kontakt med andre intelligente vesener i universet vil være enormt stort på mange måter, men jeg tror mange ikke er klar over hvor stort det ville være for lingvistene -- jeg selv sikler nesten ved tanken på å få studere et romvesenspråk! Da vil man virkelig kunne begynne å spekulere i hva som er artsspesifikt og hva som er universelt i ordets rette betydning: kanskje det typologene nå kaller universalier bare er "jordiversalier" og slett ikke gjelder for andre enn mennesker.

torsdag 6. november 2008

Normativisme i praksis

Jeg har et svært delt forhold til språk. Som norsk morsmålstaler gremmer jeg meg for eksempel hver gang jeg hører folk som snakker om skjøkken og skjøleskap, og jeg må holde meg fra å gå bort å rette på dem (det fungerer like dårlig om det er familiemedlemmer eller vilt fremmede mennesker på trikken). Som lingvist tenker jeg derimot at så spennende det er å observere denne språkendringen mens den skjer.

Det er naturlig at språk endrer seg. Endringene skjer selvsagt ikke samtidig hos alle som taler et språk, men sprer seg gradvis. Dermed er scenen satt for normativisme. For oss som skiller mellom lydene først i ord som kjøkken og sjelden er det lett å tenke at det er galt å si skjøkken, men det er ikke noe mer galt i dette enn det er galt at vi ikke snakker helt likt i dag som det Ibsen gjorde, for eksempel.

Bildet viser et av de beste eksemplene jeg har sett på slik normativisme i praksis. Bildet er tatt i Oslo, og viser bakparten på en rimelig skitten lastebil. Noen har skrevet i møkka, "I wish my wife was this dirty." Så er det en annen som har streket over was og rettet det til were.

Were
er den formelt og normativt "riktige" formen i en setning som dette, og er én av få rester av konjunktiv i engelsk. Konjunktiv brukes blant annet, som her, til å uttrykke at man ønsker noe. Selv om konjunktiv ses på som "riktig" når man skriver og snakker formelt engelsk, brukes det mindre og mindre, og er sannsynligvis på vei ut av det engelske språket.

Her har noen altså tatt seg bryet med å rette en engelsk setning som mange engelsktalende vil mene ikke er feil. Og ikke bare det, men setningen sto skrevet i møkka på en bil, og dét i Norge!

Får det blitt mer normativt?

tirsdag 4. november 2008

LOL IRL! Jeg mener det!

Semantisk bleking (eller svekking, semantic bleaching på engelsk), skjer med ord og uttrykk som er frekvente i språket. At ord, uttrykk eller konstruksjoner er frekvente, vil si at de brukes ofte; talere sier eller skriver dem ofte, og lyttere hører eller leser dem ofte. Det som har en tendens til å skje med slike frekvente enheter, er at de får en mindre spesifikk, videre betydning. Ofte får ord som blekes en styrket kommunikativ funksjon. Et eksempel er det norske ordet bare, som (i alle fall hos unge talere) ikke lenger bare brukes i betydningen 'kun', 'utelukkende', men også for å signalisere gjengivelse av direkte tale, slik vi ser i disse setningene (funnet på nettet):

Hun bare: Javel, men det er ikke det vi snakker om nå! xD.

ja pappa kom han bare omg, u hører ik på meg kan u slå av pc`n gjør lekser:O jeg bare omg.

Han bare : LOL JA

Angående den siste setninga, så har jeg observert et underholdende tilfelle av semantisk bleking av uttrykket LOL i det siste. LOL er en forkortelse som betyr "laugh out loud", og brukes på nettet når man synes noe er morsomt. Men uttrykket har tydeligvis blitt svekket, og man bruker det slett ikke bare når man faktisk ler høyt, men kanskje bare når man humrer eller bare ler inni seg. For de tilfellene der man virkelig må le, har stadig flere begynt å bruke uttrykket "LOL IRL" - "laugh out loud in real life"

mandag 3. november 2008

Vits

Jeg laget en vits i dag. Den er veldig morsom for 0,001% av befolkninga.

- Hva danser lingvister når de er på ball?
- Polysyntese.

torsdag 23. oktober 2008

Tvungen selverkjennelse


(fra xkcd.com)

Youtube-kommentarer er berykta på internettet for å være selve bunnslammet; det man finner der er egnet til å få det mest positive menneskesyn til å forvitre og svinne hen til fordel for et kynisk syn på menneskeheten. Både form og innhold er ofte så absurd at det ikke med sin beste vilje er mulig å tolke de kommunikative intensjonene til avsenderen (hvis det er noen der i det hele tatt).

haha no offense to black ppl but heres a halloween joke ok a baby was given wings by god so the baby asked god "does this mean im an angel?" and god laughed & said "nah niggah youre a bat happy halloween"

Subscire then

sheesh ur so fat and curly-haired u lesbian freak

do they cut them selfs no MCR IS NOT EMO!!!!!!!

Xkcd har kommentert dette tidligere:



Men siden life imitates art, som man sier, har youtube nå lansert en audio preview-funksjon, slik at man kan velge å høre en elektronisk stemme lese opp det man har skrevet før man eventuent publiserer det. Så er jo spørsmålet om de som ikke har noe intelligent å si, kommer til å bruke denne funksjonen eller ikke... En slik funksjon hadde forøvrig vært nyttig på norske nettavisers kommentarfunksjon.

tirsdag 21. oktober 2008

Microsoft tar patent på sensur

Ifølge denne artikkelen har Microsoft registrert patent på en teknologi som skal kunne gjenkjenne og sensurere banning i tale. Filteret skal kunne brukes for eksempel hos kundesentre som man ringer til, slik at hvis kunder banner og sverter til de ansatte, blir dette automatisk sensurert (eller omvendt, hvis en ansatt banner til en kunde), enten ved å bli gjort uhørlig eller uforståelig. Onlinespill som har chattefunksjoner der man snakker med hverandre istedenfor å skrive vil også være et mulig bruksområde for programvaren.

Talegjennkjenningsprogramvarene jeg har vært borti har ikke fungert så veldig bra. Folk snakker forskjellig, har ulike dialekter, snakker utydelig og så videre. Som regel har systemene en begrenset mengde ord og uttrykk til rådighet som de gjenkjenner. Å skulle plukke ut ord og fraser fra en kontinuerlig talestrøm er veldig vanskelig for en maskin.

I dette innlegget skrev jeg om the clbuttic mistake, et fenomen der sensureringsfiltre bytter ut ikke bare de stygge ordene, men alle bokstavsekvensene som matcher det stygge ordet, sånn at assassinate blir buttbuttinate og constitution blir consbreastution. Det største problemet for et tale-ordfilter blir nettopp dette, fordi tale ikke har tydelige mellomrom mellom ordene sånn som skrift har. Hva gjør filteret når det hører ord som assumption? Eller shiitake (en sopp)? Eller noen har en litt avvikende uttale av continue?

torsdag 16. oktober 2008

Pass opp for rullestol-ryttere

Når vi kommuniserer, bruker vi ofte språk. Men ikke alltid. Noen ganger bruker vi bilder, eller visuelle symboler. Som regel går dette greit, men noen ganger må man spørre seg: Hæ?

onsdag 15. oktober 2008

Stupe opp og stupe ned



Fra Aftenpostens nettutgave 14. oktober. Børsen stupte...ned? I motsetning til de gangene børsen stuper opp?

søndag 12. oktober 2008

Søndags morra morro


(Trykk på bildet for å se en større versjon - fra xkcd.com.)

Selv om Klingon ikke tilhører den finsk-ugriske språkfamilien, er det likevel et interessant språk. Det er et konstruert språk, laget av en lingvist - Marc Okrand, på oppdrag fra Paramount Pictures. Klingonene er en rase med romvesener i tv-serien og filmene om Star Trek, og Okrand skapte bevisst et språk som hadde mange uvanlige trekk, for å understreke at språket ikke er menneskelig. Fonemsystemet inneholder for eksempel uvanlige kombinasjoner av lyder - det har en [v] men ikke en [f], og har ingen velare plosiver (som [k] og [g]). Målet med dette er at språket skal høres fremmed ut.

Også syntaktisk er Klingon designa slik at det skal være så uvanlig som mulig - ordrekkefølgen er OVS, en av de sjeldneste rekkefølgene i menneskelige språk. Her er en video der Mark Okrand forteller om hvordan Klingon ble til. Den er litt lang (21 minutter), men veldig interessant.

fredag 10. oktober 2008

I can see forever, lol


Dette bildet av Chomsky vakte munterhet på forrige språkprat, så jeg poster det her, for the lulz som man sier. For de som ikke visste det, det er to referanser å skjønne her. For det første er bildet (og teksten) en referanse til dette bildet, som er populært på internettet:


For det andre er det en referanse til en artikkel Chomsky skreiv sammen med Mark Hauser og Tecumseh Fitch i 2002 der de legger fram en hypotese om at rekursivitet er den eneste egenskapen som er unik for språk

(For å være presis, det de sier er: "We hypothesize that the faculty of language [in its narrow sense] only includes recursion and is the only uniquely human component of the faculty of language" (Chomsky et al. 2002: 1569).)

Vrangt og vanskelig

De som leser Aftenposten (og sannsynligvis de som ikke leser den) kjenner til Per Egil Hegge, språkspaltist. Den 10. oktober skriver herr Hegge blant annet følgende:

Informasjonsskriv skal helst være både lettfattelige og utvetydige. En pasient ved et av våre større sykehus leste i en brosjyre etter en operasjon for grå stær: «Det er normalt å være lyssky. Du kan bruke solbriller hvis du synes det er ubehagelig ...»

Problemet kan sammenfattes slik: Man skal passe på hva et uskyldig ord som «det» viser tilbake til. Her går det an å lese det slik at det å bruke solbriller er ubehagelig. Man skal sant å si være litt vrang for å lande på det synspunktet, men hvis det er én ting denne spalten ikke mangler, er det vrangvillige lesere.

Det skal ikke stor fantasi, og heller ikke store medisinske kunnskaper, til for å forstå at det er ubehagelig med den lysømfintlighet som kan forekomme etter inngrep i øyet.

Kanskje jeg er en vriompeis, men jeg syns Hegge med vilje leiter etter måter å feiltolke setninga på (noe han selv innrømmer). Så hvorfor i det hele tatt nevne det? Hvem i alle dager får utdelt en brosjyre fra sykehuset der det står «Det er normalt å være lyssky. Du kan bruke solbriller hvis du synes det er ubehagelig ...», og tenker OMG! Jeg kan bruke solbriller hvis jeg synes det er ubehagelig å bruke solbriller!? Dette er en absurd tanke.

Jeg kan ikke en gang se at en sånn tolkning er "semantisk grammatisk", for å bruke en term jeg fant på akkurat nå. La oss se på setninga i isolasjon:

??Du kan bruke solbriller hvis du synes det er ubehagelig

Merkelig setning, som jeg tror de fleste hadde stussa over hvis de hadde støtt på uten kontekst. Hva med denne:

Du kan bruke solbriller hvis du synes det er behagelig

Her er det mye mer sannsynlig at man tolker setninga slik at 'det' viser til 'å bruke 'solbriller'. Jeg tror problemet med Hegges påstand er at selv om det i de fleste tilfeller stemmer at man skal tenke over hva man refererer til med ord som 'det', forsvinner poenget når det er opplagt at setningen i isolasjon ikke gir noen mening - i slike tilfeller tvinges det fram en annen tolkning av 'det'.

torsdag 9. oktober 2008

Språkprat!

Jeg kom nettopp hjem fra det mest eksellente arrangementet i historien: språkprat - temakvelder om språk som arrangeres av språkstudenter ved universitetet i Oslo (hovedsaklig lingvistikkstudenter). Vi skal prøve å få til månedlige møter, der en eller flere frivillige holder innlegg om hva de måtte ønske som har (løselig) med språk å gjøre.

Denne gangen var det Jenny Graver som holdt innlegg, om sitt doktorgradsprosjekt om den syntaktiske utviklingen fra passiv til upersonlig i irsk. Det var vanskelig, men spennende!

I tillegg fortalte jeg litt om denne bloggen, og prøvde å rekruttere folk til å skrive her. Jeg har sendt ut e-post-invitasjoner til de jeg har adressene til (så sjekk e-posten deres!), men hvis noen fler vil ha mulighet til å poste, så send meg en mail på elipanne (at) gmail.com, så legger jeg dere til som bidragsytere!

100,000,000 ord for snø, men ingen ord for "lettlurt"

Ifølge denne bloggen vet alle at samene har 60 ord for snø. Jeg må innrømme at jeg ikke visste det, men så kan jeg heller ikke noe særlig samisk. Jeg kan imidlertid nok om språk (og om folks behov for å si dype og innsiktsfulle ting om språk) til at alarmklokkene umiddelbart begynner å kime når jeg leser påstander som dette.

En myte som har blitt så etablert i kulturen at den nærmest er en opplest og vedtatt sannhet, omhandler en annen folkegruppes utallige ord for snø, nemlig eskimoene. Jeg tør vedde på at man kan slenge ut et hvilket som helst antall ord for snø, og de fleste vil nikke klokt og si ja og ha. KFUK/KFUM-speidernes nettside slår blant annet fast at "Eskimoene har over hundre ord for snø (men ingen ord for krig)."

Problemet er at det ikke stemmer. Laura Martin, en antropolog ved Cleveland State University, publiserte en artikkel i American Anthropologist i 1986 (Nr. 88, 418-423), der hun avkrefter myten og forklarer hvordan den har oppstått. Geoffrey K. Pullum oppsummerer i sin bok the great eskimo vocabulary hoax:

The tale she tells is an embarrassing saga of scholary sloppiness and popular eagerness to embrace exotic facts about other people's languages without seeing the evidence. The fact is that the myth of the multiple words for snow is based on almost nothing at all. [...] People cannot be persuaded to shut up about it either. (Pullum 1991: 162/165)

Pullums essay kan leses her, og han oppsummerer mytens reise fra Franz Boas' handbook of north American indians (året er 1911, antallet ord for snø: 4) via Benjamin Lee Whorfs artikkel "Science and linguistics" (året er 1940, antall ord for snø: 7), og videre og videre, til hele 50 i Lanford Wilsons "the fifth of july" (1978) og ikke færre enn 100 i en artikkel i New York Times i 1984. Men som Rolf Theil skriver:

Grønlandsk [har] berre to ord for snø - quanik 'snø som fell' og aput 'snø som ligg på jorda' (Theil 2007: 211).

Myten om alle ordene for snø har muligens oppstått fordi eskimospråkene er såkalt polysyntetiske, det vil si at hvert ord som oftest består av mange morfemer. De har et stort antall bøyingsaffikser, og kan ofte uttrykke det som tilsvarer en hel setning på norsk ved hjelp av ett ord. Å telle "ord" for noe som helst på slike språk sier derfor like lite som å telle setninger på norsk.

Ok, så eskimoenes ord for snø er en myte. Hva så? Med det mener jeg, hvis det hadde vært sant, og eskimoene hadde hatt en milliard trilliard ord for snø, hva så? Hadde det vært så veldig interessant? Folk som holder på med hester har mange ord for alle de små bøylene og stroppene på salen, ord for mannehester, damehester, kastrerte mannehester, hester med forskjellig mønster på pelsen, ord for gangartene til hesten og så videre og så videre. Ord jeg ikke kan. Whoop-dee-doo. Folk som er interesserte i bondage har sannsynligvis masse ord for alle de små lærpiskene og duppedittene sine, uten at det er særlig oppsiktsvekkende.

Dette er kjernen i myten om eskimoene og snøen deres. Man tror at man deler en fundamental innsikt om folks natur gjennom denne påstanden. Folk har mange ord for ting som er viktige for dem, derfor har eskimoene (og samene, ifølge linken på begynnelsen av denne posten) mange ord for snø, tyskerne har mange ord for byråkrati, latinamerikanerne har mange ord for...å danse salsa? Uantett hva en kultur er kjent for, så har de i folks generelle oppfatning mange ord for dette fenomenet. Det har blitt en klisjé; noe man sier for å påpeke egenskaper ved en gruppe heller enn å si noe genuint om de språklige kjennetegnene deres. Faktisk er det uttrykk som dette som er opphavet til uttrykket snowclones, via uttrykk som følgende (hentet fra Language Log):

If Eskimos have dozens of words for snow, Germans have as many for bureaucracy. [The Economist, October 11th, 2003, p. 56, col. 2]

Slike uttrykk gjenspeiler en tankegang om at språket og tanken er tett sammenvevd og at hvordan folk snakker sier noe om hvordan de tenker, eller til og med styrer hvordan de tenker eller ser verden (i sin sterkeste form er denne hypotesen kjent som Sapir-Whorf-hypotesen). En slik påstand er problematisk, i hvert fall i sin sterkeste form. Det har ikke blitt påvist noen særlig effekt av en slik type. Jeg sier ikke at det ikke finnes noen slik effekt, men det er en sterk tendens til å bare anta at den er der, og å anta det på en svada-aktig og banal, og ofte veldig romantiserende måte, særlig overfor folk som sees på som "naturfolk", som eskimoer og samer.

Samisk har innpå 60 ord for "snø" alt etter hvilken tilstand den befinner seg i. For mennesker ute i naturen er det en kode til forståelse i ethvert slikt ord [...]. Rikdommen på naturord kan også brukes i overført betydning til å gjelde forhold mellom mennesker, mellom mennesker og dyr, mennesker og samfunn osv. [...] Gjennom språket transformeres således informasjoner av livgivende betydning for samene. (http://alligatorill.blogspot.com/2005/10/vet-du-at-det-finnes-60-ord-for-sn-p.html, mine uthevinger)
Vet dere hva annet som transformeres gjennom språket? Ren og skjær svada av livgivende betydning for bloggere. Ugh.

onsdag 8. oktober 2008

Suspekt dokke?

Hva i all verden er det denne dokka sier?



Dette høres ut som et tilfelle av auditiv pareidolia for min del. Jeg har hørt på klippet mange ganger, og kan ikke si meg enig i at det er opplagt at den sier "islam is the light". Siden jeg leste før jeg så klippet at det var det dokka sa, hører jeg at det kan tolkes slik, men jeg er usikker på at jeg ville hørt det hvis jeg ikke hadde blitt påvirka på forhånd. Men som for alle slike fenomener, når man først har hørt eller sett det en gang, klarer man ikke å la være å høre det. Som i Dido-sangen "thank you", der jeg veit at hun synger "morning rain drops on my window", men jeg likevel hører det jeg hørte første gang jeg hørte sangen, nemlig "I wanna make love to my window".

Legg også merke til reporterens kommentar - "this doll is spouting more hate than love". Hvis dokka sier "islam is the light" (noe jeg mener er tvilsomt) - er det virkelig hatefullt? Virkelig? Kanskje i overkant ømfintlig, men ok.

All your morpheme are belong to us



Frasen på skiltet er en snowclone, en konstruksjon som minner om et idiom, men der ett eller flere (eller alle) av ordene kan byttes ut med det man kunne ønske. I dette tilfellet er det uttrykket all your base are belong to us som har blitt en snowclone. Denne bisarre setningen stammer fra det japanske sega-spillet Zero Wing, og spredte seg på internett via Something Awful-forumene. Frasen er dermed et eksempel både på såkalt Engrish (ikke-standard varianter av engelsk, ofte fra asiatiske land) og på et internet meme; en betegnelse på en frase, et bilde eller lignende som sprer seg via internett.

søndag 5. oktober 2008

Auditiv pareidolia og Boten Anna

Mennesker er esperter i å finne mønstre. Vi ser jomfru Maria i kaffeflekker, oppfatter mønstre i lottotall, og oppfatter ord i ren støy. Pareidolia er en term som betegner dette fenomenet, som kan være visuelt så vel som auditivt. Visuell pareidolia ser vi blant annet i "fjeset på Mars", det berømte bildet tatt av romsonden Viking 1 i 1976.



En særlig underholdende form for auditiv pareidolia kjenner vi blant annet fra åpen post, der sanger på diverse språk fikk norske tekster:



Når man ikke kjenner språket det blir sunget på, er det veldig lett å reanalysere det man hører og presse det inn i det norske lydsystemet. Men hva skjer hvis man kjenner både originalspråket og språket i undertekstene? Jeg fant en engelsk-tekstet versjon av landeplagen Boten Anna på youtube:



Konklusjonen er at det er ganske forstyrrende, som en auditiv versjon av en Necker-kube - se på undertekstene og du hører engelsk, lukk øynene og du hører svensk.

fredag 3. oktober 2008

Fly for kun n krone!


Er dette et eksempel på sms-språk (lol), eller er det et avansert tilbud som er rettet spesielt mot matematikere? Hvem vet?

torsdag 2. oktober 2008

Ondlings

Ei venninne av meg har lenge vært forkjemper for å fylle et leksikalsk hull i norsk: det motsatte av yndlings. Yndlingsfargen din er den fineste fargen du veit, yndlingsboka er den beste boka, men vi har ikke noe tilsvarende uttrykk for det motsatte - og det er her ondlings kommer inn: som en betegnelse på det verste man vet innen en kategori. Forøvrig må vi vel nesten kalle ondlings og yndlings for prefikser og ikke ord, siden de ikke kan stå aleine, men må feste seg på andre ord. Uansett, ondlings er mitt yndlingsprefiks. Jeg vil anbefale alle å bruke det.

tirsdag 30. september 2008

mandag 29. september 2008

Vi vil ha luff!

Etter at jeg diskuterte hyperkorrigering i dette innlegget, minnet moren min meg på en morsom episode fra da lillebroren min var liten.

Siden han er vokst opp på østlandet, har broren min østlandsdialekt, i motsetning til meg og mamma som snakker slik de gjør i Kvinesdal. Han var dermed vant med at der jeg og mamma sa o (som i ost, IPA [u]), sa han ofte u (som i hus, IPA [ʉ]) - han sa "buss", vi sa "boss", han sa "luft", vi sa "loft". Så hvis han hørte mamma eller meg si et ord med o (IPA [u]), fungerte det i de fleste tilfeller greit å bytte den ut med en u (IPA [ʉ]) for ham.

Helt til den dagen han overappliserte regelen og spurte om han kunne få ei skive med "luff".

lørdag 27. september 2008

lol+pusekatt+semantikk=caturday

Hvem elsker vel ikke lolcats? Ingen, det er hvem. Selv om noen hevder at de er avleggs, og bare sååå 2006, synes jeg de fremdeles er morsomme. Og når de har lingvistiske begreper i seg kan det vel ikke bli bedre? Nei. Det kan det ikke. Så behold: Semantics cat!

lørdag 20. september 2008

Få deg litt morson og ta deg en god durs

Internett er en vidunderlig ting, fordi det gir oss tilgang til språkdata som vi ellers ikke ville sett, eller som ville tatt mye lenger tid å samle inn. Ta en kikk på disse setningene, som jeg i et anfall av akutt nysgjerrighet har spadd fram:

  • der bodde vi på 4 manns rom med felles durs og toalett
  • 2 stk leiligheter med durs wc soverom stue kjøkken 4 sengeplasser.
  • mange huskyer som kommer på dyrehjem fordi eieren ikke klarer og gi den nokk morson
  • Det ble dagens morson. Kjenner det var uvante muskler for jeg er litt støl i ryggen :)
  • Farget de for hånd med turs og gelepenn(sort og,hvit)
  • kan dere ikke heller ta en turs og tegne en fin bart isteded mens han sover
  • Bærs og tiss er ikke morsomt
  • Hva kan du og bærsj og tiss? Spørsmål 1/5. Kan man vaske doen med bærsj. JA !! NEII !!!
  • Kjæresten min har røyka noen ganger, hars eller et eller annet dop saker. ..
  • windows sier marskin er infisert av virus men ingen av virus kontrollene finner det

Durs, morson, bærs(j), hars og marskin -- hva skal dette bety? Første gang jeg observerte dette fenomenet, gikk jeg på barneskolen, og jeg husker at jeg syns jeg det var veldig merkelig at mine klassekamerater insisterte på å skrive bærs eller bærsj framfor den (for meg) mer logiske skrivemåten bæsj. Først mange år senere skjønte jeg hva som er grunnen til at noen legger inn en (for meg) overflødig <r> i ord som dette.

Det mine klassekamerater hadde til felles, og som gjorde at de fant skrivemåten naturlig mens jeg ikke gjorde det, var dialekten. Jeg er fra sørvestlandet, men flytta tidlig til østlandet og gikk på skole der. I østnorsk uttales fonemsekvensen [ɾ]* + [s] som [ʃ], en postalveolar frikativ, den samme lyden som i sky, sjukehus og dusj. På østnorsk uttales altså ordet <kurs> som [kʉ:ʃ], mens det på min dialekt uttales [kʉ:ɣs] (for de som ikke er IPA-savvy, østnorsk <kurs> har bare 3 ulike lyder i , k-u-sj, mens jeg har 4, k-u-r-s).

Østlendinger står derfor overfor en komplikasjon når de vil skrive ord som inneholder fonemet [ʃ]: de kan ikke vite (med mindre de har lært seg hvordan ordet skrives), om det skal inneholde en
<rs>-sekvens eller en <sj>-sekvens. Den logiske konsekvensen ville vært at de skriver ordene i samsvar med sin egen uttale; <vers> som <væsj>, <kurs> som <kusj> og så videre. Men det er ikke dette som skjer; det er faktisk det motsatte -- ord som ikke har noen r i noen norsk dialekt får denne satt inn, slik at resultatet blir durs, morson, marskin etc.

Hva skyldes dette? Fenomenet kalles hyperkorrigering, og oppstår når talere "retter" på noe som i utgangspunktet er riktig, fordi de er usikre på reglene og gjerne vil være "korrekte". I tilfeller som dette er talerne usikre på stavemåten, men de vet at ord de selv uttaler med [
ʃ] ofte skrives med <r>. Derfor setter de inn en <r> for å være på den sikre sida. Eksemplene over har mange trekk som tyder på at de er skrevet av folk som ikke er stø i rettskriving generelt (men tydeligvis stø nok til at de faktisk har lagt merke til fenomenet med den ustyrlige r-en og derfor stapper den inn der de håper den hører hjemme).

Jeg trekker tre konklusjoner fra dette: 1) Som voksen og klok har jeg endelig fått svar på noe jeg lurte veldig på da jeg var liten, 2) folk utviser kompleks og fascinerende språklig adferd, og 3) Frøken Detektiv og mysteriet med den ustyrlige r-en høres ut som ei fantastisk bok.


*IPA-tegnet for den østlandske uttalen av
<r>

fredag 19. september 2008

Kerning og fnising

Selv om typografi ikke direkte har noe med lingvistikk å gjøre, var denne morsom nok til at jeg ikke klarte å la være:


For de som ikke ser det (jeg skjønte det heller ikke med en gang), det skal stå FINAL REGISTRATION. Det er egentlig ikke fonten i seg selv som skaper den uheldige effekten, men det at bokstavene står for tett sammen. Kerning kalles det når man øker avstanden mellom to tegn for å unngå en slik effekt, og F-en og I-en her burde absolutt ha vært kernet.

Adgang forbudt for adjektiver!

Det finnes mange ordklasser, hver til sitt bruk. Forskjellige, men alle nyttige og nødvendige. Hvem hadde ant at i noen deler av verden praktiseres ordklasse-apartheid?


Det er på tide at noen tar dette opp med det internasjonale samfunnet, slik at vi kan iverksette økonomiske sanksjoner mot de som diskriminerer ord på grunnlag av klasse.

tirsdag 16. september 2008

Flere generøse peniser

I et tidligere innlegg skrev jeg om en penis som liker å spandere øl på folk. Det viser seg at fenomenet er mer utbredt enn jeg hadde trodd, noe jeg oppdaget ved å lese Elyse Sewell sin Livejournal. Der fant jeg et bilde tatt i Hong Kong:




Teksten på T-skjorta er "My dick would like to buy you a drink". På engelsk høres ikke dette like syntaktisk pussig ut som den norske "min penis vil spandere deg en drink", fordi verbet buy, ulikt det norske spandere, ofte brukes ditransitivt. Hvor smakfullt det er, kan jo i og for seg fremdeles diskuteres.

mandag 15. september 2008

En Sisyfosansk oppgave

Jeg har alltid likt Animaniacs, og kom over dette klippet på youtube forleden dag:



Morsomt, men jeg klarer ikke la være å være en kjip festbæsjer. Tittelen på klippet er "All the words in the English language". En bedre tittel ville vært "all the words in an English dictionary". Hvorfor det? Rett og slett fordi ingen ordbok inneholder absolutt alle ordene i et språk. Det fins ordbøker med større og mindre utvalg, men å inkludere ALLE ord er en håpløst ambisiøs oppgave. Hvis en slik ordbok hadde eksistert, ville den vært uhorvelig diger. Kanskje ikke uendelig stor, men såpass at den absolutt ikke ville latt seg trykke i noe bokformat vi kjenner.

Hva skyldes dette? Med ett ord: produktivitet. Da snakker jeg ikke om den typen produktivitet man vanligvis mangler i dagene før man skal levere en oppgave, når FreeCell og minesveiper framstår som forlokkende og meningsfulle aktiviteter. Nei, jeg snakker om lingvistisk produktivitet, den egenskapen ved språk som gir oss muligheten til å si ting som ikke har blitt sagt før (noen vil hevde at dette er en ganske viktig egenskap, andre ser ikke ut til å benytte seg av den særlig mye). Poenget er i alle fall at ordene i et språk ikke er en fast mengde: vi er i stand til å benytte oss av mønstre for å lage nye ord etter hvert som vi får behov for dem, ved hjelp av forskjellige teknikker. En slik teknikk er affigering, der man setter et prefiks eller et suffiks på et ord. Ta et ord som snill. Et pent og pyntelig adjektiv. Legg til suffikset -het, og vi ender opp med substantivet snillhet. Gjenta med alle adjektiv du kan komme på, og vips har du dobbelt så mange ord som du hadde til å begynne med. Suffikset -het er relativt produktivt, det vil si at vi kan feste det på mange ord. Andre suffikser er mindre produktive, som -ne, som lager verb av visse adjektiver:

gul --> gulne
svart --> svartne
blå --> blåne

men ikke:

lilla --> *lillane
brun --> *brunne
(asterisken betyr at et ord ikke er mulig, det er ugrammatisk)

I tillegg til affigering som en kilde til nye ord, har mange språk muligheten til å lage sammensetninger, der to eller flere selvstendige ord settes sammen til ett. I norsk er denne prosessen ekstremt produktiv. For å bevise dette har jeg gått inn på vg.no og notert alle sammensetningene jeg ikke har hørt før:

pornoprins
nettpornoprins
forsvarsrot
spillmonster
uroby
flyporno
hockeystart
blåtungesmitte
gassbilregler
smugrøykeslåsskamp

Hører disse ordene hjemme i ei ordbok? Umiddelbart vil jeg si nei. Ordene er fullt ut forståelige på grunnlag av de enkelte ordene de er bygd opp av (og der man er usikker vil man ha konteksten til å hjelpe seg). Kun hvis et ord blir etablert, det vil si at det blir brukt av flere, over en viss tid, vil det kunne bli oppført i ordboka. Og ord som ikke brukes, vil forsvinne.

fredag 5. september 2008

Nesten, men ikke helt

Oversettelse er som tidligere nevnt vanskelig. Ikke bare skal man velge et ord som er leksikalsk riktig, men man bør også overveie å bruke et ord i samme register som man forsøker å oversette fra.

Det er ikke ræger alt som lukter

I et tidligere innlegg var jeg inne på snowclones, eller fru Blom-uttrykk som vi kan kalle dem på norsk -- faste uttrykk der ett eller flere av ordene kan fylles ut med det som måtte behage taleren. Ofte kommer disse uttrykkene fra forskjellige former for populærkultur, selv om selve uttrykket kan overleve lenge etter at opphavet har sunket ned i glemselen. Fru Blom-uttrykket er selv et ypperlig eksempel på dette; det lever i beste velgående selv om lystspillet det opprinnelig kom fra er ukjent for de aller fleste.

Et uttrykk som (i alle fall for meg) fremdeles er lett å koble til sitt opphav, kommer fra Ringenes herre, og lød opprinnelig det er ikke gull alt som glimrer. Et google-søk gir oss følgende gullkorn:

  • Det er ikke fluer alt som flyr
  • det er ikke Google alt som glimrer.
  • det er ikke hyperaktivt alt som beveger seg
  • Det er ikke fett alt som glinser
  • Det er dessverre ikke lydløst alt som lukter.
  • det er ikke ost alt som smelter.
  • Det er ikke ræger alt som lukter

Sist men ikke minst:

  • Det er ikke rompehull alt som promper

Den foreløbig hypotetiske norske snowclones-databasen kommer i alle fall ikke til å mangle grove eksempler, takk og pris.

onsdag 3. september 2008

You should never buttume anything!

Geoffrey Pullum posta på Language Log i går om det som refereres til som clbuttic idiocy. Hva slags idioti er det snakk om? La meg presentere noen setninger jeg har funnet på internettet:

  • Congratulations on your self-fulfilling buttumption.
  • Let me first explore its buttumption, and then consider its factual claims.
  • Please pardon this post if it came out sounding sbutty.
  • She was too clbutty for that sh*t and never belonged.
  • YOU made the buttertion thus the burden of proof is on YOU.
  • Good news for the Consbreastution on Australia Day.

Hva er det som foregår her? Den oppvakte leser har allerede skjønt det: overivrige leksikalske filtre, også kalt nanny-bots, har vært på ferde. Mange nettsider sensurerer automatisk ord som av ulike grunner oppfattes som grove, blant dem ass og tit, og bytter dem ut med mer "familievennlige" ord, i disse tilfellene butt og breast. Problemet oppstår når slike filtre ikke bare bytter ut tekststrenger som har mellomrom før og etter seg, men strenger med de aktuelle bokstavene som er del av andre, helt uskyldige ord.

Det fins mange eksempler på nettet, som man kan finne ved å ta et ord som inneholder en av de aktuelle tekststrengene, bytte den ut med sin mindre grove motpart, og bruke google. En god del av treffene er omtale av slike fenomener, ikke bruk av selve ordene, men også selve bruken av ordene er lett å finne fram til. En av mine favoritter er buttbuttinate (og den beslektede buttbuttination), som vi ser under. En klbuttiker!

  • [D]o the acts of the human plants validate buttbuttination and torture?
  • [W]hy did the Iraq regime try to buttbuttinate George Bush?
Les mer om the clbuttic mistake her.

tirsdag 2. september 2008

Destroyed in the translation

Jeg kom over ei stilig nettside i dag (som jeg forøvrig la til i listen av linker på høyre side av bloggen). Lost in translation består av et program som lar deg taste inn ord, fraser og setninger, som den så oversetter til fem forskjellige språk, og tilbake til engelsk igjen, med en tur innom engelsk mellom hvert av de fem språkene. Frasen lost in translation ender for eksempel opp som destroyed in the translation. Prosessen er som følger:

English: Lost in translation

French: Détruit dans la traduction

English: Destroyed in the translation

German: Zerstört in der Übersetzung

English: Destroyed in the translation

Italian: Distrutto nella traduzione

English: Destroyed in the translation

Portuguese: Destruído na tradução

English: Destroyed in the translation

Spanish: Destruido en la traducción

English: Destroyed in the translation

Det er det første steget, fra engelsk til fransk, som er ansvarlig for forskjellen mellom den opprinnelige og den "ødelagte" frasen. Når frasen oversettes til fransk, kommer det inn en bestemt artikkel "la", som ikke er idiomatisk i engelsk. Valget av verbet détruit, som kan oversettes tilbake til engelsk "destroyed", er den andre tingen som gjør frasen uidiomatisk når den oversettes til engelsk igjen.

Språkene programmet sender frasene og setningene gjennom, er veldig like hverandre, noe som kan forklare hvorfor frasen over ikke led en verre skjebne enn den tross alt gjorde. Hva hvis vi i tillegg tvinger en uskyldig frase gjennom virkelig fremmede språk, som kinesisk, japansk og koreansk? Heldigvis for oss er dette en mulighet hos Lost in translation:

English Text:
Lost in translation

Japanese: 変換で失われる

English: It is lost with conversion

Chinese: 它丢失以转换

English: It loses converts

French: Il détruit des convertis

English: It destroys converted

German: Es zerstört umgewandelt

English: It destroys converted

Italian: Distrugge convertito

English: It destroys converted

Portuguese: Destrói convertido

English: It destroys converted

Spanish: Destruye convertido

English: It destroys turned

Her har det skjedd mye mer på veien enn da vi bare oversatte mellom nært beslekta språk - ingen overraskelse. Hvis vi prøver oss på en setning som can I have a cup of coffee?, får vi I can have a coffee cup? Sammensetning istedenfor den vanlige preposisjonsfrasen, og noe underlig ordstilling, men fullt forståelig for den velvillige. Med kinesisk, japansk og koreansk med på veien, blir setninga til I possibly make the examinación of the coffee?

Vi prøver oss til slutt på en litt lengre setning, et sitat fra Albert Einstein:

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former.

Resultatet blir:

Only two citizens of infinites, are the empty person of the external
time from the layer to others are stupid, I were not emergency before
an interested party.

torsdag 28. august 2008

Ny bidragsyter!

Lingvismebloggen har fått ny bidragsyter!

Min kjære medstudine Lalai Lou har nå fått tilgang til å poste på bloggen. Hun er en eksellent lingvist, så alle hjerter gleder seg!

Snowclonwes og snowclones, fru Blom!

Et språklig fenomen jeg alltid har vært svak for, kalles på engelsk snowclones. Termen, som ble funnet opp av Glen Whitman (sammen med Geoffrey K. Pullum) i 2004, refererer til "phrasal templates", frasetemplater, som kan fylles inn med morfologisk materiale.

Vent, hva? "Er dette et spennende fenomen?" tenker du kanskje. Panne har tydeligvis et annet syn på hva som er spennende enn de fleste. Ok, beskrivelsen over var relavtivt tørr, så la meg prøve å overbevise leseren om snowclonenes fortreffelighet.

At noe er en frasetemplat, betyr rett og slett at det er en setning, en frase eller lignende der noen av ordene ikke er spesifiserte - templaten inneholder tomme plasser der vi kan sette inn det vi føler for. En vanlig snowclone er denne: X is the new Y. Et trunkert Google-søk (søkestreng: "* is the new *") gir oss blant annet følgende treff:
  • pink is the new blog
  • thursday is the new friday
  • fake is the new real
  • vegetarian is the new prius
  • dead is the new alive
Vel! Who knew, som de sier. De fleste snowclones kommer fra diverse populærkultur, som filmer, tv-serier, bøker, musikk og så videre, for eksempel X, Y and Z, oh my!, som stammer fra Wizard of Oz (“Lions and tigers and bears, oh my!“). En av mine favorittsnowclones er "In Soviet Russia, X Ys you!", som stammer fra vodkaprodusenten Smirnoffs reklame “In Soviet Russia, TV watches you!”. Ifølge The Snowclones Database kalles en slik ombytting av setningsledd for "Russian Reversal".

Det er ikke bare på engelsk de har snowclones. Her er en liste over tyske varianter. Desverre finnes det ikke noe tilsvarende oversikt for norsk (men kanskje noen, og med noen mener jeg meg selv) lager det etter hvert. En av de mest populære norske frasetemplatene er gode gamle "fru Blom". Uttrykket stammer fra et lystspill (nei, jeg veit heller ikke hva et lystspill er) kalt "Karusell" fra 1940. Den opprinnelige varianten var "piller og piller, fru Blom". Etter hvert har uttrykket blitt enormt populært, og kan brukes med alle tenkelige ord og fraser. Et lite utvalg:
  • Attentatplaner og attentatplaner, fru Blom
  • Kjønn og kjønn, fru Blom
  • Spilledåse og spilledåse fru blom
  • Gruble og gruble fru blom
Uttrykket er altså "X og X, fru Blom", og betyr noe i retning av "X er ikke et særlig godt eksempel på X", eller "X er av tvilsom kvalitet". Hva norske snowclones angår, er nok "X og X, fru Blom" selve arketypen, i så stor grad at jeg tidligere har foreslått å bruke "fru Blom-uttrykk" som et norsk navn på snowclones. Med mindre et mer passende navn dukker opp. Whatever! Snowcloning is hard, let's go shopping!

fredag 22. august 2008

SVO fail!


Fakta: Man må ta hensyn til ordstilling når man lager kinoplakater.

torsdag 21. august 2008

Langackerbot!

Tidlig i sommer kom jeg via Language Log over den såkalte Chomskybot, et program som hver gang man oppdaterer siden, genererer et avsnitt med tekst som emulerer Noam Chomsky og hans skrivestil. Hvert avsnitt er bygd opp av fem setninger, og hver av disse er igjen bygd opp av en såkalt initiating phrase, en subject phrase, en verb phrase og en terminating phrase, tilfeldig valgt fra ulike lister. Disse frasene er plukket fra ting Chomsky faktisk har skrevet, så på en måte kan man si at Chomskybot faktisk genererer avsnitt forfattet av Chomsky selv -- om enn ikke på en måte han noensinne har planlagt. De som har lest ting Chomsky har skrevet, vil uten tvil kjenne igjen stilen. Forskjellen mellom Chomskybot og den ekte Chomsky er at selv om botens setninger er syntaktisk gangbare, er innholdet nonsens.

Inspirert av dette geniale verket har jeg og min partner in crime Eivind kreert en tilsvarende bot som lager avsnitt basert på en annen kjent amerikansk lingvist: Roald W. Langacker. Langacker er en av de mest kjente og innflytelsesrike kognitive lingvistene, og er ansvarlig for (blant annet) to digre mursteiner av noen bøker kalt Foundations of Cognitve Grammar I og II, der han legger fram sin kognitive grammatikk, en lingvistisk teori som legger stor vekt på betydning (i skarp kontrast til blant andre Chomsky, som ikke ser ut til å bry seg særlig om dette).

Jeg har lest, og hatt glede av, Langackers bøker, og brukt dem mye i masteroppgaven min, men selv ikke jeg kan hevde at dette er lett sengelektyre. Faktisk er noe av det mest fascinerende ved Langackerboten den litt skremmende tendensen den har til å generere avsnitt som, når jeg leser dem, bringer meg tilbake til seine kvelder på lesesalen, frenetisk bøyd over Foundations of Caognitive Grammar, mens jeg leser det samme avsnittet om og om igjen og håper at hvis jeg bare konsentrerer meg litt hardere eller drikker enda en kopp kaffe, vil jeg forstå hva i helvete denne veggen av tekst skal bety.

Boten er bygd opp etter de samme prinsippene som Chomskybot (bortsett fra at hvert avsnitt inneholder sju setninger istedenfor fem), frasene er plukket ut av meg, og koden er skrevet av Eivind i Perl. Enjoy!

LANGACKERBOT!

søndag 29. juni 2008

Min penis vil spandere deg en drink

Min venninne Mari kjøpte seg ny mobiltelefon for en stund siden, og samtidig med at hun ble den lykkelige eier av en ny telefon, ble hun den litt overraskede eier av et blad kalt "Mobilguden"; et lite hefte med bilder av bakgrunner, ringetoner og andre virtuelle greier man kan betale for å få tilsendt til mobilen sin.


Det er mye fantastisk å se i Mobilguiden, men den desidert mest fascinerende tingen er et bilde som man kan bestille og sende til vennene sine (kanskje ikke til alle vennene, det er nok et valg hver enkelt må ta). Bildet ser slik ut:


"Min penis vil gjerne spandere deg en drink" lyder bildeteksten. I tillegg til å være underholdene (og litt forstyrrende) i seg selv, er dette av lingvistisk interesse. Hvorfor? Verbet spandere har vanligvis et subjekt, et objekt og en preposisjonsfrase, som i setningen Kong Harald spanderte rusbrus på Nelson Mandela, der Kong Harald er subjekt, rusbrus er direkte objekt, og der Nelson mandela er den som blir påspandert, noe som uttrykkes ved hjelp av preposisjonen .

Så langt, så godt. Denne måten å uttrykke hvem som drar nytte av en handling, kan på norsk uttrykkes enten på denne måten, (altså ved hjelp av en preposisjon), eller ved hjelp av en ditransitivkonstruksjon. I ditransitivkonstruksjoner har vi TO objekter, et indirekte og et direkte, der det indirekte ofte kalles benefaktiv - det refererer nemlig ofte til den eller de som drar fordel av, eller nyter godt av en handling. Det mest typiske ditransitive verbet er gi, som i setningen mesterkokken ga østfoldingene en matleksjon og Einar Ludvig Jensen ga arkeologene en svært gammel pilspiss av jern*.

Hvis det hadde vært så enkelt at noen verb alltid var "ditransitive", mens andre bare var "transitive", hadde et fenomen som det vi ser eksempel på i Mobilguiden vært vrient å forklare. Hvordan kan det ha seg at et verb plutselig kan få et ekstra objekt? Har vi å gjøre med et nytt verb spandere, som ligner det gamle spandere men som er ditransitivt? Mange lingvister bruker det de kaller for konstruksjoner for å forklare slike fenomener. Uten å bli for teknisk, kan vi si at en konstruksjon er en "lært forbindelse mellom form og betydning" En slik forbindelse kan være ett enkelt ord, som sol, der en som kan norsk har lært seg at lydene [s] [u] og [l] tilsammen betyr 'den varme dingsen oppe i himmelen'. Men konstruksjoner kan også være større enn ett ord, og ha "tomme" plasser som kan fylles inn av ord man velger selv. Ditransitivkonstruksjonen er en slik konstruksjon, og vi kan framstille den på følgende måte:

[SUBJEKT / VERB / INDIREKTE OBJEKT / DIREKTE OBJEKT]

Hvilke verb som kan opptre i konstruksjonen, varierer mellom talerne. I Nord-Norge er de for eksempel veldig liberale, i hvertfall sammenlignet med meg, som bruker ganske få verb i denne konstruksjonen. De sier ting som "han kjøpte henne en genser" eller "han bakte meg ei kake", noe jeg aldri ville funnet på. Det som gjør at mange vil stusse over "min penis vil gjerne spandere deg en drink" (bortsett fra at peniser vanligvis ikke kjøper drinker til folk), er at verbet spandere ikke pleier å forekomme i konstruksjonen. Vi skjønner likevel hva det skal bety, fordi vi kjenner konstruksjonen, som har en fast betydning.




*setningene er funnet ved et Google-søk i norske sider på strengen "* ga * en *" (var det forøvrig bare meg som leste pil-spiss som pils-piss?)

tirsdag 3. juni 2008

Masteroppgaven er ferdig!

Endelig er jeg ferdig med masteroppgaven! Jeg leverte den i går, mandag 2. juni, etter en litt stresset innspurt. Tittelen ble "Skal vi sittedanse?" - Verb-verb-sammensetninger i norsk. Den kommer til å være tilgjengelig i DUO (på UiO sine nettsider), men i første omgang vil jeg få presentere oppgaven i form av en Dinosaur Comic:

onsdag 21. mai 2008

Lurefising

På norsk har vi muligheten til å kombinere to verb til en sammensetning (som jeg skriver om i masteroppgaven min). Mens jeg samlet inn slike verb fra internettet, kom jeg over sammensetningen lurefise, som tydeligvis betyr noe sånt som 'å fise lydløst' eller 'fise uten at noen merker noe (med en gang), jfr. følgende eksempel (fra www.gjemmesiden.net/sitater.php?sitat=3)


"Je bare står her å lurefise je. Hvem trur døkk merke det først?”

Her har altså en taler av norsk tatt det på seg å fylle et leksikalsk hull - et fenomen som vi ikke tidligere har hatt et ord for, har fått sitt (sårt tiltrengte) navn. Og det er ikke bare nordmenn som føler behov for et slikt ord. På paama, et austronesisk språk talt på Vanuatu, har de en konstruksjon som minner om den norske:

sii visau
fart do.inaudibly
'fart inaudibly'

(Eksempel hentet fra Crowley (2006): Serial verbs in Oceanic. A desriptive typology. Oxford University press. )


Nå skal jeg ikke bli helt Sapir-Whorf her, men hva med å sende en komparativ fise-antropolog på feltarbeid til både Norge og Vanuatu? Bare et forslag.

søndag 18. mai 2008

Er Hammerfest Canberra?

Language Log har en post om Googles automatiske oversettelsesfunksjon idag. Norsk er ett av språkene som google nå tilbyr automatisk oversettelse til og fra, noe som innbød til eksperimentering. Language Log har tidligere beskrevet underlige fenomener som oppstår når man oversetter stedsnavn, så jeg bestemte meg for å se hvordan dette fungerer på norsk. Hilarity ensued!

Bergen er for eksempel norges svar på Houston!


Mens andre byer blir mer eksotiske på veien fra norsk til engelsk:




Hva med andre byer nord i landet? Stakkars Bodø er visst ikke engang verdig et egennavn på engelsk:


Sorry bodøværinger! Dere kan trøste dere med at den aller mest bisarre (og skumle) oversettelsen av et stedsnavn, finner vi for min hjemplass, Kvinesdal:


Wow.