1. La sfida
La variazione è una delle più grandi sfide della linguistica: è l'espressione permanente ed evidente del cambiamento linguistico e quindi si contrappone alle teorie che presuppongono sistemi funzionali omogenei e consistenti. Questo perché le sezioni dinamiche della realtà sociale non sono facili da modellare. Sebbene alcune proposte, in particolare quella di Koch/Oesterreicher 1990, si siano affermate, non si tratta di soluzioni definitive. Piuttosto, è opportuno portare avanti la discussione. Occorre considerare tre aree: le dimensioni della variazione (DEFAULT), la crescente base empirica (DEFAULT) e lo sviluppo dei media virtuali (DEFAULT).
2. Le dimensioni della variazione
Lo schema di base della variazione può essere formulato in modo universale e si può applicare a numerose discipline: una variante astratta appare in più varianti concrete. Ciò significa che le varianti sono prodotte materialmente e possono essere percepite, mentre la variabile è un costrutto teorico che si sottrae alla percezione immediata. Le varianti linguistiche hanno una forma articolata e auditiva e un contenuto comprensibile; sono oggetto della cognizione individuale. Sia la forma che il contenuto possono variare. Ecco un esempio:
2.1. Schema elementare della variazione: variabili e varianti
variabile (astratta) |
varianti (concrete) | ||
forma | contenuto | ||
participio passato di vedere | perduto | oggetto alienabile non più a disposizione ha perso/perduto una chiave |
oggetto inalienabile non più a disposizione ha perso/perduto una gamba |
perso | |||
Tabella 1: una variabile con varianti |
Il contenuto delle forme linguistiche è complesso perché comprende una funzione grammaticale (appartenenza a una parte di discorso) e un significato lessicale. Inoltre, sono associate a numerose varianti anche informazioni supplementari che le caratterizzano nella cognizione del locutore. Queste varianti sono dette marcate.
2.2. Varianti marcate e non marcate
contenuto | ||||
funzione sistemica | significato lessicale |
informazione supplementare (marcatura) |
||
variante | non marcata | + | + | |
marcata | + | + | + | |
Tabella 2: contenuto più complesso delle varianti marcate |
Le informazioni supplementari che specificano la marcatura sono assegnate a diverse dimensioni di variazione, cioè:
- origine regionale/locale dell parola (diatopico)
- ceto sociale del locutore/della locutrice (diastratico)
- situazione communicativa (diafasico/stilistico)
- età del locutore/della locutrice (diagenerazionale)
- sesso del locutore/della locutrice (diasessuale)
- media usati (diamesico): orale spontaneo (-) vs. media (+); termine ‘diamesico’ per qualisiasi tipo di produzione linguistica (lingua scritta e lingua parlata) fuorviante
⇒ il parlare a voce autentica (uso orale non generato da tecnologie) ≠ mediale (nessun media impiegato)
‘diamesico’ | media |
orale spontaneo | - |
orale sintetizzato | + |
scritto (a mano, stampato, digitato) | |
Tabella 3: ‘diamesico’ - un termine fuorviante |
Va aggiunta la competenza del locutore/della locutrice, ossia l'acquisizione della lingua come L1 / L2, e il suo repertorio che può essere monolingue, bilingue o plurilingue.
2.2.1. Esempio
Le designazioni per ‘persona maschile giovane’ forniscono un esempio illustrativo:
variabile (significato) |
varianti | ||
non marcato | marcato | ||
dimensione | |||
‘persona maschile giovane’ | ragazzo | ||
guaglione | diatop. (NA) | ||
toso | diatop. (sett.) | ||
monello | ? | ||
Tabella 4: variabile con varianti marcate e non marcate |
I grandi dizionari danno spesso informazioni sulla marcatura. Tuttavia, non ci si può fidare e non è raro che le informazioni rilevanti manchino. Si solleva dunque la questione fondamentale di come si possa determinare la marcatura di un’unità lessicale o di una costruzione. La linguistica percezionale offre risposte sotto forma di vari test e metodi di raccolta dei dati.
come scoprire le marcature e attribuirle alle varianti? ⇒ linguistica percezionale (cf. Long/Preston 2002, Long/Preston 2003, D'Agostino 2002, Krefeld/Pustka 2010f, Krefeld/Pustka 2014b, Krefeld/Pustka 2024a, Pustka/Chalier/Jansen 2024) |
Alla luce della linguistica percezionale, la marcatura si rivela dipendente dal soggetto. Soprattutto, occorre distinguere due prospettive, quella interna o emica, cioè degli infomanti che usano loro stessi le rispettive forme (autopercezione) e quella esterna o etica, ossia degli informanti che le conoscono solo da altri parlanti o forse non le conoscono affatto (eteropercezione). Possiamo allora precisare la tabella 2:
contenuto | ||||||
funzione sistemica | significato lessicale |
informazione supplementare (marcatura) |
||||
emica | e/o | etica | ||||
variante | non marcata | + | + | |||
marcata | + | + | +/- | +/- | ||
Tabella 5: contenuto più complesso delle varianti marcate |
Le differenze tra percezioni emiche ed etiche sono molto interessanti perché richiamano l'attenzione sulle variazioni regionali nella lingua standard: Le caratteristiche corrispondenti non sono marcate nella prospettiva emica, ma sono marcate diatopicamente nella prospettiva etica. Un possibile esempio (da verificare con test) è l'uso settentrionale dell'articolo definito prima dei nomi maschili:
variabile: uso dei nomi maschili |
senza articolo | con articolo | marcatura | |||
emica | e/o | etica | ||||
variante | non marcata | Carlo (non c’è) | ||||
marcata | il Carlo (non c’è) | - diatop. (?) + diafas. (?) |
+ diatop. (?) - diafas. (?) |
|||
Tabella 6: esempio ipotetico di marcatura emica e/o etica |
2.3. Varietà
La tradizione della varietistica si è affermata nel contesto germanofono della romanistica con l'etichetta ‘Varietätenlinguistik’ e non con quella più generale di ‘Variationslinguistik’ (usata piuttosto nella germanistica). L'obiettivo specifico della ‘Varietätenlinguistik’ è proprio la descrizione (o meglio: la costruzione) di varietà, cioè di gruppi di varianti con marcature della stessa dimensione, generalmente cooccorrenti nei discorsi e testi (cf. Dufter/Stark 2003). La tabella seguente dà alcuni nomi di varietà frequenti:
alcune dimensioni di marcatura | alcuni nomi di varietà | |
spazio/localizzazione (diatopico) | → | dialetto |
ceto sociale (diastratico) | → | socioletto |
situazione communicativa (diafasico/stilistico) | → | stile |
modo di produzione (voce autentica - media) | → | parlato - scritto, spedito |
Tabella 7: dimensioni di variazione e varietà correspondenti |
Sembra essere però una concezione semplicista perché esistono varietà ibride costituite da marcature pluridimensionali, come i dialetti o anche il linguaggio parlato. La ‘Varietätenlinguistik’ era il prodotto di uno sviluppo paradossale. Il modello e il prototipo della varietà erano i dialetti, la cui esistenza è sempre stata evidente. Successivamente, anche i dialetti sono stati classificati come varietà, come fosse evidente, e nello stesso tempo, la dialettologia veniva integrata alla linguistica delle varietà:
Questo passaggio è ingannevole sotto due aspetti:
(1) I dialetti sono sostanzialmente diversi dalle altre varietà perché rappresentano sistemi semiotici completi; sono intere lingua caratterizzate anche da una variazione interna più o meno vistosa.
(2) La variazione nello spazio, cioè le varianti con marcatura diatopica, riguarda non solo i dialetti ma anche lo standard che è regionale fin a un certo punto.
Ma la linguistica delle varietà ha avuto un forte impatto anche sulla metodologia dialettologica, dando vita a una dialettologia pluridimensionale (cf. Thun u.a. 1989, ALS, Sottile 2019a, AsiCa2.0, ALiB). In definitiva, però, si dovrebbe parlare di una geolinguistica pluridimensionale o, meglio ancora, di una varietistica dello spazio comunicativo:
3. Dati empirici
Quando la linguistica delle varietà è nata, esistevano solo pochissimi corpora che si dovevano analizzare manualmente. Nel frattempo, la quantità del materiale parlato è aumentata enormemente. Alcuni di questi sono corpora stampati, altri sono disponibili online. Inoltre, esistono ampie quantità di dati che non sono generalmente accessibili (come i corpora dell’ALS). Una panoramica dei corpora italiani molto utile (però non più aggiornata da qualche anno) si trova ai seguenti siti della FU di Berlino:
4. La visione di una piattaforma FAIR
La quantità di dati raccolti è in netto contrasto con la loro eterogeneità e spesso scarsa accessibilità. La situazione di alcuni corpora più recenti è particolarmente precaria. Un esempio famoso è proprio il primo corpus dell’italiano parlato, che ha costituito la base del Lessico di frequenza dell’italiano parlato (LIP), curato da Tullio De Mauro. È stato pubblicato su cd-rom come supplemento al dizionario stampato, cosa decisamente innovativa per l'epoca (1993). Ciò che manca alla ricerca è una struttura online che riunisca tutti i possibili corpora, siano essi già digitali o originariamente stampati e retrodigitalizzati, e che sia allo stesso tempo aperta ad ospitare corpora futuri. Una tale piattaforma ideale, ma tecnicamente realizzabile (cf. Krefeld/Lücke 2023), sarebbe un osservatorio online dell’italiano attuale.
La condizione: essere FAIR
Molti progetti potrebbero contribuire alla sostanza dell'osservatorio. Ma il vero obiettivo non sono i progetti in sé, bensì i singoli dati che forniscono. Il requisito fondamentale è quello di trasformare ogni singolo dato - ogni tipo lessicale e ogni costruzione - in oggetti digitali indipendenti che possono essere trattati singolarmente. In altre parole, i corpora devono essere preparati per un uso generale sul web. Le condizioni tecniche e giuridiche corrispondenti sono definite dai cosiddetti principi FAIR (cf. Krefeld/Lücke 2023a). Questo acronimo inglese è composto dalle prime lettere di quattro concetti fondamentali per la gestione dei dati di ricerca: essi richiedono che i dati siano Findable ‘rintracciabili’ (F), Accessible ‘accessibili’ (A), Interoperable ‘interoperabili’ (I) e Reusable ‘riutilizzabili’ (R).
4.1. Un esempio: il lessotipo guaglione/guagliona
Il modo in cui queste regole normative vengono affrontate sarà illustrato di seguito con l'esempio del lessotipo guaglione. Ci si chiede quale status varietistico possa essere attribuito a questo tipo sulla base dei dati disponibili.
Da un lato ne troviamo parecchie tracce in internet, come mostrano le occorrenze (selezionate) nella tabella seguente:
Dall’altro canto esistono tracce non connesse, come nel caso illustrativo del già menzionato LIP, ora consultabili al sito VoLIP4:
"Il corpus [= VoLIP ; ThK] presenta varietà diafasiche, diatopiche e diamesiche.
Per quanto riguarda la variazione diafasica e diamesica, i testi sono suddivisi in 5 gruppi: A) conversazioni faccia a faccia; B) conversazioni telefoniche; C) scambi comunicativi bidirezionali con alternanza di turno predefinita, come interviste, dibattiti, interazioni in aule scolastiche, esami orali, ecc.; D) monologhi, come letture, sermoni, discorsi, ecc.; E) programmi radiofonici e televisivi. I testi contenuti nei gruppi A e B appartengono a registri sia formali sia informali, mentre i testi dei gruppi C, D ed E sono registrati prevalentemente in contesti pubblici, in cui si adottano registri formali." (https://www.volip.it/)
A un esame più attento questo portale fornisce una sola statistica per le 4 sezioni di Milano, Firenze, Roma e Napoli:
[variable guaglione/guaglione]
Interroga per Lemmi e Forme [voce guaglione] |
||||||||
---|---|---|---|---|---|---|---|---|
Pos | Lemma | Form | A | B | C | D | E | Total |
Noun | GUAGLIONE | @guagliuni@ | 0 | 1 | 0 | 0 | 0 | 1 |
Noun | GUAGLIONE | @guaglio'@ | 0 | 1 | 0 | 0 | 0 | 1 |
Noun | GUAGLIONE | @guaglione@ | 0 | 0 | 1 | 0 | 0 | 1 |
Noun | GUAGLIONE | @guagliune@ | 0 | 1 | 0 | 0 | 0 | 1 |
Interroga per Lemmi e Forme [voce guagliona] | ||||||||
Noun | GUAGLIONA | @guagliona@ | 2 | 1 | 0 | 0 | 0 | 3 |
Noun | GUAGLIONA | @guaglione@ | 0 | 1 | 0 | 0 | 0 | 1 |
Tabella 9: varianti del lessotipo guaglione/guagliona nel corpus LIP <https://www.volip.it/interroga-per-lemmi-e-forme/risultati> |
Se diamo un’occhiata ai contesti, in cui il lessotipo è documentato vengono fuori bei materiali per una eventuale applicazione percezionale, se ci si concentra sulle varianti cooccorrenti di guaglione. In un testo giornalistico menzionato nella tabella che usa guaglione con marcatura dialettale implicita (NA; https://www.radionapoli.it/encyclopedia/guaglione/) spicca l’uso del passato remoto:
"Che la storia di Guaglione sarebbe stata quella di una canzone di successo si capì sin dal suo debutto. Composto da Nicola Salerno (Nisa) e Giuseppe Fanciulli, il brano trionfò al Festival di Napoli del 1956, cantato da Grazia Gresi e Aurelio Fierro, che ne fece un suo cavallo di battaglia dopo aver lanciato, due anni prima, anche Scapricciatiello.
La sua immediata popolarità fu senza dubbio agevolata dall’arrangiamento musicale, centrato su una melodia molto orecchiabile e su uno spensierato andamento a tempo di fox moderato. Anche per questo entrò subito in hit parade, risultando poi il secondo tra i singoli più venduti di quell’anno, preceduta da Maruzzella.
Come era prassi in quel periodo per i brani di successo, Guaglione ispirò un film, omonimo, diretto da Giorgio Simonelli e con un giovane Terence Hill nei panni del protagonista. Nella pellicola l’esecuzione della title-track è affidata a Claudio Villa: il Reuccio canta davanti ad un locale di piazza dei Martiri, accompagnato dai “posteggiatori” Raffaele e Mario Vezza. Il film ebbe un ottimo riscontro di pubblico, tanto che nel 1958 ne fu realizzato un sequel, intitolato “Non sono più guaglione”, con Sylva Coscina. [...]"
Si pone immediatamente la questione di sapere quale marcatura debba essere attribuito al passato remoto, Diatopica, perché il tempo è usato molto frequentemente in napoletano e nell'italiano regionale meridionalein genere, o diafasica, perché corrisponde allo standard tradizionale della lingua scritta?
Sarebbe inoltre interessante sapere se il passato remoto nell'autopercezione emica (a differenza dell'eteropercezione etica) sia marcato o meno e per che tipo di parlante ecc
4.2. La doppia prospettiva di un osservatorio variazionale ipotetico
Per concludere, c è da segnalare un'altra opzione che un osservatorio online dovrebbe offrire, ovvero una doppia direzione di interrogazione che tenga conto sia della semasiologia che dell'onomasiologia. Il primo permette la ricerca di forme linguistiche e fornisce i contenuti associati, mentre il secondo permette la ricerca di contenuti (funzioni e concetti) in senso opposto e fornisce le forme linguistiche associate. Entrambe le direzioni d'interogazione devono basarsi su unità di riferimento che abbiano un valore generale e indipendente dai singoli progetti. Queste unità di riferimento sono dette dati di autorità (in ted. Normdaten). Al livello semasiologico, una buona parte di esse può essere ricavata dai grandi dizionari (cfr. i lessici della tabella 9). Sarebbe però meglio di servirsi di identificatori indipendenti da pubblicazioni commerciali (editoria classica) come sono i LIDs dei progetti Wikimedia. L'ultima tabella indica il cammino che dovremmo seguire:
variabile (lessotipo) |
Wikidata property |
varianti |
|
forma | referenza | ||
guaglione LID |
‘variety [‘Variante’] of lexeme, form or sense’, QID: https://www.wikidata.org/wiki/Property:P7481 |
guagliune LID |
TEENAGER QID |
guagliò LID |
|||
↑ semasiologico |
↑ onomasiologico |
||
filtri di ricerca |
|||
Tabella 10: Schema della variazione applicata a Wikidata |
Bibliografia
- ALiB = Cardoso, Suzana Alice Marcelino da Silva / Mota, Jacyra Andrade / Aguilera, Vanderci de Andrade / Aragão, Maria do Socorro Silva de / Isquerdo, Aparecida Negri / Razky, Abdelhak / Margotti, Felício Wessling / Altenhofen, Cléo Vilson (2014-): Atlas linguístico do Brasil, Londrina, Eduel (Link).
- ALS = Ruffino, Giovanni (a cura di) (1991-): Atlante linguistico della Sicilia, Palermo, Centro di studi filologici e linguistici siciliani.
- AsiCa2.0 = Krefeld, Thomas / Lücke, Stephan (a cura di) (2019): Atlante sintattico della Calabria. Rielaborato tecnicamenta da Veronika Gacia e Tobias Englmeier, München, online, LMU (Link).
- Battaglia 1961-2002 = Battaglia, Salvatore (1961-2002): Grande dizionario della lingua italiana, 21 Bände, Supplement (2004) und (2009), Turin, UTET (Link).
- Becker/Herling/Wochele 2024 = Becker, Lidia / Herling, Sandra / Wochele, Holger (a cura di) (2024): Manuel de linguistique populaire, Berlin, de Gruyter.
- CLIP = De Mauro, Tullio / Mancini, Federico / Vedovelli, Massimo / Voghera, Miriam (1993): Corpus del Lessico di frequenza dell'italiano parlato. , in: BaDIP, Milano, Etas (Link).
- Coseriu 1980 = Coseriu, Eugenio (1980): "Historische Sprache" und "Dialekt", in: Göschel, Joachim (a cura di), Dialekt und Dialektologie, Wiesbaden, Steiner, 106–122.
- Coseriu 1988 = Coseriu, Eugenio (1988): Einführung in die Allgemeine Sprachwissenschaft, Tübingen, Francke.
- D'Agostino 2002 = D'Agostino, Mari (2002): Percezione dello spazio, spazio della percezione la variazione linguistica fra nuovi e vecchi strumenti di analisi, Palermo, Centro di Studi Filologici e Linguistici Siciliani.
- De Mauro = De Mauro, Tullio: Il Nuovo De Mauro, Rom, Internazionale (Link).
- Dufter/Stark 2003 = Dufter, Andreas / Stark, Elisabeth (2003): La variété des variétés: combien de dimensions pour la description?, in: Romanistisches Jahrbuch, vol. 53, 81-102.
- Harjus/Meisnitzer 2024 = Harjus, Jannis / Meisnitzer, Benjamin (a cura di) (2024): Representações e perceções das variedades portuguesas no mundo lusófono, Berlin, Lang.
- Koch/Oesterreicher 1990 = Koch, Peter / Oesterreicher, Wulf (1990): Gesprochene Sprache in der Romania.[Romanistische Arbeitshefte 31], in: Tübingen, Niemeyer.
- Krefeld 2018a = Krefeld, Thomas (2018): Varietà ibride? – Che cosa ne pensa la linguistica variazionale. Version 1 (1.03.2018, 12:46), in: Korpus im Text (KiT), online (Link).
- Krefeld/Lücke 2020b = Krefeld, Thomas / Lücke, Stephan (2020): FAIRness: ein contrat social für die Wissenschaftskommunikation im Internet, in: Romanistik-Blog des Fachinformationsdienstes, AG Digitale Romanistik (Link).
- Krefeld/Lücke 2023 = Krefeld, Thomas / Lücke, Stephan (2023): Sketching out a Virtual Framework for Romance Geolinguistics,, in: Weiland / Quijada van den Berghe / Pustka (2023).
- Krefeld/Lücke 2023a = Krefeld, Thomas / Lücke, Stephan (2023): FAIRNESS – Medien im methodologischen Zentrum der Geolinguistik, in: Krefeld/Lücke/Mutter 2023, München (Link).
- Krefeld/Pustka 2010f = Krefeld, Thomas / Pustka, Elissa (2010): Perzeptive Varietaetenlinguistik: Redaktion: Noemi Piredda und Sebastian Postlep, vol. 8, Peter Lang.
- Krefeld/Pustka 2014b = Krefeld, Thomas / Pustka, Elissa (a cura di) (2014): Perzeptive Linguistik: Phonetik, Semantik, Varietäten, in: Zeitschrift für Dialektologie und Linguistik Beihefte, vol. 157, Stuttgart, Steiner.
- Krefeld/Pustka 2024a = Krefeld, Thomas / Pustka, Elissa (2024): A cognitive approach to language varieties, in: Meisnitzer/Harjus 2024, 37-56.
- LIP = De Mauro, Tullio / Mancini, Federico / Vedovelli, Massimo / Voghera, Miriam (1993): Lessico di frequenza dell’italiano parlato, Milano, Etaslibri.
- Long/Preston 2002 = Long, Daniel / Preston, Dennis R (2002): Handbook of perceptual dialectology, vol. 2, John Benjamins Publishing.
- Long/Preston 2003 = Long, Daniel / Preston, Dennis (a cura di) (2003): Handbook of Perceptual Dialectology II, Amsterdam, John Benjamins Publishing.
- Pustka/Chalier/Jansen 2024 = Pustka, Elissa / Chalier, Marc / Jansen, Luise (2024): Entretiens, questionnaires et tests de perceptions, in: Becker u.a. 2024, 157-177.
- Sottile 2019a = Sottile, Roberto (2019): L’Atlante Linguistico della Sicilia (ALS), in: Krefeld/Bauer 2018, München (Link).
- Thun u.a. 1989 = Thun, Harald / Forte, Carlos E / Elizaincín, Adolfo (1989): El Atlas lingüístico Diatópico y Diastrático del Uruguay (ADDU). Presentación de un proyecto, in: Iberoromania, vol. 1989, 30, 26-62.
- VerbaAlpina = Krefeld, Thomas / Lücke, Stephan (2014-2023): VerbaAlpina. Der alpine Kulturraum im Spiegel seiner Mehrsprachigkeit, München, LMU (Link).
- VoLIP = De Rosa, Aurelio / Alfano, Iolanda: Il corpus VoLIP (Voce del LIP), 2014 (Link).