Obiettivo della presente proposta è la descrizione degli sviluppi di un progetto per la costruzione di un centro di documentazione sui temi dell’efficienza energetica e dell’applicazione di fonti rinnovabili agli usi finali civili. Tra gli scopi del progetto rientra la realizzazione di strutture di accesso e di organizzazione della conoscenza al fine di sopperire all’assenza in Italia di strumenti omogenei di classificazione e di controllo terminologico e di gestire fenomeni quali l’evoluzione linguistica, tecnica e normativa e la presenza di varianti locali. In particolare, si tratta di costruire un lessico specialistico condiviso tra i soggetti della filiera e un thesaurus che controlli l’uso dei termini e che consenta l’accesso all’informazione e la classificazione univoca dei concetti. La prima fase per realizzare tali strumenti ha previsto la raccolta dei documenti dai quali estrarre i termini e la loro organizzazione in corpora. Si tratta di testi in lingua italiana, la cui copertura temporale è riferita all’ultimo quinquennio, affinché sia garantita la presenza di termini relativi alle tecnologie e ai materiali più innovativi, e appartenenti a diverse tipologie, quali articoli scientifici, riviste, leggi, norme, ecc., e a diversi contesti regionali. La loro eterogeneità ha permesso di estrarre termini specialistici e termini appartenenti al linguaggio comune, tra i quali, nel thesaurus, saranno stabilite delle relazioni di equivalenza. I documenti sono stati raggruppati in sottocorpora affinché possa essere valutata la frequenza dei termini e il rapporto tra termini specialistici e comuni in ciascuno di essi. L’estrazione terminologica è stata realizzata tramite il software T2K e risultati interessanti emergono anche dal confronto tra le liste terminologiche ottenute stabilendo soglie di frequenza diverse per lo stesso corpus. La valutazione manuale dei candidati a termine restituiti dal tool permette di ritenere solo i termini rappresentativi del dominio e di organizzarli nel thesaurus tramite un set di categorie e tramite relazioni semantiche standard. In riferimento ad alcune scelte terminologiche, ci si propone di procedere parallelamente alle ricerche condotte dall’UNI e finalizzate alla codifica univoca di opere, attività e risorse nel settore dell’edilizia. Nella norma, la denominazione univoca prevede l’assegnazione di un nome complesso, costituito da un codice, dal nome comune e dalle caratteristiche identificative dell’oggetto di interesse, mentre la descrizione prevede la definizione di caratteristiche non identificative dell’oggetto stesso. Un possibile parallelismo potrebbe essere stabilito con la gestione dei termini composti, anche in riferimento alla loro introduzione nel thesaurus.
Terminologia, lessici specialistici e strutture tassonomiche nel dominio dell’efficienza energetica e dell’applicazione di fonti rinnovabili agli usi finali civili
Folino A.
;
2010-01-01
Abstract
Obiettivo della presente proposta è la descrizione degli sviluppi di un progetto per la costruzione di un centro di documentazione sui temi dell’efficienza energetica e dell’applicazione di fonti rinnovabili agli usi finali civili. Tra gli scopi del progetto rientra la realizzazione di strutture di accesso e di organizzazione della conoscenza al fine di sopperire all’assenza in Italia di strumenti omogenei di classificazione e di controllo terminologico e di gestire fenomeni quali l’evoluzione linguistica, tecnica e normativa e la presenza di varianti locali. In particolare, si tratta di costruire un lessico specialistico condiviso tra i soggetti della filiera e un thesaurus che controlli l’uso dei termini e che consenta l’accesso all’informazione e la classificazione univoca dei concetti. La prima fase per realizzare tali strumenti ha previsto la raccolta dei documenti dai quali estrarre i termini e la loro organizzazione in corpora. Si tratta di testi in lingua italiana, la cui copertura temporale è riferita all’ultimo quinquennio, affinché sia garantita la presenza di termini relativi alle tecnologie e ai materiali più innovativi, e appartenenti a diverse tipologie, quali articoli scientifici, riviste, leggi, norme, ecc., e a diversi contesti regionali. La loro eterogeneità ha permesso di estrarre termini specialistici e termini appartenenti al linguaggio comune, tra i quali, nel thesaurus, saranno stabilite delle relazioni di equivalenza. I documenti sono stati raggruppati in sottocorpora affinché possa essere valutata la frequenza dei termini e il rapporto tra termini specialistici e comuni in ciascuno di essi. L’estrazione terminologica è stata realizzata tramite il software T2K e risultati interessanti emergono anche dal confronto tra le liste terminologiche ottenute stabilendo soglie di frequenza diverse per lo stesso corpus. La valutazione manuale dei candidati a termine restituiti dal tool permette di ritenere solo i termini rappresentativi del dominio e di organizzarli nel thesaurus tramite un set di categorie e tramite relazioni semantiche standard. In riferimento ad alcune scelte terminologiche, ci si propone di procedere parallelamente alle ricerche condotte dall’UNI e finalizzate alla codifica univoca di opere, attività e risorse nel settore dell’edilizia. Nella norma, la denominazione univoca prevede l’assegnazione di un nome complesso, costituito da un codice, dal nome comune e dalle caratteristiche identificative dell’oggetto di interesse, mentre la descrizione prevede la definizione di caratteristiche non identificative dell’oggetto stesso. Un possibile parallelismo potrebbe essere stabilito con la gestione dei termini composti, anche in riferimento alla loro introduzione nel thesaurus.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.