Daniele Masini
Sito aggiornato al 2021-11-04 21:04:33 UTC Ultima visualizzazione di questa pagina: 2024-05-02 04:30:14 UTC
No al TC

Il formato dei dati

In Internet, ovvero nella rete telematica mondiale, è possibile scambiarsi informazioni secondo determinati protocolli standard (a livello applicazione) come l'HTTP (HyperText Transfer Protocol), il SMTP (Simple Mail Transfer Protocol), il FTP (File Transfer Protocol), ...
Le informazioni scambiate possono essere le più svariate, pertanto i file in cui esse sono contenute potranno avere ognuno un formato adeguato a contenere l'informazione specifica. L'unico limite allo scambio di informazioni è rappresentato dal formato dei dati utilizzato per lo scambio delle stesse. Infatti, poiché su Internet sono collegate macchine sulle quali possono essere installati sistemi operativi diversi tra loro, è possibile che non tutti siano in grado di interpretare determinati formati di file, ovvero leggere l'informazione trasmessa, poiché le applicazioni in grado di leggere/scrivere determinati formati di file possono non essere state sviluppate per alcuni sistemi operativi o perché il formato con il quale viene trasportata l'informazione in questione è un formato proprietario e chi ne detiene i diritti non ha rilasciato al pubblico la struttura dello stesso.

I documenti

Il formato standard per la visualizzazione dei documenti (o pagine web) su Internet è l'HTML (HyperText Markup Language). I file scritti con tale formato sono essenzialmente file di testo contenenti delle direttive dette tag che specificano il modo in cui devono essere visualizzate le varie parti del documento. Ad esempio, il tag <head> indica l'intestazione della pagina, il tag <body> indica il corpo della pagina, il tag <title>, all'interno dell'intestazione della pagina indica il titolo della pagina stessa, che sarà visualizzato sulla barra del titolo del browser...
I produttori di browser, hanno ampliato notevolmente l'insieme dei tag interpretabili ognuno dal proprio browser. Ma come essere sicuri che una pagina web visualizzata con un browser abbia lo stesso layout visualizzato con un altro browser (a parte eventuali differenze minime)? A tal proposito è nato un consorzio, il W3C (World Wide Web Consortium) con l'intento di standardizzare il linguaggio HTML. L'ultima versione è la 5.2 e la guida di riferimento è reperibile presso il W3C.
Il PDF (Portable Document Format), ideato da Adobe è divenuto lo standard de facto per lo scambio di documenti di elevata qualità tipografica. Infatti, Adobe ha sviluppato, per vari sistemi operativi, il prodotto Acrobat Reader, un'applicazione in grado di leggere documenti in formato PDF, e l'ha resa disponibile gratuitamente fin dalla sua prima uscita. Inoltre le specifiche di tale formato sono state rese pubbliche e quindi chiunque è in grado di farlo può realizzare un'applicazione che visualizza il contenuto di un file in formato PDF. Dunque è possibile visualizzare file in formato PDF praticamente su qualsiasi sistema operativo.
Il PostScript (PS) è un formato utilizzato dalle stampanti per la stampa di documenti con qualità elevata. Sono stati sviluppati successivamente dei software (ad es. GhostView) in grado di visualizzare sullo schermo il contenuto dei file scritti in tale formato, in maniera da renderne fruibile il contenuto anche per la visualizzazione sullo schermo con vari sistemi operativi.
Il formato ASCII (American Standard Code for Information Interchange) è il formato dei comuni file di testo. Esso associa ad ogni carattere alfanumerico un codice di 1 byte. L'ASCII standard codifica soltanto i caratteri alfanumerici, segni di punteggiatura, qualche simbolo e dei caratteri di controllo, e quindi può essere utilizzato da tutti coloro che usano i caratteri alfabetici latini. Rimangono comunque escluse da tale formato le lettere accentate (es. à, è, é, ...) e per questo motivo sono nate delle estensioni al codice ASCII standard (una per ogni lingua) che però sono tra loro incompatibili. L'ASCII è da considerarsi un formato standard, in quanto quasi tutti, per non dire tutti, i sistemi operativi sono in grado di gestirlo opportunamente, sempre che si tratti di ASCII standard (non esteso).
L'Open Document (ODF), standard ISO (ISO/IEC 26300) e UNI (UNI CEI ISO/IEC 26300), è un formato aperto per la scrittura di documenti. Lanciato dall'ormai conosciuta suite open source per l'ufficio OpenOffice.org, sta diventando un altro dei più diffusi formati per lo scambio di documenti (le amministrazioni pubbliche di vari Paesi già lo hanno adottato, come ad esempio l'Olanda, il Beglio, il Giappone, e la stessa Unione Europea lo ha raccomandato come base per formati di file per lo scambio di documenti). Sembra che anche Microsoft abbia deciso di integrare la gestione di tale formato di documenti all'interno del proprio prodotto Office (http://punto-informatico.it/p.aspx?i=2296565).
Altri formati sono da ritenersi poco portabili, cioè non è detto che chi ottiene un file in un certo formato (ad es. scaricandolo da un sito web o ricevendolo per posta elettronica), differente da quelli precedentemente menzionati, sia in grado di visualizzarlo sulla propria macchina ed inoltre, se riesce a farlo, può darsi che la visualizzazione del contenuto dello stesso non corrisponda esattamente a quella "originale" impostata dall'autore. Ad esempio, i documenti memorizzati in formato Microsoft Word (file con estensione .doc), un formato non pubblico, possono avere problemi nella visualizzazione con versioni meno recenti dello stesso prodotto. Microsoft si ritiene il diritto di modificare quando e come vuole il formato dei file salvati con il suo programma di elaborazione di testi, pertanto ciò vuol dire che potrebbe essere possibile che i file salvati con la versione X di Word siano illeggibili dalla versione X+1. Quindi i file .doc non sono da pubblicare sui siti web e comunque sono da ritenersi utilizzabili soltanto da chi ha il software in grado di visualizzarli. Inoltre, poiché si tratta di un formato proprietario chiuso, l'utente non saprà quali informazioni vengono memorizzate nel documento, oltre al testo visualizzato sullo schermo...
Estendendo il discorso dai documenti di testo a tutti i documenti in formato elettronico in senso lato (immagini, filmati, registrazioni sonore, ...) si hanno standard di formati, ognuno relativo ad un settore specifico: immagine, audio, video, ... Ad esempio, per le immagini sono da preferirsi i formati aperti come Joint Photographic Expert Group (JPEG) e Portable Network Graphics (PNG), mentre per l'audio uno dei formati aperti più diffusi è Ogg Vorbis (file con estensione .ogg).
Per i motivi sopra accennati, in generale per la memorizzazione e l'interscambio dei dati sono ovviamente da preferirsi i formati aperti o comunque pubblici.

Le comunicazioni

Generalmente le comunicazioni telematiche avvengono per mezzo di software che utilizza protocolli pubblici: posta elettronica (SMTP, POP), XML, ...
Ad oggi esistono anche comunicazioni vocali che vengono veicolate sul protocollo IP (uno dei protocolli della suite TCP/IP), cioè il cosiddetto VoIP (voice over IP). Per fare tale operazione esistono delle specifiche relative a standard pubblici come SIP (Session Initiation Protocol) di IETF o H.323 di ITU.
Esistono anche software per la comunicazione che, al posto di specifiche pubbliche, utilizzano dei formati proprietari chiusi (v. Skype). In tal caso, si può essere sicuri delle informazioni effettivamente trasmesse dal software?


(... da finire ...)

Formati aperti

HTML

PDF

Postscript

ASCII

Open Document