IL LIBRO INFORMATICO
I programmi esistenti in Italia: sperimentazione*
Giuliano Artico
1 Il testo elettronico
Con l'avvento degli elaboratori elettronici si Š presentata l'opportunit… di pubblicare testi non pi— solo su carta ma anche in modo elettronico: invece di essere stampato su un foglio di carta, il testo viene mostrato mediante lo schermo del calcolatore.
La pubblicazione elettronica necessita di un intermediario per presentare l'informazione al lettore. Ad esempio, per mostrare delle figure occorrer… un programma capace di trattare le immagini grafiche; si user… invece un visualizzatore HTML (o Web browser, secondo la terminologia corrente) per presentare testi elettronici redatti in formato HTML.
Un documento elettronico1 Š una sequenza di caratteri, o byte, che comprendono il testo vero e proprio, oltre a vari codici che svolgono i ruoli pi— disparati. Ad esempio, ci sono dei codici che indicano la conclusione delle righe e delle pagine, altri che servono per indicare che una parte del testo va presentata in carattere inclinato o grassetto, altri ancora che stabiliscono la grandezza dei caratteri, e cosŤ via. Oltre a questi elementi stilistici, il documento pu• contenere anche una struttura di tipo logico: infatti pu• essere suddiviso in parti, capitoli, sezioni, pu• avere note, riferimenti, indici, tabelle, grafici, figure, ecc.
I codici che realizzano questo insieme di elementi costituiscono una specie di linguaggio o formato. Esiste una miriade di formati diversi: ogni word processor produce i documenti secondo un proprio formato specifico, diverso da quello degli altri programmi analoghi. Per poter visualizzare un documento occorre avere a disposizione il programma che lo ha generato2. Ci• costituisce un serio ostacolo alla circolazione dei documenti, soprattutto quando Š necessario che essi possano essere visualizzati con una macchina di tipo diverso da quella da cui sono stati generati.
Quando un documento contiene solo il testo (eventualmente segmentato in righe e pagine), si parla di un formato di puro testo. La presentazione di un documento di questo tipo Š visivamente poco attraente perch‚ l'intero testo appare in un unico stile.
L'HTML (HyperText Mark-up Language) Š un semplice formato per i dati utilizzato per produrre testi elettronici, che permette di affiancare parole, immagini, suoni ed animazioni: ci• rende l'HTML un sistema di pubblicazione multimediale completo (v. anche il paragrafo 4).
Una caratteristica importante dell'HTML Š la capacit… di realizzare il collegamento con altre sorgenti di informazione, capacit… che Š denotata con il termine ipertesto. Un normale documento formattato contiene delle informazioni e pu• tutt'al pi— suggerire al lettore altre sorgenti di informazione. Un documento ipertestuale fa lo stesso, ma nel punto in cui si trova il suggerimento per un'altra informazione si pu• prevedere che il lettore azioni il mouse oppure un tasto e che ci• avvii immediatamente il caricamento e la visualizzazione del documento collegato. Ad esempio, se in questo documento citassi un altro documento chiamato MANZONI.DOC, per visualizzarlo occorrerebbe selezionarlo con gli opportuni comandi del sistema e poi eseguire il programma che ne permette la visualizzazione. Invece con un documento ipertestuale si pu• semplicemente portare il cursore sulle parole MANZONI.DOC, che saranno mostrate con un colore diverso dal testo rimanente, e premere il bottone del mouse o il tasto Invio per chiedere al programma di caricare e mostrare il documento. Naturalmente l'autore del documento ipertestuale deve aggiungere alcune istruzioni per abilitare questa funzione. Queste istruzioni, che fanno parte del linguaggio HTML, si chiamano hyperlinks (ipercollegamenti) e forniscono il percorso di altri documenti, o pi— in generale di risorse che possono essere locali (presenti nell'elaboratore che si sta usando) o anche remote (accessibili in rete).
Un documento in puro testo o in HTML Š trasportabile da un tipo di elaboratore ad un altro: ad esempio, se Š stato preparato usando un PC pu• essere letto anche utilizzando una macchina di tipo UNIX, Atari, Macintosh, ecc.
L'indipendenza dal particolare sistema di visualizzazione rende universalmente accessibili i documenti in puro testo e in HTML3 .
I due formati suddetti sono i pi— adatti per l'utilizzo in abbinamento ad uno screen reader, strumento che i ciechi adoperano per la consultazione delle informazioni mostrate sullo schermo. Infatti con entrambi i formati risulta particolarmente semplice veicolare il contenuto testuale del documento, trasferendolo alla periferica vocale o tattile.
Si sceglie l'uno o l'altro dei due formati in base alle particolari esigenze:
* Se si prevede che la lettura del documento avvenga prevalentemente in modo sequenziale, Š da preferire il puro testo (Š il caso dei testi di narrativa).
* Se il documento Š ricco di richiami, oppure se Š richiesto che le caratteristiche grafiche vengano comunque conservate, allora si dar… la preferenza al formato HTML.
2 Consultazione dei testi
Si ricorre alla metafora della biblioteca per raffigurare la strutturazione gerarchica dell'informazione. Ad esempio, andando in ordine di generalit… decrescente, possiamo pensare a:
* Intera biblioteca.
* Collane.
* Volumi.
* Capitoli.
* Sezioni.
* Paragrafi.
* Sottoparagrafi.
* ...
Nella sua consultazione, l'utente della biblioteca Š interessato a compiere varie azioni, ad esempio:
* Scegliere il volume, dal catalogo o anche scorrendo i volumi.
* Consultare l'indice del volume.
* Leggere, cominciando dall'inizio oppure andando a salti, ad esempio andando direttamente ad una pagina di cui conosce un riferimento.
* Prendere degli appunti o fare delle fotocopie.
* Porre un segnalibro o annotare pagine del libro per future consultazioni.
* Prendere un altro volume, relativo ad un'opera citata in quello in corso di lettura.
Ci sono anche funzioni che il lettore di libri tradizionali non Š in grado di svolgere, ad esempio rintracciare facilmente le pagine che contengono una determinata parola o frase.
Nell'organizzare i testi elettronici Š auspicabile che tutte le azioni suddette siano eseguibili, quando possibile con efficienza ulteriormente potenziata.
L'organizzazione del sistema di dati in un elaboratore si presta bene per la trasposizione dell'organizzazione gerarchica della biblioteca. Esiste anzi la possibilit… di ampliare le potenzialit…. Qui possiamo pensare alla corrispondenza di un volume con un file, il quale al suo interno pu• essere suddiviso secondo una propria organizzazione interna. A loro volta, i file possono essere organizzati in directory e sottodirectory, in diverse unit… disco (fisse o removibili come i CD-ROM). Infine esiste la possibilit… di accesso alla rete, che apre possibilit… di reperimento di informazioni praticamente illimitate.
Prendendo in considerazione soltanto i tipi di formato di puro testo ed HTML, l'utilizzo dei testi elettronici pu• avvenire mediante vari programmi.
Per quanto riguarda il formato di puro testo, ci sono svariati programmi capaci di presentare i file di questo tipo. Spesso si consultano i documenti di puro testo utilizzando un word processor, soprattutto qualora ci sia simultaneamente l'esigenza di correzione o modifica del testo stesso.
Uno dei programmi di visualizzazione testi usato dai ciechi Š Doc, cui verr… dedicato ampio spazio nel seguito (paragrafo 3). Il programma Š scaricabile liberamente collegandosi all'indirizzo:
http://www.math.unipd.it/artico/artisoft.html
La consultazione dei documenti in formato HTML si pu• eseguire molto agevolmente mediante Lynx, un software sviluppato in ambiente UNIX, ma disponibile per tutti i sistemi operativi. Il software Š disponibile liberamente. Vedere ad esempio:
http://www.rahul.net/dkaufman/
Quando l'utilizzatore si trova nella condizione di dover consultare testi redatti in formati diversi da quelli suddetti, possono presentarsi difficolt… molto serie. In questi casi Š opportuno utilizzare quei programmi di conversione che sono capaci di trasformare i documenti in un formato pi— idoneo.
Un ottimo programma shareware capace di trasformare in puro testo i documenti prodotti con numerosi word processor Š View:
http://mdrury.hypermart.net/
I file in formato PDF oppure postscript possono essere trasformati in file di puro testo mediante il software Aladdin GhostScript, disponibile in tutti i sistemi operativi. La versione DOS4 pu• essere scaricata da Simtelnet all'indirizzo:
ftp://sunsite.cnlab-switch.ch/mirror/simtelnet/msdos/postscrp/gs403dos.zip
Esiste un ottimo servizio via e-mail realizzato dal Trace Center dell'Universit… del Wisconsin: inviando all'indirizzo pdf2html@sun.trace.wisc.edu un file PDF come attachment, nel giro di pochi minuti si riceve in risposta un messaggio che contiene la parte testuale del documento trascritta in un file HTML.
3 Il programma Doc
Il programma Doc cerca di soddisfare, per quanto possibile, le esigenze di scelta, navigazione, memorizzazione illustrate pi— sopra. Esso funziona in ambiente MS-DOS e in finestra DOS di Windows 95/98.
Doc visualizza documenti in formato di puro testo, anche contenuti in archivi compressi (v. il paragrafo 3.3). Il testo dei documenti5 viene visualizzato utilizzando le normali routine di BIOS, garantendo cosŤ la migliore compatibilit… con i sistemi di sintesi vocale usati dai ciechi. Esistono due ambienti principali di lavoro:
* Ambiente comandi: serve per scegliere i file e per gestire i parametri di funzionamento.
* Ambiente lettura: Š la fase di visualizzazione del testo.
Durante il funzionamento Š sempre presente una riga di stato (la prima in alto) che riporta alcune informazioni (nome del file, numero della videata, alcuni parametri di funzionamento). Ô disponibile un aiuto contestuale, richiamabile con il tasto F1. In alcune videate l'aiuto contestuale Š contenuto in una o due righe di suggerimenti sintetici posti all'inizio dello schermo.
La sintassi pi— generale utilizzabile dal prompt del DOS Š la seguente (con l'usuale convenzione che i termini fra parentesi quadre sono facoltativi):
doc [[cammino][NomeFile[.Ext]]] ["stringa"] [opzioni] [/@[FileOpzioni]]
Pi— precisamente, gli elementi della sintassi sono:
* [NomeFile] pu• essere il nome di un file o di una directory, una specificazione di file comprendente i caratteri jolly * e ?, il nome di un archivio compresso.
* [.Ext] l'estensione, che pu• essere indicata esplicitamente oppure sottintesa, in quanto Doc aggiunge automaticamente un'estensione, secondo un criterio legato all'opzione /A.
* "stringa" Š una sequenza di caratteri che si richiede siano presenti nei file specificati da NomeFile (che, in questo caso, deve contenere i caratteri jolly).
* [opzioni] per impostare vari parametri di funzionamento.
* /@ Š un'opzione particolare, usata per eseguire configurazioni approfondite.
* /? richiama un testo di aiuto direttamente dal prompt del DOS, nel quale sono elencate tutte le opzioni e le variabili di ambiente disponibili.
La distribuzione del programma Doc comprende numerosi file di documentazione e di esempio, ai quali si rimanda per i particolari qui non descritti. Il manuale completo Š costituito dal file DOC.TXT.
Esistono alcuni moduli eseguibili abbinati a Doc. Come si vedr… pi— avanti, i pi— importanti sono6:
* AUTOIND.EXE per generare cataloghi di file.
* AUTOSOMM.EXE per produrre file indicizzati (paragrafo 3.12).
3.1 Ambiente comandi, il gruppo privilegiato
L'ambiente comandi Š la modalit… nella quale si entra quando si digita semplicemente il comando Doc dal prompt del DOS. Compare l'invito ad immettere un comando, che pu• consistere nella digitazione di un comando (con la stessa sintassi illustrata pi— sopra) o nella pressione di un tasto o di una combinazione di tasti.
Nella maggior parte dei casi, l'utilizzatore preme le frecce Su e Gi— (anche altri tasti, come F5, F6, F7, Ctrl+Su, Ctrl+Gi—) per scegliere i file: man mano che si azionano questi tasti, compare un assaggio7 del documento, la parte iniziale, utile per individuarne il contenuto in prima approssimazione. Una volta trovato un file che interessa, si preme Invio per avviarne la lettura.
I file che si scorrono con i comandi di scelta suddetti fanno parte di un gruppo di file detto gruppo privilegiato, che pu• essere impostato secondo due criteri principali, come illustrato qui di seguito.
1. Si predispone un catalogo8, cioŠ un file con nome TESTI.LST contenente un elenco di nomi di file, organizzato secondo una precisa sintassi (v. il paragrafo 3.10). Ô prevista la possibilit… di suddividere il gruppo in numerosi sottogruppi. Il catalogo TESTI.LST deve essere obbligatoriamente collocato nella stessa directory in cui si trovano i file cui esso fa riferimento.
2. Gruppo di tipo DOS. Viene selezionato un gruppo di file, tutti contenuti in una stessa directory, impartendo un comando adeguato. I comandi da digitare sono sostanzialmente di tre tipi (ma possono essere combinati tra loro) e possono essere indifferentemente impartiti come parametri dal prompt del DOS oppure dall'ambiente comandi:
* Una specificazione DOS oppure il nome di una directory, ad esempio *.TXT, *.*, D:\LIBRI\L*.DOC, ecc.: vengono acquisiti tutti i file il cui nome combacia con la specificazione indicata.
* Una stringa racchiusa tra virgolette: in questo caso viene analizzato il contenuto dei file e vengono accettati solo quelli che contengono la stringa indicata. Si possono anche indicare due stringhe distinte, se si vuole che entrambe siano presenti nel documento: baster… indicarle una di seguito all'altra, separandole con ( ) (gli spazi vuoti sono significativi, mentre Š ignorata la differenza fra caratteri maiuscoli e minuscoli). Ad esempio, per cercare tutti i file di tipo *.TXT che contengono entrambe le parole universit… e Padova, si deve digitare:
*.txt "universit… ( ) padova"
* Un comando del tipo /D[min][-max]: i termini min e max indicano due valori numerici per delimitare la dimensione in byte dei file da acquisire. Di solito si indica solo il primo valore allo scopo di escludere file troppo piccoli, che probabilmente sono di minor interesse, ma Š ammessa anche la presenza del solo limite superiore.
Ogni file del gruppo privilegiato Š dotato di una descrizione:
1. Per i gruppi del primo tipo la descrizione viene inclusa nel catalogo TESTI.LST.
2. Per i gruppi di tipo DOS, la descrizione consiste nelle informazioni riguardanti il file (nome, dimensione, data, ora) (in questo caso si pu• variare la concisione della descrizione mediante l'opzione /,n dove n Š un numero da 0 a 3).
Premendo F2 nell'ambiente comandi si visualizza l'elenco completo dei file del gruppo privilegiato con le loro descrizioni. Qui si pu• muovere il cursore usando le frecce ed altri tasti. Per avviare la lettura del file puntato dal cursore si preme Invio. Se il gruppo Š di tipo DOS ed Š stato definito in base ad una stringa, allora si pu• premere anche Ctrl+Invio per avviare la lettura portando il cursore nella prima posizione in cui si trova la stringa indicata.
Naturalmente Š possibile indicare pi— semplicemente il nome di un file ben preciso (sia al prompt del DOS, sia nell'ambiente comandi).
3.2 Verifiche, videate, pagine
Prima di iniziare la lettura di un file, il programma Doc effettua su di esso alcune verifiche9, due delle quali servono ad accertare che si tratta effettivamente di un file di testo: in caso negativo il file Š ignorato e la lettura non ha luogo (fanno eccezione gli archivi compressi, v. il paragrafo 2 del file DOC.TXT).
Il primo controllo riguarda il nome del file: non sono ammesse le estensioni .EXE e .COM. Tolta questa eccezione, qualunque nome di file Š consentito.
Per quanto riguarda la seconda verifica, il programma esamina i primi 200 byte del file e ne rifiuta la lettura se trova fra essi certi caratteri che non possono far parte dei file di testo. I caratteri proibiti sono quelli detti di controllo (caratteri con codice ASCII minore di 32), con alcune eccezioni.
Fra i caratteri di controllo ammessi, alcuni svolgono ruoli ben definiti:
* I caratteri denominati CR (carriage return, codice 13) e LF (line feed, codice 10) sono i costituenti della sequenza di ritorno a capo.
* Il carattere FF (form feed, indicato anche con Ctrl+L, codice 12) Š usato generalmente durante la stampa per forzare l'espulsione del foglio di carta. Un simile utilizzo Š ripreso da Doc, che interpreta ogni carattere FF come la conclusione di una videata, cosicch‚' il testo che lo segue continua nella videata successiva, anche se la videata non Š interamente riempita.
3.3 Modalit… di visualizzazione del testo
Una volta avviata la lettura di un testo possono accadere tre cose:
* Se il file Š indicizzato (v. il paragrafo 3.11) compare un menu con l'elenco delle voci di primo livello dell'indice (v. il paragrafo 5 del file DOC.TXT); agendo con le frecce si sceglie la voce desiderata; la freccia destra fa comparire il sottoelenco ad un livello pi— dettagliato oppure, se non ci sono suddivisioni, avvia la lettura; la lettura si pu• avviare anche con Invio.
* Se il file Š un normale testo sprovvisto di indice si passa direttamente all'ambiente lettura e il file viene visualizzato dall'inizio.
* Se il file Š un archivio compresso compare l'elenco dei file contenuti in esso: occorre quindi spostare il cursore su una riga contenente il nome di un file e poi premere Alt+T per avviarne la lettura10.
Doc prevede il flusso del testo secondo tre metodi.
* A videate fisse: quando una schermata Š riempita, il programma rimane in attesa di comandi per proseguire la visualizzazione o per compiere altre funzioni di navigazione. Ô il metodo ordinario.
* A scorrimento ininterrotto: Š utile quando l'utilizzatore desidera leggere senza dover compiere alcun intervento (ad esempio, nella lettura di un romanzo).
* A scorrimento temporizzato: il testo scorre ininterrottamente a spezzoni temporali di durata prefissata11: esaurito un periodo, si preme un tasto per proseguire con un altro e cosŤ via. Questo metodo ha senso solo in abbinamento ad uno screen reader vocale, il quale deve essere in grado di controllare il flusso, conformemente alla velocit… con cui il testo viene vocalizzato.
Il tasto F3 esclude e ripristina alternativamente la visualizzazione a schermate fisse, mentre lo scorrimento (ininterrotto oppure temporizzato) viene controllato per mezzo dell'opzione /Z.
Normalmente ogni riga pu• contenere fino a 80 caratteri. Si pu• variare la lunghezza delle righe di testo con l'opzione /#nn, dove nn Š il numero massimo di caratteri consentiti in una riga e pu• variare da 20 a 80. Le righe che eccedono il valore impostato vengono mandate a capo, senza spezzare le parole. Naturalmente il conteggio delle videate (che Š mostrato all'inizio della riga di stato) Š influenzato dalla lunghezza delle righe.
Oltre che in videate, un documento viene idealmente segmentato anche in pagine: queste vengono determinate unicamente dalla presenza di caratteri FF. In realt…, dunque, nel contesto del programma Doc il termine "pagina" Š utilizzato solo per comodit…, ma una pagina pu• avere lunghezza arbitraria. Le pagine servono per effettuare la suddivisione di un testo in parti secondo criteri di ordine logico.
3.4 Ambiente lettura
Nell'ambiente lettura si possono utilizzare numerosi tasti e combinazioni.
Movimento del cursore: per carattere (frecce), per parola (Ctrl insieme con le frecce destra e sinistra), inizio e fine riga (Home e End), inizio e fine schermo (F9 e F10).
Spostamenti maggiori: pagina precedente e successiva (PgSu e PgGi—), inizio e fine documento (Ctrl+Home e Ctrl+End), salti di paragrafo12 o di capoverso13 (frecce verticali insieme con Ctrl o Alt).
Comandi di salto: si pu• saltare ad una videata digitandone il numero (che non viene visualizzato) e premendo poi Invio. Analogamente per saltare ad una pagina (v. il paragrafo 3.3) si digita il numero voluto e si preme poi Ctrl+Invio.
Ricerca: si pu• eseguire una ricerca libera di una parola o frase presente nel documento. Con F2 si imposta una nuova stringa da cercare, mentre con Ctrl+PgSu e Ctrl+PgGi— si cerca rispettivamente indietro e avanti la frase impostata in precedenza con F2. Questa ricerca pu• essere resa sensibile o meno alla differenza fra caratteri maiuscoli e minuscoli: infatti, azionando Alt+G si passa alternativamente da ricerca esatta (che distingue maiuscole da minuscole) a ricerca generalizzata (che Š la condizione normale). Si pu• anche effettuare la ricerca richiedendo di saltare alle righe che contengono due distinte parole o frasi: basta digitarle una di seguito all'altra separate da ( ) (cfr. l'analoga funzione nell'impostazione del gruppo privilegiato, pag. 6).
3.5 Salvataggio di riferimenti
Le impostazioni eseguite ed altre informazioni vengono memorizzate automaticamente in un apposito file di inizializzazione (che si chiama DOC{DAT}.INI e viene normalmente collocato nella radice dell'unit… corrente).
DOC prevede vari metodi per conservare riferimenti ai testi che vengono visualizzati.
Ultimo testo visualizzato. Il programma DOC conserva automaticamente il riferimento all'ultimo file visualizzato, inclusi il numero di videata e la posizione del cursore. Per riprendere la lettura dal punto in cui la si Š abbandonata, basta premere Ctrl+Invio se si Š nell'ambiente comandi oppure eseguire il comando DOC /P dal prompt del DOS14.
Segnalibri. Allorch‚' durante la lettura si incontra un punto ritenuto particolarmente importante, pu• risultare comodo servirsi di un segnalibro, in modo da fissare stabilmente nel disco un riferimento relativo al file che si sta leggendo. Successivamente, anche a distanza di tempo, Š possibile riattivare il segnalibro memorizzato e il programma ripresenta l'esatta situazione nella quale il segnalibro Š stato archiviato (v. il paragrafo 3.6, nonch‚' il paragrafo 6 del file DOC.TXT).
Taccuino. Ô un file di testo che si chiama DOC.TAC. Utilizzando opportuni comandi (tasto Maiusc premuto insieme con F1, F2,... F10) vi si possono sia conservare riferimenti ai file letti sia riportare brani del testo che si sta leggendo. Mediante la funzione di ipertesto di Doc (comando Alt+T) ogni riferimento memorizzato nel taccuino permette di ritrovare immediatamente il file corrispondente (v. il paragrafo 3.7, nonch‚' i paragrafi 7 e 15 del file DOC.TXT).
Storia. Doc conserva automaticamente memoria degli ultimi 31 file letti e permette di consultarne l'indice (Alt+H nell'ambiente comandi) o di scorrere direttamente i file nell'ambiente lettura (Alt insieme con le frecce orizzontali).
Premendo Alt+A si effettua una copia integrale oppure parziale del documento che si sta leggendo. Il programma propone di scegliere quale parte del file copiare: si pu• rispondere con T (tutto), P (pagina), V (videata), N (numero di videata, da indicare), < (dall'inizio fin qui), > (da qui alla fine).
3.6 I segnalibri
Il programma Doc Š dotato di un numero praticamente illimitato di segnalibri, organizzati in banchi di dieci segnalibri ciascuno. Un segnalibro serve per memorizzare15 rapidamente il riferimento al file che si sta leggendo (nome, numero di videata, posizione del cursore, breve commento,...) e per richiamare lo stesso file in un momento successivo.
Un segnalibro viene attivato mediante uno dei tasti di funzione da F1 a F10 premuto insieme con il tasto Ctrl. A seconda dell'ambiente in cui il comando viene impartito, si otterr… la memorizzazione dei dati relativi al file che si sta leggendo (ambiente lettura) oppure il richiamo di un riferimento registrato in precedenza (ambiente comandi).
Se ad esempio si preme Ctrl+F1 mentre si sta leggendo un file, il programma chiede di digitare un breve commento e poi effettua la memorizzazione. Notare che, al fine di proteggere dalla cancellazione eventuali dati preesistenti, qualora il segnalibro corrispondente a Ctrl+F1 fosse gi… impegnato, verrebbe dato un avviso mediante una segnalazione acustica (un trillo grave): in tal caso, per procedere alla registrazione, sarebbe necessario premere una seconda volta Ctrl+F1.
Per ogni segnalibro viene memorizzata una breve frase di commento (digitata dall'utilizzatore o acquisendo automaticamente la riga in cui si trova il cursore al momento della registrazione).
Le informazioni immagazzinate nei vari segnalibri, anche in sessioni precedenti, si utilizzano dal prompt premendo gli stessi tasti usati per la memorizzazione (Ctrl+F1 ... Ctrl+F10).
Premendo Alt+S si passa ad un ambiente nel quale sono elencati i vari segnalibri memorizzati. Si pu• navigare nell'elenco con le frecce verticali, nonch‚' con i tasti numerici. Battendo Invio si avvia la lettura del file puntato dal cursore, mentre con Alt+R si ottiene la lettura rapida del file (paragrafo 3.8). Si pu• cercare una stringa presente nell'intero elenco usando F2, Ctrl+PgSu, Ctrl+PgGi—.
Ogni videata mostra un banco di segnalibri alla volta. Per cambiare banco si usa PgSu, PgGi—, Home, End. Al di fuori di questo elenco, le combinazioni Ctrl+F1 ... Ctrl+F10 agiscono sui segnalibri dell'ultimo banco selezionato.
Se, trovandosi nell'ultimo banco esistente, si preme PgGi—, il passaggio ad un nuovo banco Š preceduto da una richiesta di consenso per la sua aggiunta.
3.7 Collegamenti ipertestuali
La funzione di ipertesto fornisce un collegamento fra file diversi o fra punti diversi di uno stesso file16.
Se in un certo file Š citato il nome di un altro file accessibile dal sistema, basta portare il cursore sul nome di quest'ultimo e poi premere Alt+T per avviarne la lettura. Inoltre, se nella stessa riga che contiene il nome del file sono anche presenti gli appositi codici relativi al numero di videata e alle coordinate del cursore, si ottiene la visualizzazione del testo nella posizione determinata da tali valori.
Una citazione ipertestuale normale pu• essere del tipo seguente:
C:\TESTI\DOC\DOC.TXT Pag=26 Pos=16, 24 ...
Le parole chiave Pag= e Pos= devono essere scritte esattamente in questo modo. Se il numero di videata Š assente, il file indicato viene letto dall'inizio. Se mancano le coordinate, il cursore viene posto all'inizio della videata; se c'Š la prima coordinata, ma manca la seconda, il cursore viene posto all'inizio della riga.
Quando il nome del file non Š indicato, oppure se il file non viene trovato, si assume che il riferimento Š da cercare nel file che si sta leggendo (in tal caso Š obbligatorio il numero di videata). Quindi Š possibile incorporare un sommario nel testo, che ha un aspetto del tipo seguente:
Introduzione Pag=3
Capitolo I Pag=6
Capitolo II Pag=12
...
La funzione di ipertesto pu• essere usata anche per richiamare i file citati nel file taccuino.
3.8 Lettura rapida
Invece di visualizzare integralmente un documento, Š possibile ottenere sullo schermo solo la parte iniziale dei blocchi di testo "significativi". Si tratta della cosiddetta lettura rapida, disponibile:
* Nell'ambiente comandi (file selezionato o ultimo file visualizzato).
* Nella schermata dei segnalibri (Alt+S).
* Nella schermata del gruppo privilegiato (F2).
* Nella schermata della storia (Alt+H).
* Nell'indice di un file indicizzato.
In tutti i casi la lettura rapida si attiva con Alt+R e, tranne che nell'ambiente comandi, anche con F10. Se attivata dall'indice, essa inizia a partire dal punto corrispondente alla voce evidenziata; in tutti gli altri casi dall'inizio del file.
Normalmente i blocchi significativi sono quelli che iniziano con un carattere di fine pagina FF, con un doppio ritorno a capo, con un ritorno a capo seguito da tre spazi o con un punto seguito da un ritorno a capo e da un carattere maiuscolo o numerico.
Il criterio che stabilisce l'inizio dei blocchi pu• essere modificato inserendo opportuni comandi nella sezione
[R_STRING]
...
[/R_STRING]
di un file di configurazione (per l'attivazione dei file di configurazione v. l'opzione /@ e la variabile di ambiente DOC_LNG). I comandi indicano le sequenze di caratteri con cui pu• iniziare un blocco. Vanno posti uno per riga e devono essere in numero non superiore a 64. Sono previsti alcuni simboli per indicare i caratteri non rappresentabili.
Normalmente il numero di parole visualizzate per ogni blocco Š 12, ma lo si pu• modificare con l'opzione /:" seguita da un numero compreso fra 1 e 256.
3.9 Altre funzioni
Doc Š configurabile sotto vari aspetti:
* La funzione di ogni tasto pu• essere spostata su un altro tasto.
* I colori possono essere modificati.
* Tutta la messaggistica pu• essere personalizzata (ad esempio, per tradurre le scritte del programma a beneficio di un utilizzatore che non conosce l'italiano).
* Vari parametri di funzionamento possono essere adattati (lunghezza delle righe, scrittura tramite BIOS, frequenza del beep,...); le impostazioni sono permanenti (perch‚ vengono salvate automaticamente nel file di inizializzazione).
Ci sono poi altri comandi particolari. Ad esempio, portando il cursore su un valore numerico (nell'ambiente comandi e nell'ambiente lettura) e premendo Ctrl+F11 si ottiene la conversione dell'importo numerico da Euro a Lira; la combinazione Ctrl+F12 esegue la conversione inversa. Le denominazioni delle monete ed il tasso di cambio possono essere modificati.
Infine Š possibile eseguire dei comandi DOS, detti macrocomandi, che si possono impostare mediante il file DOC.DOS, seguendo una certa sintassi (per i particolari, v. il file MACRO.TXT). Ad esempio, il file DOC.DOS, fornito nel pacchetto di Doc, abbina alla combinazione Alt+F10 l'esecuzione del noto programma HTMSTRIP.EXE: allorch‚ , scorrendo i file del gruppo privilegiato, si incontra un documento in formato HTML, se si preme Alt+F10 si ottiene la visualizzazione del testo contenuto nel documento.
Naturalmente occorre che i programmi richiamati dai macrocomandi siano gi… installati nell'elaboratore. Il programma HTMSTRIP Š prodotto da Bruce Guthrie ed Š scaricabile all'indirizzo http://users.erols.com/waynesof/bruce.htm.
3.10 Struttura del file catalogo
Come gi… detto nel paragrafo 3.1, Š possibile definire un gruppo privilegiato elencando i file che lo costituiscono in uno speciale file catalogo. Il gruppo privilegiato pu• essere suddiviso in vari sottogruppi.
Il file catalogo pu• essere generato con un qualunque editor di testi ASCII17.
Normalmente il file catalogo si chiama TESTI.LST (si pu• controllare tale nome mediante l'opzione /T e la variabile di ambiente DOC_IND).
Per essere riconosciuto dal programma DOC, il file indice deve contenere nella prima riga una frase di identificazione, esattamente come mostrato nella tav. 1.
La seconda riga del file catalogo Š riservata ad una frase che descrive il contenuto della raccolta. La frase pu• essere costituita al massimo da 78 caratteri, spazi compresi, e il primo carattere deve avere codice ASCII 175.
Si elencano nel catalogo i nomi dei file, uno per riga. Ogni volta che una riga contiene un carattere con codice ASCII 173, si considera chiuso un sottogruppo e ne inizia uno nuovo avente come sottotitolo il pezzo di riga che sta alla destra del carattere di identificazione.
Le righe con il nome di un file devono invece contenere un carattere con codice 174: il nome del file Š la parte di riga che sta alla sinistra di tale carattere, il commento Š la parte che sta alla destra. Si deve indicare solo il nome e l'eventuale estensione del file, non il percorso.
La tav. 1 mostra la parte iniziale del file TESTI.LST fornito con DOC.
3.11 Testi indicizzati
Un file di testo pu• essere dotato di uno speciale indice che ne permette una comoda consultazione a menu mediante il programma Doc (il file DOC.TXT ne Š provvisto).
Il richiamo di un file dotato di indice provoca la comparsa dell'elenco delle voci di primo livello (per fissare le idee, immaginiamo che si tratti dei titoli dei capitoli).
[Inserire Tavola 1]
Ô possibile scegliere le voci muovendo il cursore con le frecce verticali. Ogni capitolo pu• essere composto di vari paragrafi: la pressione della freccia destra fa passare all'elenco dei paragrafi di cui Š composto un capitolo (voci di secondo livello). Possono esistere suddivisioni pi— fini (voci di terzo livello, diciamo sottoparagrafi) e cosŤ via fino al nono livello. La freccia sinistra riporta sempre all'elenco di livello precedente. Se una voce Š sprovvista di sottovoci (ad esempio un paragrafo privo di sottoparagrafi), la freccia destra avvia la lettura del testo a partire dal punto indicato, lettura che si pu• sempre far partire anche con Invio. Con Alt+R si avvia la lettura rapida (paragrafo 3.8), sempre a partire dal punto evidenziato. Con Esc si ritorna all'ambiente comandi.
Si pu• cercare una parola, pi— in generale una sequenza di caratteri, fra i titoli del livello visualizzato (tasto F2). Come negli altri ambienti, per cercare all'indietro o in avanti la parola gi… immessa, si preme rispettivamente Ctrl+PgSu o Ctrl+PgGi—.
La terza riga dello schermo riporta alcuni indicatori:
* L'etichetta che rappresenta il livello attuale, cioŠ [a], [b], [c], ecc.
* Due numeri indicanti la voce attuale e il numero totale di voci.
* Un asterisco, solo nel caso in cui la voce attuale abbia delle sottovoci (in questo caso viene emesso un segnale acustico vibrato).
* L'indicatore [] di testo vuoto, se la videata corrispondente contiene solo il titolo (in questo caso viene emesso un segnale vibrato acuto).
L'indice Š costituito da un blocco di testo posto all'inizio del file e dopo un eventuale titolo. La struttura schematica di un file dotato di indice e anche di titolo Š la seguente (cfr. la tav. 3):
... (questo Š il titolo)
... (qui va posto l'indice)
... (corpo del testo)
3.12 Come realizzare un testo indicizzato
Il metodo pi— efficiente per ottenere un file indicizzato Š quello di usare il programma AUTOSOMM.EXE, fornito con Doc.
Per dotare un file di indice Š necessario preparare un file primitivo, contenente il testo desiderato, nel quale alcune righe vengono marcate con opportune etichette (v. il file ESEMPIO.IND allegato a Doc, un cui stralcio Š riportato nella tav. 2).
[Inserire Tav. 2]
Tali righe sono quelle che costituiranno le voci dell'indice. Una volta completato, il file primitivo deve essere elaborato con il programma AUTOSOMM.EXE. Il seguente comando elabora il file primitivo ESEMPIO.IND, generando il file ESEMPIO.TXT provvisto di indice (l'indice Š riportato nella tav. 3):
C:\>autosomm esempio.ind esempio.txt
[Inserire Tav. 3]
Per diventare una voce dell'indice, una riga del file primitivo deve iniziare con una lettera minuscola racchiusa fra parentesi quadre (etichetta): la lettera indica anche il livello di tale voce nella suddivisione del file in capitoli, paragrafi, sottoparagrafi, ecc. A sinistra dell'etichetta la riga non deve contenere altri caratteri, eccezion fatta per spazi vuoti in numero non superiore a dieci.
Le voci di primo livello possono essere in numero non superiore a 512; ogni voce pu• diramarsi in 512 voci del livello successivo, e cosŤ via fino alle voci di nono livello (lettera "i" ).
Nel file ottenuto dall'elaborazione con AUTOSOMM tutte le righe etichettate sono ricopiate nell'indice insieme con un puntatore alla corrispondente videata. Si pu• riportare nella voce dell'indice un testo alternativo al contenuto della riga etichettata: basta porre il testo desiderato racchiuso fra parentesi quadre immediatamente a destra dell'etichetta.
Notare per• che l'intera riga (etichetta, descrizione alternativa, testo) complessivamente non deve avere un numero di caratteri superiore a quello ammesso (normalmente 80).
Nel corpo del file destinazione le etichette sono eliminate e sostituite con un carattere di fine pagina FF, in modo che ogni riga etichettata diventa la prima riga di una nuova videata. Per questo motivo, preparando il file primitivo, Š inopportuno anteporre righe vuote alle righe etichettate.
Due righe consecutive del file primitivo possono essere entrambe dotate di etichetta. Ad esempio, se una riga inizia con [a] e la successiva con [b], significa che la videata relativa alla prima voce conterr… solo il titolo, senza alcun testo. In una situazione come questa, AUTOSOMM pone nell'indice, accanto all'etichetta, il segnale [] per indicare che quella voce contiene solo il titolo. Scorrendo l'indice con Doc, in corrispondenza di quella voce si udr… un vibrato breve ed acuto.
La sintassi per eseguire l'indicizzazione Š la seguente:
AUTOSOMM [/Q] FileOrigine [FileDestinazione] [/#nn] [/F]
L'estensione di default per il file origine Š .IND. Se non si indica il file destinazione, viene assunto il nome DOC.SOM.
Normalmente il testo viene analizzato considerando la lunghezza delle righe pari a 80 caratteri. Se per• si utilizza Doc con una lunghezza di riga diversa, si deve usare anche in AUTOSOMM l'opzione /#, seguita dal numero di caratteri.
Quando il file primitivo non contiene etichette valide si pu• usare l'opzione /F, mediante la quale diventano voci di primo livello dell'indice le righe successive ai caratteri di fine pagina FF.
Se si usa l'opzione /Q (quiet), viene omessa la richiesta di consenso per cancellare un file destinazione preesistente; vengono omesse anche le segnalazioni acustiche e le scritte non passano attraverso il BIOS.
Esempi
La tavola 2 riporta un esempio di file primitivo simile al file ESEMPIO.IND fornito con DOC (i puntini sostituiscono il testo, qui omesso). Elaborando questo file con AUTOSOMM, si ha come risultato un nuovo file, dotato di indice, che ha l'aspetto riportato nella tav. 3.
Il programma AUTOSOMM Š utilizzato per ottenere la versione testuale indicizzata del quotidiano La Stampa in versione accessibile18. Il giornale pu• essere scaricato ogni mattina collegandosi alla seguente pagina:
http://www.quotidiano.uiciechi.it/prelievo/stampatx.zip
Sviluppando l'archivio compresso, si ottiene un file primitivo19 che l'utilizzatore elabora con la procedura batch OGGI.BAT, pure compresa nell'archivio. In questo modo si genera il file indicizzato, pronto per essere letto con DOC.
Un altro esempio di applicazione Š dato dalla rivista Computer&Internet20: nel CD-ROM allegato alla rivista Š fornito un file indicizzato (\TESTI\SOMMARIO.TXT) che contiene il testo degli articoli pubblicati nell'edizione cartacea.
4 Formato HTML
L'HTML Š certamente il formato pi— potente e flessibile fra quelli che consentono di produrre documenti accessibili ai ciechi.
Oltre che per l'utilizzo su Internet, i file in formato HTML possono essere usati anche per la consultazione locale di documenti, soprattutto quando si vuole organizzare una raccolta molto ricca e complessa, con numerosi richiami ipertestuali fra un documento e l'altro. Alcuni esempi possono essere (in ordine di complessit… crescente):
* Un'opera singola (un romanzo, un trattato, un manuale), che contiene all'inizio i riferimenti ipertestuali dei capitoli; Š opportuno anche prevedere collegamenti ipertestuali per le note, che possono essere messe alla fine o in un file a parte.
* La raccolta delle opere di uno stesso autore: occorre un file principale che funge da guida e punta ai vari file contenenti le singole opere.
* Un giornale elettronico: qui occorre un file con il sommario degli articoli, che punta ai file con i testi degli stessi.
* Raccolte pi— complesse, fino ad un'intera biblioteca: occorre organizzare uno o pi— indici (ad esempio, uno alfabetico ed uno per argomento) in modo da facilitare il ritrovamento del materiale.
* Documenti che prevedono anche richiami a sorgenti remote, e quindi il collegamento con la rete e l'accesso a Internet.
La preparazione di documenti ipertestuali adatti all'uso da parte di utilizzatori ciechi richiede una minima familiarit… con i concetti dell'HTML. Un trattato molto chiaro, pi— che sufficiente per una conoscenza di base dell'HTML, Š contenuto nel file sshtml10.zip, disponibile su Simtelnet nella directory html. Vedere ad esempio:
ftp://sunsite.cnlab-switch.ch/mirror/simtelnet/msdos/html/sshtml10.zip
4.1 Accessibilit… dei documenti HTML
Occorre notare che i documenti HTML causano spesso difficolt… agli utilizzatori disabili perch‚ vengono realizzati ignorando alcune semplici indicazioni. Una delle cause del problema Š da ricercare nel fatto che oggi i documenti HTML vengono redatti principalmente per mezzo di "sistemi autore" (authoring tools).
Un sistema autore Š un programma che permette di produrre documenti HTML in modo amichevole. Lo sviluppatore di pagine HTML lavora su un'interfaccia simile a quella di un normale word processor, e perci• Š portato a disinteressarsi o addirittura a ignorare del tutto il codice che il sistema autore produce.
Chi prepara documenti in questo modo Š spesso totalmente ignaro del fatto che ben di rado gli utenti vedono le pagine esattamente nello stesso modo in cui le vede lui (perch‚ browser diversi o impostati diversamente interpretano il codice in modo diverso).
L'esigenza pi— elementare (e purtroppo ampiamente disattesa) Š quella di associare una rappresentazione testuale alle immagini, particolarmente a quelle che sono necessarie per "navigare" nelle pagine HTML (collegamenti, frame, mappe, ecc.). Il frammento di codice riportato qui di seguito mostra come dotare un link di una frase descrittiva (attributo ALT), che il browser pu• mostrare in alternativa all'immagine:
Nei frame occorre sempre usare l'attributo NAME, con una frase significativa, evitando descrizioni generiche come "sopra", "destra", "centro" e simili. Ecco un esempio di descrizione corretta:
Le indicazioni tecniche da seguire sono descritte in modo molto particolareggiato nelle raccomandazioni della WAI (Web Accessibility Initiative) del W3C:
http://www.w3.org/WAI/
http://www.w3.org/WAI/References/Policy
Esistono sistemi semiautomatici di verifica dell'accessibilit… (sia on line, sia off line). Uno di questi Š Bobby:
http://www.cast.org/bobby/
Vedere anche le recenti indicazioni in Electronic and Information Technology Accessibility Standards - Architectural And Transportation Barriers Compliance Board all'indirizzo:
http://www.access-board.gov/sec508/508standards.htm
Attualmente sono in corso iniziative per introdurre anche in Europa una serie di indicazioni di accessibilit… per le sorgenti di informazioni, e in particolare per il Web. Ad esempio eEurope: An Information Society for All:
http://www.w3.org/WAI/References/eEurope
Uno studio introduttivo molto chiaro e ricco di riferimenti bibliografici, dedicato al problema dell'accessibilit…, Š stato realizzato da Laura Burzagli e Paolo Graziani dell'IROE-CNR di Firenze. Il documento Š intitolato Accessibilit… di siti Web ed Š disponibile all'indirizzo:
http://etabeta.iroe.fi.cnr.it/accesso/accesso.htm
Giuliano Artico, Dipartimento di Matematica Pura e Applicata, Universit… di Padova.
* Appunti della lezione tenuta il 5 marzo 2001 presso il Centro Regionale S. Alessio - Margherita di Savoia, Roma.
1 Pi— corretto sarebbe usare il termine testo, ma seguiamo la terminologia corrente.
2 In certi casi Š possibile convertire il documento da un formato ad un altro, anche se accade talvolta che la trasformazione avvenga in modo imperfetto.
3 Un altro formato interessante Š il PDF (Portable Document Format), che si pu• considerare universale perch‚ sono pubblicate ufficialmente le specifiche del formato. Tuttavia i visualizzatori di documenti in formato PDF sono pi— complicati da realizzare. Inoltre i testi che si ottengono con i programmi di conversione da PDF a puro testo sono talvolta di qualit… poco soddisfacente, soprattutto perch‚ gli autori di documenti PDF tendono a sfruttare intensamente le capacit… grafiche del formato.
4 La versione DOS non tratta i file protetti con cifratura.
5 Ô l'informazione con priorit… massima. Altre scritte accessorie possono essere conosciute dall'utilizzatore con minore immediatezza e perci• sono visualizzate sullo schermo in modo tale da non venire intercettate immediatamente dal sintetizzatore. Coloro che usano una periferica di tipo tattile (barra Braille) possono essere leggermente disturbati dalla scrittura tramite BIOS ed Š quindi opportuno che la disattivino (combinazione di tasti ALT+B).
6 Per altri programmi abbinati a DOC, si rimanda alla relativa documentazione. Ad esempio, v. IND (riunisce file di testo, anche contenuti in uno o pi— archivi compressi, generando un file indicizzato per la lettura con DOC) e TEXTIND (svolge una funzione inversa a quella di AUTOSOMM).
7 Questo testo compare normalmente in modo silenzioso. Si pu• controllare il passaggio al BIOS delle prime nn righe dell'assaggio utilizzando l'opzione /.nn. Con il comando /.0 si ripristina la modalit… di default.
8 Operazione che di solito non Š svolta dall'utilizzatore, bensŤ da qualcuno che intende preparare una raccolta di testi da distribuire a vari utilizzatori. La documentazione del programma DOC Š organizzata in questo modo.
9 Queste verifiche possono essere disabilitate con l'opzione /V.
10 Per l'accesso agli archivi compressi occorre disporre dei vari programmi archiviatori (PKUNZIP.EXE, ARJ.EXE, ecc.). Occorre anche abilitare l'accesso agli archivi compressi mediante l'opzione /&1 (v. il paragrafo 2.6 nel file DOC.TXT).
11 La temporizzazione si imposta con l'opzione /Znn, dove nn Š un numero compreso fra 0 e 1339 che esprime la durata in minuti. Il valore 0 indica che la temporizzazione Š disattivata.
12 Blocco di testo preceduto da almeno una riga vuota.
13 Blocco di testo che inizia con almeno un carattere spazio; inoltre anche i paragrafi sono considerati capoversi.
14 L'opzione /Pnn, dove nn Š un numero, provoca l'avvio della lettura a partire dalla videata nn. Analogamente con /P~nn si avvia la lettura a partire dalla pagina nn.
15 Normalmente il file contenente i dati dei segnalibri si chiama DOC.KEY e si trova nella directory del file DOC.EXE: per• il nome e la collocazione possono variare (v. il paragrafo 6 e l'opzione /# nel paragrafo 9 del file DOC.TXT).
16 Questo Š detto ipertesto normale. La funzione di ipertesto pu• essere impiegata anche in un file lista associato ad un archivio compresso: in questo caso permette l'immediata visualizzazione dei file contenuti nell'archivio.
17 Per facilitare l'operazione si pu• usare il modulo AUTOIND.EXE.
18 Realizzato a cura dell'IROE-CNR, Istituto di Ricerca sulle Onde Elettromagnetiche "Nello CARRARA" nell'ambito del progetto MURST Telemedicina, Sottotema 8/3.
19 Questo file primitivo viene prodotto da un server automatico sulla base dei file forniti ogni notte dalla redazione del giornale LA STAMPA.
20 Rivista enciclopedica di informatica e telematica, pubblicazione trimestrale, Editrice 2F MULTIMEDIA SRL, via San Domenico 2, 50133 Firenze, Tel. 055/577564, E-mail redazione@compeint.com.
1