SISTEMAS DE LECTURA DIGITAL Y LIBROS ELECTRÓNICOS

Uno de los cambios que las tecnologías de la información están provocando en nuestra sociedad es la progresiva expansión de los libros electrónicos, llamados también libros digitales. El éxito de la obra del escritor Stephen King "Riding the Bullet", publicada en 1999 únicamente en formato electrónico y de la que se vendieron más de medio millón de ejemplares en pocos días, sirvió para demostrar que el cambio previsto ya está ocurriendo y es una realidad visible. En aquel momento los expertos se pusieron a discutir sobre si el libro electrónico iba a sustituir a la larga al libro tradicional, que pasaría a convertirse en un objeto de coleccionista o de museo, o si ambos se iban a usar de forma complementaria. Los partidarios de la primera predicción están convencidos de que las enormes ventajas económicas del libro electrónico en las áreas de producción, distribución y almacenamiento compensarán su menor comodidad de lectura. Esta euforia se apagó en gran medida cuando se vio que el éxito de King no ha tenido sucesores. El propio King fracasó en su segundo proyecto cuando intentó vender un nuevo libro por entregas directamente desde su propia página Web y tuvo que cancelar la publicación del libro a los pocos capítulos debido a su escaso éxito de ventas, motivado en gran parte porque el libro se pirateaba en vez de ser comprado. Aunque algunos hablan ya del fracaso del libro digital, lo único cierto es que se había sido demasiado optimista en todo lo referente a la explosión del comercio en Internet y los libros son sólo un reflejo de la crisis en que este sector ha caído. Es indudable que tarde o temprano el mercado electrónico madurará y los libros digitales representarán un sector importante del mismo.
   La polémica sobre la convivencia del libro digital con el libro en papel importa poco a las personas ciegas o con dificultades visuales graves, porque no pueden disfrutar de la comodidad de los libros tradicionales, y las alternativas de las que disponen actualmente no son claramente más cómodas que las soluciones para leer libros electrónicos. Tanto los impresos en Braille como en grandes caracteres o las grabaciones en cinta magnética son costosos y voluminosos. En consecuencia, la cantidad de libros disponibles en estos formatos es siempre insuficiente. El libro electrónico, en cambio, ofrece la oportunidad de poder acceder a las mismas ediciones que usan las personas sin problemas visuales, siempre que se disponga de aparatos lectores adecuados. Incluso en el caso de los formatos especializados, como el Braille, la edición es mucho más rápida y económica cuando se prescinde del papel, y al mismo tiempo solventa su principal inconveniente: el tamaño. En resumen: para nuestro colectivo sólo hay ventajas, y nos interesa apoyar todo lo que se haga para difundir los libros electrónicos.
   Conviene señalar que algún autor denomina libros digitales a los contenidos y reserva el nombre de libro electrónico para los dispositivos físicos que pueden leer libros digitales. Es indudable que esta terminología es la más correcta, pero me temo que ya es imposible evitar que se use el nombre de libro electrónico para referirse a los contenidos, igual que se dice correo electrónico en lugar del más correcto correo digital. Por esta razón, este artículo hablará de libros electrónicos o digitales para referirse al contenido, y de sistemas de lectura para referirse a cualquier conjunto de hardware y software que permita acceder a dicho contenido.
   Este artículo describe el estado actual (verano 2001) de los libros electrónicos. Empieza estudiando la evolución de la informática que nos ha conducido hasta la aparición de los libros electrónicos como una especialización de los textos digitales. Después se describen los distintos formatos que se usan para los ficheros electrónicos que contienen estos textos digitales, ya que son el equivalente al papel de los textos convencionales y hasta que no se llegue a un acuerdo definitivo sobre el formato a emplear para los libros no se podrá considerar maduro su mercado. Después viene el núcleo del artículo describiendo los distintos sistemas de lectura que buscan la aceptación de los usuarios, destacando la diferencia entre los sistemas que usan la voz y los que se basan en la imagen. Los primeros se han creado para ayudar a leer cualquier tipo de texto digital y muchos de ellos han nacido con el propósito de ayudar a las personas con discapacidad visual, pero son los segundos, basados en la mejora de la visualización de los textos, los que son el resultado más reciente de la evolución que nos ha traído el concepto de libro digital. El artículo continúa con una breve descripción de los sistemas que se usan para producir libros digitales, pues muchos lectores pueden sentir interés por la posiblidad de crear su propio libro; también se incluye en esta sección una corta descripción sobre cómo crear un texto en Braille digital. Después se comenta el difícil problema de la gestión de los derechos de propiedad de los libros digitales, verdadero campo de batalla donde se juega realmente el futuro del libro electrónico. La constatación de que este problema no está todavía resuelto satisfactoriamente nos lleva a las conclusiones finales, en donde se dedica especial atención a cómo las personas ciegas o con baja visión nos vamos a ver afectadas por la existencia de este nuevo desarrollo tecnológico.
   El índice del artículo es el que figura a continuación de esta introducción. Las referencias de tres letras entre corchetes ("[XXX]") intercaladas en el texto indican las direcciones de páginas Web que se han reunido en el último apartado para facilitar a los interesados la consulta y ampliación de los conceptos y productos mencionados en el artículo.

ÍNDICE DEL PRESENTE DOCUMENTO

1.- EVOLUCIÓN DE LAS APLICACIONES INFORMÁTICAS HASTA LOS SISTEMAS DE LECTURA

   La rápida evolución de la informática, que es capaz de conseguir máquinas cada vez más potentes y más pequeñas, ha llegado a una situación que permite predecir el creciente uso de esta tecnología para leer textos escritos. Ya actualmente existe una gran cantidad de material escrito en formato digital y el veloz crecimiento de este nuevo medio ha propiciado la aparición de sistemas de lectura en ordenador, es decir, aplicaciones informáticas cuyo objetivo es facilitar la lectura de estos textos digitales.
   Los primeros ordenadores fueron diseñados y construidos en Universidades al final de la década de 1940 con el objetivo de realizar cálculos científicos y técnicos, especialmente para aplicaciones militares. Por esto, cuando en la década de 1950 algunas empresas bancarias y de seguros empezaron a contratar estos equipos, sus propios creadores se quedaron sorprendidos porque no habían sido capaces de darse cuenta de las enormes posibilidades de su invento para el proceso masivo de información de gestión.
   Lo cierto es que a lo largo de las décadas de 1960 y 1970 las aplicaciones de proceso de datos pasaron a ser las más importantes cuantitativamente y la aparición de los discos magnéticos permitió al final de este período la creación de grandes bases de datos que eran accedidas desde terminales que podían estar situados lejos de los ordenadores que contenían los datos. De esta forma nació el teleproceso y las primeras redes informáticas, en general muy centralizadas alrededor de grandes ordenadores.
   No obstante, hay que resaltar que la mayoría de datos que almacenaban estas máquinas eran todavía numéricos y se procuraba reducir al mínimo los textos alfabéticos que por su volumen desbordaban fácilmente las limitadas memorias magnéticas de aquellos tiempos. Incluso ocurría que el principal medio de entrada de datos de entonces, la ficha perforada, sólo permitía el uso de letras mayúsculas y que en consecuencia las letras minúsculas no tenían siquiera códigos internos adecuados para ser representadas en la memoria de los ordenadores.
   Esta situación fue cambiando durante la década de 1980, después de la aparición de los ordenadores personales y la sustitución de la ficha perforada por el uso masivo de teclados y pantallas como medio principal de entrada de datos, sea mediante terminales o, posteriormente, mediante ordenadores personales, conectados a las redes informáticas o usados de forma aislada. Como resultado de este cambio, el uso de textos alfabéticos se convirtió en una práctica habitual y la denominada "ofimática" pasó a ser la más importante área de aplicación de la informática, relegando a un segundo plano las aplicaciones de gestión administrativa de datos y el cálculo científico y técnico.
   Los años de la década de 1990 vieron la casi completa desaparición de la máquina de escribir y prácticamente todos los textos y documentos que se crean al final de dicha década son primero textos digitales antes de ser impresos sobre papel. La industria editorial ha evolucionado de forma tal que todos los libros que actualmente se imprimen y encuadernan en el formato tradicional en papel han sido previamente manipulados dentro de los ordenadores para adquirir el formato con que aparecen sobre el papel.
   Actualmente, ya en la década de los 2000, puede decirse que cualquier tipo de documento (cartas, facturas, recibos, periódicos, revistas, libros, etc.) se crea en el medio informático antes de pasar al papel que, no obstante, sigue siendo el medio favorito cuando es necesario leer el documento. Hoy se considera normal que un documento se cree en formato digital y se haga llegar a todos los destinatarios a través de la red telemática, por ejemplo usando correo electrónico, es decir manteniendo su formato digital. Es en este punto del proceso cuando el destinatario puede decidir leerlo con el propio ordenador o imprimirlo en papel para leerlo con más comodidad. Es aquí, entonces, cuando surge la idea de que este paso al papel es lento, caro y poco productivo, y que sería mucho más eficiente leerlo en el propio ordenador sin tener que cambiar de medio.
   Todas las personas con buena visión reconocen que es mucho más cómodo leer textos en tinta (que es como las personas ciegas llaman a los textos impresos) que en la pantalla del ordenador y por esto limitan la lectura desde la pantalla a textos cortos. Cuando un texto tiene una longitud de varias páginas es considerado poco adecuado para ser leído en su medio digital con los sistemas de lectura habituales, que suelen limitarse a visualizar el texto en la pantalla del ordenador. Incluso las publicaciones multimedia que se distribuyen en CD-ROM's o mediante páginas Web, o sea en formatos visualizables con los navegadores de Internet, no están teniendo tanta divulgación como se preveía hace algunos años porque se considera poco cómoda su lectura.
   Esta situación es la que ha llevado al desarrollo de sistemas de ayuda a la lectura, tema de este artículo, pues se espera que gracias a ellos se haga el paso definitivo que conduzca a la desaparición del papel como soporte intermedio, manteniendo todo el proceso de la información dentro del medio digital. Aunque no han faltado las voces triunfalistas que aseguran que ya se dan las condiciones objetivas para realizar este paso final, la situación no es la que proclaman estos profetas informáticos y es la que se describe a continuación.

2.- FORMATOS DE LOS LIBROS ELECTRÓNICOS

   Los agruparemos en dos grandes familias: los formatos de texto y los formatos de audio, si bien la evolución de la tecnología hace que sus fronteras se vayan disolviendo en los formatos multimedia.

2.1.- FORMATOS DE TEXTO

   Dentro de esta familia se incluyen tanto las soluciones digitales alternativas a los libros impresos tradicionales, como las alternativas a los libros en Braille. La gran ventaja que proporcionan es que podemos acceder, con las adaptaciones adecuadas, incluso a los libros digitales "en tinta", aunque para los habituados al Braille literario será más cómodo acceder a un libro digital en Braille. Por lo tanto, la clasificación de los textos en "tinta" y "Braille" no es tan importante como para los libros tradicionales, pero sigue siendo conveniente distinguirlos a la hora de acceder a ellos.
   En principio todos los formatos de texto habituales usan códigos de 8 bits, sean ASCII o ANSI/ISO, con lo cual no pueden representarse sin más en los seis puntos que emplea el Braille literario. La solución más inmediata a este problema es usar un código Braille ampliado a 8 puntos, que se ha denominado "Braille computerizado" para distinguirlo del Braille integral o literario. Todo libro electrónico no manipulado -"en tinta", para entendernos- está automáticamente en Braille computerizado y podremos acceder con dispositivos lectores que usen 8 puntos para cada celda. Acostumbrarse a este código es sólo una cuestión de hábito, aunque la mayoría de partidarios del Braille seguirán prefiriendo siempre su entrañable código literario de 6 puntos, llamado también Braille integral.
   Si se desea tener el libro en Braille literario, porque se quiere imprimir el texto en una impresora Braille para su distribución como libro tradicional, por ejemplo, se ha de convertir el contenido para reducir el juego de caracteres a un conjunto representable mediante sólo 6 bits. En la sección sobre producción de libros digitales se da más información sobre cómo realizar esta conversión de formato.
   Mucho más importante que la distinción entre tinta y Braille es la diferencia entre formatos de texto plano y formatos de texto estructurado. Esta diferencia afecta tanto a los formatos tinta como Braille, aunque no es todavía habitual el Braille estructurado.

2.1.1.- TEXTO PLANO

   Todos los textos producidos con los editores y procesadores de textos más corrientes, como el Bloc de Notas y el Corel WordPerfect, Lotus Word Pro o Microsoft Word, están en texto plano. Proporcionan escasas facilidades para navegar entre los componentes que contiene el texto y sólo están estructurados para ser leídos en secuencia, como si estuviesen grabados en una cinta. Es cierto que muchos de estos textos llevan intercaladas, entre lo que es propiamente contenido conceptual, numerosas marcas para describir su formato, pero estas marcas sirven sólo para describir cómo dicho contenido debe visualizarse en la pantalla o imprimirse en la impresora; no sirven para indicar la estructura conceptual del documento. Por ejemplo, un capítulo puede iniciarse con un título al que se asigna una fuente y un tamaño iguales a los utilizados para el resto de títulos de capítulo, pero nada impide que se usen los mismos para indicar el autor y los datos editoriales, por lo que estas marcas no son suficientes para identificar el inicio de capítulo.
   La ventaja de este formato es que no requiere un sistema de producción específico, de modo que cualquier usuario puede crearlos usando las mismas aplicaciones que usa para crear cualquier otro contenido. Sus limitaciones, no obstante, hacen que no sea adecuado para la publicación digital. La obligada lectura secuencial, con sólo unas pocas facilidades de búsqueda, no es la única. Por otro lado, no se han llegado a desarrollar unos estándares oficiales ni "de facto" sobre las marcas de formato a usar, y son todas propietarias de un fabricante. Los formatos más populares como el RTF (Rich Text Format) y el DOC del MS Word están asociados a programas concretos y no tienen, por lo tanto, la universalidad requerida por el mercado. Esto ha obligado a que la mayoría de textos planos que se están distribuyendo sean totalmente planos, o sea, sin ni siquiera las aludidas marcas de formato, proporcionando únicamente los caracteres ASCII o ISO propios del sistema operativo empleado. Este hecho aumenta la incomodidad que con toda razón se les atribuye. Cuando estos textos se distribuyen en la mayoría de idiomas (posiblemente en todos con la excepción del inglés) tienen el problema añadido de los diferentes juegos de caracteres que usan los distintos sistemas informáticos, de forma que un texto aceptable en un sistema, por ejemplo el MS-DOS, es casi ilegible en otro, como Windows 95/98, ya que muchos caracteres han cambiado de representación.
   Las personas con discapacidad visual estamos tan acostumbradas a hacer un gran esfuerzo para poder leer que no damos a estas dificultades el mismo valor que los demás usuarios. Nuestra necesidad nos hace aceptar, incluso sin excesiva frustración, los numerosos errores que los reconocedores ópticos de caracteres (OCR) hacen al tratar páginas de difícil exploración. Pero lo cierto es que no podemos considerar a los textos planos como adecuados a la denominación de "libros digitales" ya que no pueden, por sus características, llegar a recibir este nombre y nunca se llegarán a vender como un libro ni se pueden convertir en un bien de consumo generalizado. Aunque la frontera entre un simple texto digital y un libro electrónico no está definida con exactitud, está claro que los libros digitales del futuro deben presentar el texto en un formato estructurado. Sólo cuando el texto está en uno de los formatos que se describen a continuación, puede ser manipulado de forma adecuada por el sistema de lectura de una forma aceptable para que el usuario lo considere digno del nombre de libro.

2.1.2.- TEXTO ESTRUCTURADO

   Como hemos explicado, un texto plano no contiene información que facilite su manipulación automática. Por manipulación automática se entiende el uso de programas informáticos para transformar el texto con fines diversos, como visualizarlo en pantalla, imprimirlo, traducirlo a otra lengua, leerlo en voz sintética o convertirlo a Braille. La forma más habitual de facilitar todas estas manipulaciones es añadir al texto "marcas", llamadas también "etiquetas", que proporcionan información sobre la estructura del texto, que no hemos de confundir con las de representación. Las etiquetas de estructura proporcionan información sobre la función de un determinado fragmento dentro del conjunto del documento, señalando aspectos tales como si es el título, el nombre del autor, si es un elemento de una lista o una nota del traductor. Las marcas pueden variar mucho según el tipo de manipulación que se prevé realizar. Serán distintas, por ejemplo, si la aplicación prevista es la impresión para su publicación o si es la traducción automática a otro idioma. Por ese motivo se han desarrollado numerosos sistemas de marcado, de los cuales nos interesan aquellos que se están imponiendo para la publicación electrónica: el PDF y el SGML.

FORMATO «PDF»

   El formato PDF (Portable Document Format) pertenece a la empresa americana Adobe [ADB], una de las más importantes proveedoras de software para el mercado editorial. Una gran parte de su éxito se debe a haber conseguido que sus formatos de presentación de información sean considerados como estándar "de facto" en dicho mercado. Supo imponer su formato de impresión en papel, denominado PostScript, para la impresión de alta calidad. El PDF, su sucesor, amplía los objetivos desde la impresión en papel a la visualización sobre cualquier tipo de dispositivo, conservando en todos los casos las mismas propiedades visuales. De aquí proviene el calificativo de formato portable. La implicación más importante de esta cualidad es que podemos representar en la pantalla del ordenador un documento PDF exactamente igual que como lo veríamos si lo imprimiésemos en una impresora de alta calidad. Proporciona, además, muchas facilidades para navegar por los documentos, al incluir hiperenlaces que permiten saltar desde un punto del texto a otro relacionado.
   Muchos especialistas creen que este formato tiene un gran futuro, pese a que su carácter propietario obliga a comprar el software de Adobe para manipular los textos. Para obviar esta crítica Adobe distribuye de forma gratuita los programas lectores más básicos, que se describen en la sección correspondiente de este artículo, y ha permitido a otras empresas desarrollar y comercializar programas que también manipulan PDF's. Paralelamente, se han esforzado para integrar el PDF en el sistema WWW, de modo que los navegadores puedan visualizarlo y se puedan distribuir sin dificultad documentos en este formato a través de Internet.
   No obstante, hay que destacar que las personas con discapacidad visual no tenemos fácil acceso al PDF. Consigue esa flexibilidad y calidad de impresión gracias a su carácter gráfico, es decir, a estar formado por píxeles y no caracteres de texto. Como su aspecto visual en la pantalla es igual al que tiene en el papel, su lectura se hace difícil o imposible con las adaptaciones que tenemos para trabajar. Aunque existen soluciones a este problema nos interesa mucho más apoyar el uso de las opciones de texto estructurado basadas en la familia de lenguajes SGML.

TEXTOS MARCADOS CON LENGUAJES «SGML» O «XML» (COMO «HTML» Y «XHTML»)

   El SGML (Standard Generalized Markup Language) es un estándar del Instituto Internacional ISO que apareció en 1986, inspirado en lenguajes de marcado ya existentes que habían demostrado claramente su eficacia para la publicación electrónica. Quienes deseen ampliar la descripción que sigue a continuación con más información sobre el SGML pueden consultar la dirección [SGM].
   El SGML tiene dos características principales:
   a) Es un metalenguaje, es decir, no define un lenguaje de marcado único para etiquetar cualquier tipo de texto sino que describe una sintaxis para los distintos lenguajes de marcado que se tengan que crear. Da por supuesto que será necesario usar juegos de etiquetas diferentes para marcar obras de teatro, por ejemplo, que manuales de instrucciones para el uso de maquinaria. Este metalenguaje se usa para describir cada uno de los lenguajes de la familia SGML. La descripción de cada uno de ellos se denomina DTD (Document Type Definition) y los programas manipuladores de documentos marcados tienen que emplear los ficheros DTD para saber qué etiquetas deben reconocer y qué normas se deben usar para el marcado de dichos documentos. Aunque esta característica puede parecer una complicación a primera vista, en realidad es una enorme ventaja del SGML sobre los lenguajes de marcado rígidos, ya que permite usar lenguajes muy sencillos para manipular documentos de estructura simple y reservar las complicaciones para los lenguajes que necesiten definir documentos de estructura compleja.
   b) Separa la estructura del documento de su representación en un determinado dispositivo. El estándar SGML recomienda que las marcas descritas en la DTD se usen solamente para indicar propiedades conceptuales del documento, como indicar si un elemento es un título o un párrafo corriente. No deben emplearse las etiquetas SGML para decir que un texto se debe imprimir con un determinado tipo de fuente o en un tamaño concreto. Todos los aspectos de representación no deben darse en la DTD, puesto que no se puede estar seguro del dispositivo final que el usuario empleará para acceder al contenido del documento. La información sobre el tamaño de las letras, por ejemplo, será incongruente si el documento va a leerse con una línea Braille u oírse con un sintetizador de voz. Esto simplifica todavía más la DTD para un documento, pero obliga a usar información adicional cuando se quiere acceder al mismo con un determinado dispositivo. La información adicional será normalmente optativa, ya que los distintos dispositivos tendrán parámetros por defecto que usarán para realizar su función. Cuando se quiere modificar la presentación por defecto se usan las denominadas "hojas de estilo", para las que existen diversos estándares que ya no forman parte del propio SGML.
   Estas características dan al SGML una gran potencia y flexibilidad, lo que lo ha hecho muy popular en medios empresariales, académicos y militares. Una de sus aplicaciones más famosas es la World Wide Web (WWW) o "malla mundial", que es la principal causante del gran éxito de Internet.
   Para confeccionar las páginas Web se usa el lenguaje de marcado HTML (HyperText Markup Language), que es un miembro algo díscolo de la familia SGML. Los inventores del WWW y del HTML, que hoy se agrupan en el consorcio WWW o W3 Consortium [W3C], diseñaron el HTML con la idea de que fuese lo más sencillo posible, por lo que en sus primeras versiones evitaron obligar a usar DTD's y hojas de estilo para visualizar las páginas Web. Los estándares HTML desde la versión 1.0 a la HTML 4.0 usan la sintaxis del SGML, pero permiten etiquetar no sólo información de tipo estructural sino también información de estilo para indicar cómo se tiene que visualizar un determinado texto. El navegador puede usar esta información, que forma parte del propio documento, sin hacer caso de los deseos del usuario que lo está leyendo. Por eso se le ha llamado un lenguaje SGML díscolo: no cumple con algunas de sus características más importantes. A pesar de ello, su gran éxito mundial lo ha convertido en el principal formato para textos digitales. Ante esta realidad el propio consorcio W3, arrepentido de su frivolidad inicial, está actuando para mejorar el lenguaje y convertirlo en el formato ideal para la publicación electrónica. El reto está en conseguir recuperar las cualidades del SGML sin perder la compatibilidad con los numerosos programas y contenidos que ya existen en la WWW.
   Con ese propósito, el consorcio W3 ha empezado definiendo un subconjunto del SGML al que ha denominado XML (eXtensible Markup Language). El XML es también un metalenguaje, y a partir de ahora todos los lenguajes para publicar en la WWW que se usen tendrán que estar definidos mediante su correspondiente DTD; tanto los navegadores como cualquier otro programa o dispositivo que manipule documentos XML tiene que ser capaz de validar la corrección de la sintaxis XML, incluso usando la DTD si es necesario para la aplicación realizada, y visualizar o presentar su contenido usando las hojas de estilo. Para definir estas últimas el consorcio W3 ha creado un nuevo lenguaje denominado XSL (eXtensible Stylesheet Language). Como además se quiere poder usar hojas de estilo incluso con las páginas Web antiguas, realizadas en las viejas normas HTML, se han diseñado las llamadas CSS (Cascading Style Sheets, o sea, hojas de estilo en cascada) con las que se puede modificar el aspecto visual de estas páginas según los deseos de los usuarios con independencia del estilo que el diseñador de la página ha indicado por defecto para la misma. La designación de hojas de estilo en cascada significa precisamente que las hojas de estilo dadas por el usuario, si existen, se aplican en vez de las dadas en el nodo servidor que proporciona la información y que estas últimas a su vez, si existen, son preferidas a las opciones de presentación dadas por el autor de la página. Si ninguno de estos tres niveles de hojas de estilo existe, es cuando se aplican las opciones por defecto y las que vienen definidas en las etiquetas HTML de la propia página.
   La compatibilidad con el enfoque menos flexible del HTML se puede mantener empleando alguna de las DTD's que describen las distintas versiones del HTML, que al fin y al cabo era un lenguaje SGML. Por otro lado, la nueva versión de HTML se ha definido usando ya XML. Para resaltar que es sólo uno de los lenguajes XML que se puede emplear para hacer páginas Web no se llama HTML 5.0 -como le correspondería- sino XHTML 1.0. Quien quiera más información en castellano sobre XML pueden consultar la dirección [XML].
   En estos momentos ya están definidos o se están definiendo numerosos lenguajes de marcado de la familia XML para distintas aplicaciones. Para nuestro propósito nos interesan especialmente dos de ellos: el Open-eBook y el SMIL en su variante DAISY.

EL ESTÁNDAR «OPEN-EBOOK» («OEB»)

   El Instituto Nacional para Estándares y Tecnología de Estados Unidos (NIST) es el patrocinador del consorcio Open-eBook [OEB], que agrupa no sólo a grandes editoriales, distribuidoras de libros y bibliotecas, sino también a empresas de alta tecnología fabricantes de dispositivos y programas para producir y leer libros electrónicos. La propia Microsoft ha estado muy activa dentro del consorcio, aunque como luego veremos se ha aprovechado de esta relación para intentar dominar el naciente mercado del libro digital.
   Como puede suponerse, el objetivo del consorcio OEB es crear estándares para la publicación electrónica. Su primer resultado, aparecido en septiembre de 1999, son las normas para crear libros OEB usando un lenguaje de la familia XML. El estándar OEB es en gran parte compatible con los ya citados HTML 4.0 y XHTML. Además, es un subconjunto muy básico de estos estándares, y los textos resultantes son accesibles por poco cuidado que ponga el autor en conseguirlo. Para las personas ciegas o con discapacidad visual, por tanto, el éxito del OEB sería una gran noticia, ya que podríamos acceder a los ficheros de texto en formato OEB usando las mismas adaptaciones que usamos para navegar por la Web.
   Otro de los avances realizados por el consorcio OEB es la definición de la estructura de una publicación OEB, es decir, la forma como se deben montar todos los ficheros que componen un libro digital para que puedan ser manipulados como una entidad por los programas lectores de libros, alguno de los cuales ya se ha anunciado tal como veremos en un apartado posterior.
   El problema es que el consorcio OEB no ha definido todavía una forma para garantizar los derechos de propiedad de los libros que adopten dicho formato y Microsoft ha aprovechado esta laguna para intentar introducir su formato alternativo, el cual se describe a continuación.

EL FORMATO «LIT» DE «MICROSOFT»

   El "truco" del formato LIT [LIT] no está en la forma como se produce el libro, sino en el proceso de cifrado o "compilación" posterior que cifra con hasta tres llaves el texto plano original, llaves que sólo puede usar para acceder al contenido el gratuito MS Reader, del que se dará más información en la sección sobre sistemas de lectura.
   El texto de los documentos LIT está basado también en el lenguaje XML. De hecho, LIT "casi" cumple con el estándar OEB según palabras de Microsoft. Microsoft se aprovecha de que el estándar OEB no resuelve el problema de gestionar los derechos de propiedad intelectual y solucionar este problema ha sido la clave para que presente una propuesta que puede crear un monopolio de graves consecuencias para la literatura y la cultura en general. Como no se conocen con exactitud las especificaciones del formato LIT, tanto la producción como la lectura de libros en este formato requieren siempre el uso de los programas gratuitos que Microsoft o sus empresas colaboradoras, como Overdrive, distribuyen para realizar estas funciones. Microsoft apoyó el estándar OEB y se despertó la esperanza de que el sector dispondría, al fin, de una base que diese a todos los interesados las mismas posibilidades de competir, garantizando el intercambio de libros entre distintos programas, tanto lectores como productores de documentos. Microsoft se basa en el citado estándar como una facilidad adicional, pues la forma más rápida de producir libros LIT es a partir de libros OEB, pero al mantener secretos los cambios entre LIT y OEB busca desviar el caudal de esfuerzos generados por la definición del estándar hacia su propio molino. Si es el LIT el formato que se impone al final, sobre el OEB o incluso sobre el PDF, Microsoft tendrá el monopolio del libro digital, al ser el LIT exclusivo de su empresa. En realidad, nadie cree que esto ocurra así, incluso si el LIT se impone, pues es seguro que en poco tiempo se descubrirán y revelarán las interioridades del LIT, pero de momento Microsoft tiene un período de ventaja sobre sus competidores hasta que esto ocurra. Lo deseable es que cuando el LIT ya no sea un secreto se vuelva al OEB como base del libro digital.

2.2.- FORMATOS DE LIBROS HABLADOS Y MULTIMEDIA

   Los libros de audio en castellano son muy escasos. Casi ninguna editorial saca versiones habladas de sus obras, aunque últimamente se observa una tendencia a mejorar esta carencia. Sólo la Organización Nacional de Ciegos de España (ONCE) distribuye de forma habitual, exclusivamente entre sus afiliados, este tipo de libro, cuando la gran mayoría de sus usuarios potenciales tienen un resto visual superior al 10% y no pueden afiliarse a esta organización. El formato de la cinta magnética es demasiado engorroso y voluminoso para que se considere rentable su producción. Sólo un cambio de tecnología puede modificar esta situación.
   Este cambio ya es técnicamente factible, como se ha demostrado con las publicaciones multimedia en CD-ROM que hay ya en el mercado. La adopción del CD-ROM (y su sucesor el DVD-ROM) y los soportes multimedia es la solución definitiva para el libro hablado. El problema vuelve a ser el de los formatos, ya que casi todas las publicaciones multimedia usan sistemas propietarios cuyos resultados son la mayoría de veces inaccesibles para las adaptaciones tiflotecnológicas. Aunque cada vez es más habitual el uso del HTML para estas publicaciones, éste se veía limitado por su insuficiente potencia y flexibilidad. El XML, sin embargo, viene a resolver el problema, ya que permite estructurar cualquier tipo de publicación multimedia.

TEXTOS MARCADOS MULTIMEDIA (LENGUAJE «SMIL»)

   En efecto, el XML permite adaptarse a cualquier objetivo si se definen las DTD's y hojas de estilo necesarias. Para la publicación multimedia se ha definido el lenguaje SMIL (Synchronized Multimedia Interactive Language), que permite todo tipo de formatos multimedia (textos, audio, gráficos, animación y vídeo) y su reproducción sincronizada. Con este formato se puede hacer que el texto se vaya visualizando en la pantalla al mismo tiempo que se reproduce la voz grabada que lo recita. De la misma manera, se puede sincronizar la animación y el vídeo con el texto (subtítulos) y la voz (descripción de audio). El SMIL puede usarse tanto para crear páginas Web altamente dinámicas como CD-ROM's o DVD-ROM's.
   Es evidente que el uso del SMIL no es ninguna garantía de accesibilidad por parte de personas con problemas visuales. Si ya ahora hay muchas páginas HTML de lectura difícil o imposible porque no siguen unas normas mínimas de accesibilidad, el uso del SMIL, o de cualquier otro lenguaje XML, no cambia la situación. Con el SMIL, a diferencia del OEB, lo más habitual será crear publicaciones inaccesibles. Por suerte, ya se ha creado el estándar necesario para usarlo de forma accesible: el DAISY.

EL CONSORCIO «DAISY»

   DAISY (Digital Audio Information SYstem) [DAI] es un estándar de libro digital multimedia, desarrollado por el consorcio del mismo nombre, que tiene como objetivo proporcionar publicaciones accesibles por personas con discapacidades visuales. El consorcio está formado por bibliotecas e instituciones públicas y privadas, entre las que se encuentra la ONCE.
   Ya han aparecido varias versiones de este estándar, que está ahora en el nivel 3.0, basadas en el lenguaje SMIL. También se han publicado directrices y se han dado cursos sobre cómo producir libros hablados estructurados con formato DAISY, pero todavía no parece que se estén comercializando de forma regular, por lo menos en lengua castellana, a pesar de que ya existen programas y dispositivos para leerlos, tal como veremos en la sección correspondiente. En Japón y en Suecia es donde estos libros están ya más introducidos.
   La mayoría de libros DAISY que se producirán estarán compuestos principalmente por audio estructurado, es decir, por ficheros de audio a los que se podrá acceder tanto secuencialmente como en acceso directo, a partir de los ficheros de texto marcado que los acompañen. Estos ficheros de texto estarán preparados para facilitar la navegación entre los distintos componentes de audio. Los ficheros de sonido podrán tener distintos formatos, ya que su lectura depende del dispositivo o programa que emplee el usuario para acceder a la publicación, pero lo más probable es que el formato MP3 sea el de uso más frecuente. No obstante, el DAISY permite incorporar también texto, y es así mismo factible crear libros DAISY totalmente de texto, que se pueden leer con voz sintética si el sistema de lectura incluye esta facilidad. Entre el documento que es sólo texto y el que es sólo audio existen todas las variantes posibles. El caso más completo sería el de un libro que presente su contenido en los dos medios, texto y voz grabada, y que además se pudiera leer sincronizando la audición de la voz con la presentación del texto que se estuviera leyendo.
   En resumen, las personas que tenemos dificultades para leer textos en tinta podemos confiar en un futuro mucho más atractivo si los libros electrónicos proliferan, ya que podremos acceder a gran cantidad de información, ya sea porque se publica para todos en formatos de texto fácilmente accesibles como el OEB, o porque se publica en el formato multimedia DAISY, especialmente diseñado para nosotros, cuya calidad es muy superior a la de los libros hablados de los que ahora disponemos.

2.3.- EL PROBLEMA DE LOS DERECHOS DE AUTOR

   Esta primera parte del artículo tiene que terminar con unas gotas de pesimismo, pues el problema que aquí se plantea es el mayor inhibidor para la proliferación del libro digital. En efecto, es difícil que un autor profesional esté dispuesto a publicar sus libros electrónicamente si cree que no va a poder cobrar el fruto de su trabajo porque su obra será pirateada (copiada sin pagar su precio) en vez de comprada. Lo mismo puede decirse de las empresas editoras y distribuidoras, si temen que sus costes de producción no se recuperarán debido al pirateo. Por ejemplo, el éxito del libro de Stephen King, mencionado en la introducción, se ha visto ensombrecido porque a los tres días de su lanzamiento ya había media docena de direcciones Web que lo ofrecían con gran alarde de forma gratuita, para demostrar que habían sido capaces de crackear (o sea, romper) un sistema de protección que impedía, en teoría, copiarlo o imprimirlo. La editora del libro se ha tenido que dedicar a perseguir a estas páginas para cortar la oferta fraudulenta.
   Este tema está muy ligado al de los formatos, porque se considera que los libros digitales deben poderse distribuir "encriptados" (del inglés "encrypted", cifrados) si se desea. Se dice también que los libros no cifrados se "compilan" antes de ser distribuidos comercialmente, por analogía con el procedimiento necesario para la distribución de software.
   Estos formatos compilados parten de alguno de los que hemos expuesto y los transforman usando claves de protección secretas, de forma tal que a partir de aquel momento sólo sus legítimos propietarios pueden manipularlos. La clave es necesaria tanto para leer el libro como para traspasarlo a otro equipo (es decir, "moverlo" pero no "copiarlo") o incluso prestarlo durante un cierto período de tiempo predeterminado. Por ejemplo, el libro de King pirateado estaba en formato PDF, y su descifrado en sólo un par de días ha provocado duras críticas para las empresas Adobe y GlassBook, que proporcionaron la tecnología de distribución del libro. Se aduce que mientras no se consiga un sistema de protección de los derechos de propiedad intelectual más seguro, el futuro del libro digital está en entredicho.
   Como curiosidad es interesante explicar que ya existe un formato cifrado diseñado para personas ciegas. Es denominado TFL y ha sido creado por los responsables de la lista de correos llamada Tiflolibros [TFL], que tiene también una página Web con el mismo nombre. La lista y la Web sólo pueden ser usadas por personas con discapacidad visual de habla castellana y su objetivo es el intercambio de libros escaneados entre dicho colectivo. Además, han conseguido que algunas editoriales les proporcionen sus libros para ser distribuidos a través de su página siempre que se conviertan al citado formato TFL, al que sólo puede accederse usando el lector llamado Tiflolector que se describe más adelante. Tanto el Tiflolector como los libros TFL se pueden descargar de la Web citada, siempre que se esté dado de alta en la lista de correos. Es una solución muy específica para personas ciegas y su alcance es en estos momentos bastante limitado, pero de gran utilidad para sus usuarios.

3.- ENFOQUES DE LOS SISTEMAS DE LECTURA

   Se están usando dos enfoques diferentes para ayudar a leer textos digitales. El primero y más antiguo usa la voz para facilitar la lectura; es decir, cambia la vista por el oído para evitar el cansancio visual que produce la lectura de la pantalla del ordenador. Es una solución radical que al cambiar el sentido a usar para leer no soluciona el problema real sino que cambia el entorno y la propia actividad de leer por lo que es más una huida hacia adelante que una verdadera solución al problema de leer en el medio digital.
   El segundo enfoque ya se enfrenta al verdadero problema visual y busca mejorar la imagen que ve el usuario de forma tal que la actividad de leer el texto sea cómoda y agradable gracias a la calidad de la imagen. Son las técnicas gráficas y tipográficas las que se emplean a fondo para facilitar la propia actividad visual de leer un texto. Incluso el propio ordenador llega a cambiarse totalmente en su diseño y se convierte en un dispositivo especializado para ser usado exclusivamente para leer, convirtiéndose él mismo en un sistema de lectura portátil; este caso extremo de transformación del ordenador portátil en libro digital es el último paso de la evolución estudiada en este artículo y para muchas personas será la única solución aceptable.
   Estos dos enfoques no son por lo tanto alternativos y pueden ser usados de forma complementaria, aunque en este momento no hay todavía productos que los combinen bien. Es muy posible que las mejores soluciones se consigan al final con el uso conjunto de vista y oído para hacer que la lectura de textos digitales sea un placer, pero en estos momentos ninguno de estos dos enfoques ha conseguido, usándolos por separado, alcanzar la aceptación generalizada que tienen los textos impresos.
   A continuación se presentan algunos de los productos que están siendo usados con estos dos enfoques.

3.1.- SISTEMAS DE LECTURA BASADOS EN LA VOZ

   Un ordenador puede hablar de dos formas distintas:
   - Usando voz sintética que genera a partir de partículas fonéticas elementales que combina para formar las palabras que emite a través de un sintetizador de voz (solución hardware) o de una tarjeta de sonido (solución software).
   - Usando voz natural grabada y digitalizada previamente que reproduce con la tarjeta de sonido del ordenador volviéndola a convertir en sonido. Para reproducir esta voz grabada emplea los mismos o parecidos programas usados para reproducir cualquier otro sonido, especialmente música.
   A continuación se describen los productos existentes para estas dos modalidades.

3.1.1.- SISTEMAS QUE USAN VOZ SINTÉTICA

   Es la solución más habitual y económica, aunque su calidad no alcanzará nunca la de una voz grabada, pues la voz sintética tiene siempre un sonido robótico. Para mejorar este defecto se está usando voz sintetizada, lo cual quiere decir que las partículas fonéticas elementales que se combinan para formar palabras se extraen de una voz natural proveniente de una persona con buena dicción. A pesar de ello, hace falta un cierto entrenamiento para acostumbrarse a estas voces, sin que esto represente un problema insalvable cuando el usuario necesita realmente la ayuda sonora.
   Los productos en este área tienen los dos objetivos siguientes: ayudar al descanso visual de personas con buena vista, es decir, aumentar su productividad, o suplir la discapacidad visual de personas ciegas o con baja visión. Lo más frecuente es que sólo persigan uno de estos objetivos, el cual marca profundamente la utilidad del producto, que requiere ser mucho más completo y complejo cuando busca servir para paliar la discapacidad visual.
   Para describir estos productos se han clasificado en los siguientes grupos:
   - Conversores de texto a voz
   - Lectores y editores de texto
   - Navegadores por páginas Web
   - Reconocedores ópticos de caracteres (OCR)
   - Lectores del contenido de la pantalla

CONVERSORES DE TEXTO A VOZ

   Dentro de este apartado se encuentran una gran cantidad de productos, algunos de ellos incluso gratuitos o de bajo precio que se limitan a verbalizar un texto seleccionado o copiado al portapapeles. Su objetivo suele ser simplemente un aumento de la comodidad y a través de ella de la productividad del usuario. Una denominación habitual para ellos es la de programas TTS, siglas de la frase en inglés Text To Speech (texto a voz).
   Uno de los más antiguos programas TTS es el TextAssist, que distribuyó durante años la empresa Creative Labs como obsequio a los compradores de sus tarjetas de sonido SoundBlaster. La calidad de sus voces multilingües y su flexibilidad de empleo le dieron gran popularidad y muchos productos más recientes no llegan todavía a alcanzar sus prestaciones. El problema es que era en realidad un producto desarrollado por otra empresa que no volvió a conceder permiso para distribuirlo más y ya no se puede usar con las tarjetas de sonido modernas.
   La mayoría de TTS actuales son monolingües y no permiten fácilmente incorporar nuevas voces. Aunque hay alguno en castellano o incluso en castellano y catalán, mi recomendado es el TextAloud de la empresa NextUp Technologies [NET], por integrar hasta siete idiomas e incorporar la función de convertir ficheros de texto a ficheros de sonido, la cual se explicará más adelante.
   Si lo que se desea es sólo la capacidad de leer un texto en un idioma determinado, la solución puede ser tan simple como la pequeña aplicación Digit, que es capaz de leer automáticamente cualquier texto que se copia en el portapapeles usando alguno de los motores de voz que distribuye la empresa francesa Elan Informatique con el nombre Digalo [DGL]. Entre las voces que vende a un precio muy asequible, ha ganado justa fama la voz sintetizada en castellano llamada Rafael por su claridad de dicción.
   En este apartado pueden incluirse también algunos productos más avanzados cuyo objetivo va más allá del aumento de productividad y buscan solucionar problemas de usuarios que tienen alguna discapacidad. Un ejemplo es el de la empresa de Irlanda del Norte TextHELP Systems [TXH], cuyos productos, que son posiblemente los TTS más completos y profesionales, están especialmente dirigidos a personas con dislexia, pero que también pueden ayudar a personas con baja visión o cualquier otra dificultad de lectura.

LECTORES Y EDITORES DE TEXTOS CON SOPORTE DE VOZ

   Ya el TextAssist, mencionado como producto TTS en el apartado anterior, incluía un editor de textos con soporte de voz y con facilidades para baja visión. Podrían citarse muchas referencias dentro de este apartado, pero es preferible dar sólo una selección de las mismas porque la mayoría corresponden a productos gratuitos o de bajo presupuesto de escasas prestaciones y que en general sólo soportan el idioma inglés.
   Una excepción es el HJPad, que se incluye como parte de JAWS y de Connect Outloud, productos para personas ciegas de Freedom Scientific [FRS]. Es un procesador de textos con funciones parecidas a WordPad con el añadido de leer los textos con voz sintética. Es un producto de la antigua Henter-Joyce, hoy absorbida por Freedom Scientific.
   Pero en este apartado debe destacarse de forma preferente el lector de documentos WYNN, que desarrolló Arkenstone, que hoy es también parte de Freedom Scientífic, que lo comercializa junto con IBM. Su objetivo es facilitar la lectura de muchos tipos de documentos, incluidas las páginas Web (o sea, en formato HTML). Sus facilidades se dirigen a ayudar a leer textos no sólo a personas con dislexia, ciegas o con baja visión, sino también a enseñar a leer a personas con dificultades de aprendizaje. Aunque las funciones de voz son las más destacadas, presenta también facilidades de visualización de textos que permitirían colocar este producto dentro de los que buscan mejorar la imagen para ayudar a leer. Su precio elevado limita enormemente su divulgación como sistema de lectura generalizado, pero bastantes de sus funciones tendrían que incorporarse a los programas que pretenden convertirse en los sistemas de lectura universales que más adelante se describirán.
   Debe añadirse que aunque el WYNN es el más conocido producto dirigido a personas con dificultades para leer, no es el único. La organización CAST [CAS], muy conocida por ser la creadora del verificador de accesibilidad para páginas Web denominado Bobby, desarrolla y distribuye otro facilitador de la lectura al que llama eReader. Tiene el atractivo de un precio más aceptable y tiene además versión para ordenadores Mac de Apple. El problema es que su soporte multilingüe tiene todavía que mejorar para ser aceptable. Obsérvese que estos dos productos, WYNN y CAST eReader, pueden ser de utilidad para aprender a leer y escribir en una lengua que no dominamos y que esté soportada por el motor de voz.
   También, es obligado referirse aquí al más flexible y potente de estos editores, con unas características tales que permiten usarlo para una gran variedad de aplicaciones, que incluyen la lectura de documentos en muchos formatos, la lectura de correo electrónico, la navegación con voz por Internet e incluso funcionar como un lector de pantalla, semejante a productos de muy elevado precio que veremos más adelante. Este producto, denominado Emacspeak [EMS] es no obstante gratuito, ya que se trata de software libre al estilo del sistema operativo Linux. Es uno de los pocos productos en este área que no pertenecen al entorno Windows de Microsoft, sino al mundo del Unix. La razón de su gran flexibilidad y potencia es que es una aplicación que añade soporte de voz al editor inteligente Emacs. Emacs, muy conocido y usado en todos los sistemas de la familia Unix, incluido el Linux, es mucho más que un editor de textos. En realidad es un completo sistema de desarrollo y prueba de software que incluye dentro de sus funciones un intérprete del lenguaje de programación LISP, especialmente pensado para aplicaciones de inteligencia artificial. Emacspeak es una aplicación LISP que convierte a voz toda la información que gestiona el Emacs. Como Emacs permite incluso ejecutar programas Unix dentro de su entorno, el Emacspeak lee las entradas y salidas de estos programas. Su limitación viene por el hecho de no usar la interfaz gráfica de Unix, el sistema X Window, por limitarse a la interfaz en forma de línea de caracteres. Emacspeak es la mejor solución existente para tener un sistema de lectura con voz de textos digitales bajo los diversos sistemas operativos Unix.
   Tampoco podemos olvidar en este apartado al lector Tiflolector, de la lista de correos Tiflolibros, ya citado al tratar del formato TFL, que cifra un texto plano para protegerlo. El uso del Tiflolector es la única manera de acceder a los libros en formato TFL. Tiene el aspecto de un editor de textos, pero visualiza los caracteres con el mismo color que usa para el fondo, con lo cual no se puede leer dicho texto con la vista. El "truco" está en que los programas lectores de pantalla, descritos más adelante, lo pueden leer con voz sintética, con lo cual los textos en TFL sólo son accesibles para los usuarios de estos lectores. Es una solución original e ingeniosa, pero demasiado particular para ser de uso generalizado.

NAVEGADORES CON SOPORTE DE VOZ

   Este apartado incluye una cantidad importante de productos a precios atractivos, incluso gratuitos. También aquí podemos introducir la clasificación entre ayudas a la productividad y adaptaciones para personas con discapacidad, destacando los segundos por sus mejores y más potentes funciones.
   El problema de estos productos proviene de que las páginas Web que se pueden visualizar con los navegadores son tan enormemente variadas y presentan tantas posibilidades de diseño que hacen difícil a dichos navegadores, si son poco sofisticados, manipular todo tipo de páginas. Los productos de este apartado no siempre son capaces de evolucionar al ritmo que está afectando este sector tan de moda y en poco tiempo se encuentran incapaces de manejar las páginas Web de más reciente desarrollo. El propio consorcio WWW ha desarrollado unas normas de accesibilidad, denominadas WAI (Web Accessibility Iniciative) [WAI] cuyo cumplimiento tendría que resolver este problema en teoría, pero se olvida con demasiada frecuencia su aplicación, además de no conseguir siempre su propósito. Por falta de leyes adecuadas en los países de habla hispana, las páginas Web en castellano son especialmente inaccesibles, a pesar de los esfuerzos que realiza la organización SIDAR [SID], dedicada a promover las normas WAI en este idioma.
   Este problema ha afectado al más popular de estos productos, denominado pwWebSpeak, que ha sido retirado del mercado por su fabricante, obligado a modificar su estrategia empresarial y centrarse en otros productos de su catálogo.
   Este hecho ha colocado en primera línea al navegador para ciegos y baja visión de IBM, denominado IBM Home Page Reader (HPR) [IBM], cuyas versiones más recientes son capaces de acceder y leer en muchos idiomas, incluido el castellano, las páginas Web más complejas. El programa está traducido además a bastantes idiomas aumentando su atractivo. El español es también uno de ellos, con lo cual tanto el programa como la voz sintética trabajan mejor en su conjunto.
   La gran ventaja de estos productos es su capacidad para leer la enorme variedad de documentos que hoy se publican en los formatos propios de las páginas Web. Estos formatos se están imponiendo no sólo para realizar páginas en Internet sino también en el mundo editorial. Todo parece indicar que el lenguaje de marcado XML y sus muchos derivados se van a convertir en el estándar de los libros digitales del futuro.

RECONOCEDORES ÓPTICOS DE CARACTERES (OCR) CON SOPORTE DE VOZ

   En este apartado se incluyen un grupo de productos, dirigidos a personas ciegas o con baja visión, que son capaces de leer gran variedad de documentos impresos en papel, especialmente libros, por lo que no pueden dejar de aparecer en este artículo. Incluso impresiona ver cómo después de colocar un libro abierto sobre el escáner, basta con apretar una tecla para lanzar un complejo proceso de escaneado, reconocimiento de las zonas de texto y de su orientación, conversión del texto en imagen a texto digital y lectura de dicho texto con voz sintética. El proceso no es demasiado rápido y puede durar más de un minuto desde apretar la tecla hasta oír la voz, pero abre todo un mundo nuevo de posibilidades a las personas que sin estos productos no tienen ninguna otra manera de poder leer un libro. Tampoco el proceso es perfecto y siempre se encuentran documentos para los que es imposible extraer el texto o para los que la cantidad de errores de reconocimiento de los caracteres es tan alta que la lectura se hace incomprensible, pero cuando el proceso se aplica a páginas con fondo blanco y letras negras de fácil lectura, el resultado puede llegar a ser perfecto. Por el contrario no se han conseguido todavía resultados aceptables para reconocer un texto manuscrito.
   En España son populares el Recognita, de origen húngaro y ya sin futuro por la desaparición de la empresa fabricante, y el Open Book, que tiene también versión en castellano y está desarrollado por la ya nombrada Arkenstone, hoy dentro de Freedom Scientific. Para las personas de habla inglesa existen bastantes productos dentro de esta categoría y dentro de ellos es obligado referirse a los productos de la empresa americana Kurzweil [KUR], por ser la primera que lanzó un producto de estas características y por mantenerse todavía como líder del sector. Un problema importante es el elevado precio de estos productos; Open Book y Kurzweil 1000 cuestan unos 1.000 dólares USA. Sólo recientemente se han anunciado unos productos de este tipo mucho más económicos, desarrollados por la empresa americana Premier Programming Solutions [PPS], destacando Scan & Read Pro por su soporte multilingüe, pero debido a la falta de una versión de demostración descargable desde Internet no parece se haya divulgado todavía entre las personas con discapacidad visual de habla hispana.
   Hay que destacar que a pesar de que la tecnología usada por estos productos los sitúa como los sistemas de lectura más sofisticados del mercado, su elevado precio y su enfoque a personas ciegas o con baja visión los deja fuera de competición en la dura pugna que está desarrollándose para imponer en la sociedad un sistema de lectura de libros digitales de aceptación universal. Su gran mérito es el de realizar en un proceso integrado la transformación de textos desde el soporte tradicional en papel al soporte de voz, pasando por la conversión del texto en imagen al texto digital.
   Para terminar esta sección debe indicarse que es posible adquirir equipos que integran en una sola caja todos los componentes necesarios para leer un libro en voz alta con sólo apretar un botón. Esto quiere decir que la caja contiene tanto el escáner como el propio ordenador cargado con todos los programas necesarios para realizar la lectura de libros. En España es popular el aparato denominado Galileo de la empresa Robotron, que distribuye la ONCE [ONC], pero hay otros muchos con la misma función, como por ejemplo el VERA de la tantas veces citada Freedom Scientific. Su precio es muy parecido a lo que cuesta un ordenador con los programas y dispositivos necesarios para hacer lo mismo que la caja, pero su existencia se justifica por las muchas personas que no desean aprender lo más elemental que se necesita para usar el ordenador y prefieren la caja maravillosa que lee por sí sola.

LECTORES DE PANTALLA

   A pesar de su sofisticación, los productos del apartado anterior no son los más usados por las personas con discapacidad visual, ya que la mayoría de usuarios de estas características prefieren usar los denominados lectores de pantalla, que en vez de leer directamente el contenido de un documento, extraen la información de la propia pantalla del ordenador. Algunos de ellos, denominados "magnificadores", amplían la imagen de la pantalla para que los usuarios con resto visual puedan ver más fácilmente lo que aparece en ella. Otros usan voz sintética o visualizan la información en un dispositivo de salida en el alfabeto Braille, que son las dos alternativas posibles para los ciegos totales. Todas estas adaptaciones escarban en las entrañas del sistema operativo y de las aplicaciones para extraer todos los textos de entrada y salida que se visualizan en el monitor, pudiendo las más potentes combinar varias de estas soluciones (magnificación, voz y Braille) a petición del usuario.
   Usando estos sistemas de rehabilitación visual se puede convertir en parlante la gran mayoría de aplicaciones tradicionales de presentación de texto, tales como editores y procesadores de textos, hojas de cálculo, sistemas de bases de datos, gestores de correo electrónico, navegadores de páginas Web o, incluso, los reconocedores ópticos de caracteres (OCR). Por ejemplo, usando un buen lector de pantalla es posible utilizar el excelente programa OCR Fine Reader de la empresa rusa Abbyy [ABB], de utilidad general y de precio muy asequible, sin tener que usar los mucho más caros programas específicos para ciegos, como el Open Book o el Kurzweil 1000. Estos dos programas usan precisamente el motor de OCR de la empresa Abbyy al que completan con voz sintética y facilidades para baja visión. Cuando se usa directamente el programa Fine Reader con un lector de pantalla, es este último el encargado de proporcionar la adaptación que necesita el usuario ciego o con baja visión consiguiendo un resultado aceptable, aunque sin un nivel de integración tan alto como el que proporcionan los productos específicos para estos usuarios.
   Estas adaptaciones son, por lo tanto, alternativas posibles a cualquiera de los productos parlantes que hemos visto en los apartados anteriores; pero no todo son ventajas. Sus desventajas con respecto a ellos son su alto coste, la complejidad elevada de su interfaz de usuario y su incapacidad para extraer texto en muchas situaciones en que las aplicaciones presentan el contenido de forma no estandarizada por la costumbre o las prácticas de diseño más habituales. Destaca entre los problemas de accesibilidad a la información que pueden sufrir los usuarios de estos productos, los creados por muchas páginas Web que se saltan las normas de accesibilidad dictadas por el propio consorcio World Wide Web y ya comentadas anteriormente.
   En España, el lector de pantalla más usado es el JAWS que comercializa la empresa americana Freedom Scientific, ya citada varias veces en este artículo. La ONCE se encarga de traducir y distribuir la versión castellana de este producto, que puede usar la salida Braille, además de la voz sintética que es la causa por la que aparece en este artículo. También tienen, desde hace poco tiempo, versión castellana los productos de la empresa inglesa Dolphin, entre los que destacan Hal y Supernova, pero todavía no han alcanzado la divulgación que sus buenas prestaciones merecen.
   Finalmente, también merece ser mencionado el lector de pantalla outSPOKEN de la empresa holandesa Alva [ALV] por dos razones; está también disponible en castellano y es el único que tiene una versión para los ordenadores Mac de la empresa Apple. Es de lamentar que tengamos tan sólo tres opciones en este campo, pero productos tan importantes como el Window-Eyes de la empresa americana GW Micro [GWM], que es la más seria alternativa al JAWS, no tienen versión castellana aunque sean multilingües.
   Sin embargo, es evidente que el día en que la voz se incorpore de forma universal a los sistemas informáticos, no lo hará a través de estos productos, extraños al propio sistema operativo y parásitos del mismo además de caros. La implantación generalizada de la voz será a través de funciones integradas de forma nativa en el propio sistema operativo, por lo cual estas adaptaciones sólo se van a seguir empleando, con carácter transitorio, por aquellas personas que no tienen otra forma de acceder al ordenador debido a su discapacidad visual. En ningún caso pueden ser vistos como soluciones universales para leer textos digitales, aunque sean, hoy por hoy, la alternativa más potente y flexible para leer cualquier formato de texto para el que exista un programa informático capaz de visualizar dicho texto en la pantalla del ordenador.

3.1.2.- SISTEMAS QUE USAN VOZ GRABADA

   Hace ya bastantes años que se publican libros grabados a partir de la voz de un locutor. En poesía es muy apreciada la versión de un libro de este género leído por su propio autor, pero la publicación de libros hablados no se limita a este caso singular y en muchos países, especialmente los de habla inglesa, es habitual que las grandes librerías tengan una sección de venta dedicada a este tipo de material, que no está destinado únicamente a las personas con problemas visuales, sino al público en general.
   En castellano no es frecuente la edición de textos en este formato y su uso sólo está consolidado entre las personas con problemas visuales. El mercado es, por lo tanto, restringido, pero merece ser comentado debido a que se prevé un cambio importante gracias a la transformación del actual formato analógico en formato digital.
   En efecto, se está generalizando el uso de formatos muy compactos de audio, especialmente el ya famoso MP3, que permiten manejar de forma eficiente ficheros de sonido en las cada vez más grandes memorias magnéticas de ordenadores y dispositivos inteligentes. El uso de estos formatos abre un universo de posibilidades que ya se empieza a aprovechar. Las voluminosas cintas magnéticas analógicas, inflexibles por forzar la lectura siempre secuencial del texto, están siendo sustituidas por memorias de acceso no secuencial que almacenan sonido digital grabado de forma muy compacta y, a pesar de ello, con buena calidad auditiva.
   Las publicaciones multimedia están utilizando ya estas nuevas posibilidades, pero todavía no se ha generalizado la distribución de libros hablados usando las nuevas tecnologías de audio. Ya hemos visto que existe un estándar reconocido para estos libros, denominado DAISY, pero no se ha dado el paso definitivo para su implantación. La única razón de este atraso parece ser el elevado coste que requiere el lanzamiento masivo de los nuevos libros y dispositivos. Parece que los posibles interesados en realizar este lanzamiento están esperando a ver como el mercado reacciona ante la oferta de libros digitales más convencionales que se analiza posteriormente en este artículo, en el apartado sobre sistemas de lectura basados en la imagen.

REPRODUCTORES DE SONIDO

   Aunque sigamos a la espera de mejores soluciones, ya es factible usar los actuales programas grabadores y reproductores de audio para manejar textos grabados. Aplicaciones como Winamp, Real Player o Windows Media Player sirven para este objetivo. Aunque se asocian siempre con la música, sus funciones actuales proporcionan ya una lectura más flexible y cómoda que la que puede conseguirse con los reproductores analógicos actuales, incluyendo aquí los reproductores de cintas de cuatro pistas usados de forma exclusiva por las personas con discapacidad visual.
   La gran ventaja de estos productos es que son gratuitos o de bajo precio gracias a la enorme divulgación que han conseguido entre los aficionados a la música. La única dificultad que presentan para las personas con discapacidad visual es que no son demasiado accesibles con los lectores de pantalla antes comentados por usar símbolos gráficos para controlar la audición, pero con un poco de práctica se consigue superar estas barreras.

SISTEMAS DE LECTURA DE LIBROS HABLADOS Y PRODUCTOS MULTIMEDIA

   Debe comentarse aquí que ya existen en el mercado sistemas de lectura destinados específicamente para libros hablados, aunque no estén bien implantados ya que faltan, como ya se ha comentado, los libros que deben ser leídos por dichos sistemas. La empresa sueca Labyrinten [LAB] y la americana isSound.com [ISS] han desarrollado programas, como el LP Player, para reproducir libros en el formato DAISY, pero el atraso en la aparición de estos libros está afectando a su venta.
   La situación actual no parece que vaya a cambiar a corto plazo y hasta que no se vea claro el futuro de los libros digitales convencionales no puede esperarse que se desbloquee dicha situación.

CONVERSIÓN DE VOZ SINTÉTICA EN VOZ GRABADA

   La producción de libros hablados digitales convencionales requiere que un buen locutor lea previamente el texto deseado y luego se proceda a la edición del fichero de audio generado para eliminar los posibles defectos introducidos. Por ello, un libro hablado será siempre un producto caro de producir si se desea un nivel de calidad aceptable. No obstante, existe una manera rápida de producir este material si se está dispuesto a sustituir la voz humana por la voz sintética, aunque este cambio representa indudablemente una pérdida importante en las cualidades del producto resultante.
   En efecto, se puede usar un programa que combine la lectura de un texto con voz sintética con la conversión a un formato de audio. Ejemplo de un programa de estas características es el ya citado TextAloud, de la empresa NextUp Technologies, que permite crear un fichero en formato MP3 en unos pocos minutos con sólo copiar al portapapeles el texto que se quiere convertir y pinchar en un botón de la botonera flotante que este programa visualiza en la pantalla.

3.1.3.- DISPOSITIVOS DE LECTURA BASADOS EN LA VOZ

   Hasta este momento se han presentado sistemas de lectura usando voz (sintética, grabada o una combinación de ambos tipos) que requieren el empleo de un ordenador para poder ser usados. Aunque ya existen ordenadores portátiles, es indudable que un ordenador, por ligero y cómodo que sea, nunca tendrá la fácil manejabilidad de un libro convencional. Es difícil imaginar que estos sistemas informáticos lleguen a sustituir en la vida real a los libros en papel si no adoptan formas físicas más portables y manejables. En los apartados siguientes vamos a revisar algunos dispositivos diseñados para conseguir estas ventajas.

DISPOSITIVOS CON VOZ SINTÉTICA

   Las fuertes limitaciones fonéticas asociadas a la voz sintética hacen que en este apartado sólo aparezcan dispositivos diseñados para personas con discapacidad visual. Destacan los denominados "anotadores", o sea, dispositivos portátiles destinados a que este colectivo pueda sustituir el uso de papel y lápiz por un pequeño aparato que le permita registrar información. Estos anotadores tienen el aspecto de un teclado portátil, que en la mayoría de casos es un teclado Braille en vez de un teclado convencional, pero contienen además en su interior un sintetizador de voz con el que se puede leer la información que contiene la memoria del dispositivo.
   Como es fácil de imaginar, estos dispositivos son en realidad pequeños ordenadores camuflados bajo su aspecto de un simple teclado. Gracias a esta característica ofrecen otras funciones de gran utilidad para sus usuarios, ya que contienen software adecuado para servir de reloj-despertador, calculadora, libreta de direcciones con teléfonos y agenda además de anotador. También se pueden conectar a ellos otros dispositivos informáticos, como impresora y disquetera, y ellos mismos se pueden conectar a otros ordenadores para intercambiar información entre sí o, incluso, para actuar como teclado Braille y sintetizador de voz externo del otro ordenador. Los más completos de estos dispositivos tienen también salida en caracteres Braille, aunque esta adición aumenta considerablemente el precio del mismo.
   Gracias a estas características, es factible descargar en estos anotadores ficheros de texto digital en distintos formatos, entre ellos el formato Braille naturalmente, y usarlos para su lectura con voz sintética.
   El más famoso fabricante de estos aparatos era la empresa americana Blazie Engineering, que actualmente ha sido absorbida también por Freedom Scientific. Sus anotadores tienen justa fama de dispositivos "todo terreno", casi irrompibles y muy duraderos, aunque se les achaca que al usar un sistema operativo propio no pueden aprovechar todo el software disponible para ordenadores más convencionales. El enfoque alternativo de usar sistemas de amplia divulgación general, como el MS-DOS o el Windows CE es ofrecido por otros anotadores, como el SonoBraille, recientemente anunciado por la ONCE, y el Braillenote, aparato de elevadas prestaciones pero también elevado precio de la empresa de Nueva Zelanda Pulse Data [PLD]. El último anuncio en este mercado es el anotador ElBA de la empresa alemana Papenmeier [PPM], cuyo aspecto más destacado es usar el sistema operativo Linux.
   Sin embargo, hay usuarios discapacitados visuales que consideran preferible emplear un ordenador portátil convencional dotado de las adaptaciones necesarias, como por ejemplo un lector de pantalla, a estos dispositivos específicos para ciegos. La realidad es que, aunque la frontera entre ellos no está muy claramente trazada, anotadores y ordenadores portátiles son dispositivos con objetivos diferentes. Un anotador sirve precisamente para tomar notas; por ello será el preferido por un estudiante ciego para asistir a clase y pasar los apuntes luego al ordenador, pero no es el mejor aparato para lectura con voz sintética. Hay que reconocer que la voz robótica de los anotadores de Blazie Engineering requiere mucha práctica para ser aceptada como inteligible.
   Existen también algunos aparatos portátiles cuyo objetivo es directamente la lectura de textos, pero su divulgación es todavía escasa. El más conocido es el denominado Road Runner [RRN], pero sólo está disponible para textos en inglés. También es digno de mencionar el lector de Braille portátil denominado Book Worm, fabricado en Alemania, pero su elevado precio, habitual en todos los equipos que tienen salida en Braille, no ayuda a su popularización.

DISPOSITIVOS PARA LIBROS HABLADOS

   Dado que un libro digital hablado puede reproducirse en los mismos aparatos que sirven para reproducir música digital, existe una gran variedad de equipos entre los que elegir para esta función. Entre ellos destacan los reproductores MP3, disponibles tanto en formato de sobremesa como portátiles. Entre los primeros los hay autónomos o bien conectables a una cadena musical o a un televisor. Entre los portátiles los hay de muchos tamaños, incluso de muñeca que sirven de reloj además de reproductor de sonido. El tamaño más cómodo es posiblemente el de una cajetilla de tabaco, que es el del primer dispositivo anunciado de este tipo, denominado Rio de la empresa Diamond (actualmente perteneciente a S3), que contribuyó con su éxito a la proliferación actual de dispositivos competidores.
   La característica más importante de estos dispositivos es su forma de almacenar los ficheros de audio, incluyendo el tamaño de memoria destinado a esta función. Los aspectos más importantes a considerar son el tamaño de la memoria y su característica de ser removible o fija. Sobre el tamaño debe tenerse en cuenta que un megabyte (MB) de datos contiene aproximadamente un minuto de música en MP3, pero hasta cuatro minutos de voz grabada. Por lo tanto, incluso los reproductores más sencillos con 32 MB pueden contener hasta dos horas de voz, suficiente para la mayoría de aplicaciones ya que es conveniente no manejar ficheros de más de 15 minutos de duración para tener un acceso flexible a los mismos. Las memorias removibles son más cómodas de usar, pero no hay todavía un modelo de cartucho o disco estandarizado para esta función. Para las grabaciones más voluminosas el disco compacto sigue siendo una opción barata y eficiente ya que es empleado por varios modelos de reproductores, puede grabarse en ordenadores domésticos y contener más de cuarenta horas de voz gracias a su capacidad de 650 MB.
   Sin embargo, estos reproductores de música no son tan flexibles como sería de desear para aplicaciones de texto, ya que no reconocen las características de un libro digital y no pueden hacer funciones tan básicas como saltar a una página determinada y mucho menos navegar por los contenidos. Para conseguir estas ventajas se tienen que emplear los formatos multimedia específicos para libros hablados como el ya mencionado DAISY. Aunque ya existen en el mercado reproductores de este formato, como el denominado Victor de la empresa canadiense VisuAide [VSA] y el Plextalk de la japonesa Plextor [PLX], la falta de producción de títulos con dicho formato no anima todavía a adquirir uno de estos aparatos, aunque puedan usarse para reproducir MP3 o incluso CD's de audio convencionales.

3.2.- SISTEMAS DE LECTURA BASADOS EN LA IMAGEN

   No obstante la gran variedad de productos y dispositivos que hemos relacionado hasta este momento, se ha de reconocer que ninguno de ellos representa una verdadera alternativa al placer de leer un libro en papel. Leer y oír son dos cosas muy diferentes y escuchar un texto no será nunca equivalente al hecho de leerlo. Por esto se dice que los ciegos que no saben leer Braille y necesitan la voz para acceder a una información son semejantes a los analfabetos, pues nunca debe abandonarse el Braille por mucho que las nuevas tecnologías de voz aumenten considerablemente la cantidad de información a la que puede llegar a acceder una persona ciega o con baja visión.
   Aquellos que profetizan la paulatina sustitución del libro convencional por el libro digital no esperan, por lo tanto, que el cambio sea debido a ninguno de los sistemas que hasta ahora hemos visto, sino a los sistemas que visualizan la imagen de los textos en la pantalla de un dispositivo. Tampoco piensan que los textos a visualizar estén en los formatos más corrientes actualmente, como pueden ser el texto plano sin formato (ASCII o ISO), el RTF, el DOC del MS Word, ni siquiera el texto estructurado HTML. Su visión se basa en el uso de formatos específicos para el libro digital, como PDF, OEB y LIT, y en el uso de programas gestores de estos formatos específicos. Para justificar esta poco creíble, por el momento, profecía se basan en dos razones: las indudables ventajas económicas del soporte electrónico y las mejoras visuales que los nuevos sistemas de lectura aportan.
   Sobre las ventajas económicas no hace falta extenderse porque es evidente que el formato digital es mucho más fácil de producir y distribuir, evitando además el riesgo que siempre se corre al lanzar la impresión inicial de un libro, especialmente de un autor novel. El soporte digital resuelve además el difícil problema de almacenamiento y transporte de los libros en papel. Lo que si quiero resaltar es que estas ventajas económicas no se están reflejando suficientemente todavía en los precios a los que se venden los primeros libros digitales. Este hecho puede justificarse ya que es elevada la inversión de lanzamiento de los centros de venta en Internet, que además necesitan amortizarse en poco tiempo dada la rápida evolución de esta tecnología. También puede justificarse por el bajo mercado potencial, que es aún escaso dado que pocos navegantes están ya acostumbrados a comprar a través de Internet, exceptuando quizás en Estados Unidos. Pero lo cierto es que si las ventajas económicas no se traspasan también a los clientes, no puede esperarse un cambio a corto plazo de los hábitos lectores. Si la demanda de literatura no obtiene ventajas claras no atenderá a la propaganda de la oferta, por muchas profecías que se auguren.
   Lo que es propio de este artículo es el tema de las mejoras visuales que aportan los sistemas de lectura, con las que se espera conquistar a los lectores potenciales. A continuación se presentan los primeros sistemas con las nuevas (o a veces no tan nuevas) aportaciones.

3.2.1.- PROGRAMAS LECTORES DE LIBROS DIGITALES

   Dos empresas americanas son las líderes actuales en la carrera por conseguir la primacía entre los lectores de libros: Adobe y Microsoft. Aunque no son los únicos participantes no son inquietados por ningún otro corredor. Incluso IBM, que fue el fabricante pionero de estos productos con el denominado Book Manager, no parece ahora dispuesto a competir en este mercado. Tanto Adobe como Microsoft están distribuyendo sus programas lectores de forma gratuita, basando sus ingresos en fuentes diferentes a las de la venta del software. Los ingresos se obtienen de las comisiones que se cobran a las editoriales por las ventas de libros en los formatos digitales propietarios que se requieren para poder leer con dichos programas; estos formatos son los ya descritos PDF y LIT. Este enfoque debe tenerse muy en cuenta para entender lo que está pasando, pues la carrera antes mencionada no se está realizando ante los ojos del público lector, sino dentro del mundo editorial. El vencedor no lo van a elegir los lectores (la demanda) sino los editores e incluso los escritores (o sea, la oferta). Veamos las dos ofertas en litigio que pugnan para convencer a los editores de las ventajas de su propuesta.
   Adobe parte con la ventaja de tener gran experiencia en el mercado editorial, que le es propio. Es líder en programas de autoedición, usados para producir libros convencionales. Con su oferta las editoriales pueden producir en el mismo proceso tanto el libro digital como el libro listo para ser impreso en papel. El PDF es un formato antiguo y muy consolidado para el que existen hace ya muchos años programas lectores que visualizan el contenido del libro en la pantalla del ordenador; entre estos programas destaca el propio de Adobe, denominado Acrobat Reader, del cual se acaba de anunciar la versión 5. Puede descargarse de forma gratuita del centro Web de Adobe y de muchos otros sitios de Internet dedicados al mundo del libro; también está disponible en los CD-ROM's de productos multimedia que usan PDF. Por ello, millones de ordenadores en todo el mundo tienen instalado ya el Acrobat Reader u otro lector de PDF. Esta amplia divulgación otorga a Adobe una situación de privilegio y su principal fuente de ingresos actual es la venta de programas de autoedición que generan documentos PDF. La penetración de este formato en la Web es también muy importante y los principales programas navegadores son capaces de visualizar estos documentos con la colaboración del Acrobat Reader.
   A pesar de ello, el Acrobat Reader no es la oferta de Adobe para el naciente mercado de los libros digitales, por dos razones. La primera es que Acrobat Reader es una aplicación informática convencional, cuya interfaz con el usuario está inspirada en la interfaz gráfica del sistema operativo en que se ejecuta, por ejemplo Windows o MacOS; por lo cual, se considera poco conveniente para el público general y se supone que un programa lector de libros digitales debe simular la apariencia de un libro real para hacer su manejo más atractivo. Pero la segunda razón es la que parece más importante para dejar a un lado al ya popular Acrobat Reader, y es que no se considera que sea capaz de proteger de forma completa los derechos de propiedad intelectual de los autores y editores. Precisamente debido a su universalidad es fácil de crackear cualquier intento de cifrado que se base en este lector, demasiado convencional para los hackers.
   Para superar estos inconvenientes Adobe tiene ahora otro lector, también gratuito, denominado eBook Reader. Para entrar en el mercado del libro digital, Adobe compró Glassbook, empresa fabricante del Glassbook Reader, lector basado también en el formato PDF pero diseñado específicamente para el nuevo mercado. Este lector se hizo famoso por ser necesario para leer el libro de Stephen King "Riding the Bullet", que sirvió de disparo de salida de la carrera que aquí se relata, por lo que se colocó inicialmente en la cabeza de los participantes (aunque no podemos dejar de recordar que fue crackeado en pocos días). El nuevo Adobe eBook Reader es el nombre de la segunda versión del Glassbook Reader, mejorada con la experiencia de Adobe.
   El formato PDF tiene, por lo tanto, el atractivo de estar ya introducido en el mundo editorial. Un libro publicado en PDF puede seguir uno o ambos de los procesos siguientes: ser impreso en papel por la industria gráfica, y/o ser "compilado" (cifrado en un formato ilegible sin el lector especializado) para ser distribuido como libro digital. Si a esto añadimos la indudable calidad visual de los libros PDF, no es extraño que sea considerado por muchas personas como el único capaz de oponerse a los planes del gigante Microsoft.
   Hace ya tiempo que Microsoft está tratando de diversificar su negocio, demasiado centrado en el siempre arriesgado mercado del software. Como no ha conseguido tener éxito en sus intentos anteriores, ha puesto ahora su mirada en la edición digital, a la que profetiza un brillante futuro a corto plazo. Su oferta en este nuevo mercado se dirige a los editores y distribuidores ofreciéndoles la tecnología que les garantiza que los libros editados con dicha tecnología son a la vez de atractiva lectura e imposible pirateo. Para atraer a los lectores distribuye de forma gratuita el programa Microsoft Reader, que visualiza los textos de forma tan legible en una pantalla como si estuviesen en papel. Se destaca especialmente su legibilidad en las pantallas de tecnología LCD, usada en ordenadores de bolsillo (a menudo llamados PDA's por las siglas de Personal Digital Assistant) y agendas electrónicas. Incluso se ha diseñado un nuevo tipo de letra, denominado ClearType, cuya legibilidad en pantallas LCD es superior a la conseguida hasta la fecha. Se supone que estos aparatos van a ser los preferidos para almacenar y transportar los libros digitales. Por esto la primera versión del MS Reader fue anunciada para el sistema operativo Pocket PC, evolución del Windows CE, que es la versión compacta y ligera del Windows. Los fabricantes de ordenadores de bolsillo que usan el Pocket PC confían en este programa lector para conseguir un éxito de ventas semejante al que obtuvo en su día el IBM PC o el teléfono móvil. Pero como esta fenomenal aceptación está lejos de producirse, Microsoft ha vuelto a su mercado cautivo y está resaltando también los atractivos del MS Reader en los ordenadores de sobremesa, o sea, la versión para Windows; estos atractivos son menos evidentes ya que la gran pantalla no ha sido nunca cómoda de leer.
   Por esto, el aspecto más interesante de la oferta de Microsoft es la forma como quiere atraer a los editores y distribuidores de libros, pues espera conseguir sus ingresos mediante las comisiones que pagan estas empresas por usar su tecnología. Lo más atractivo de esta tecnología es que Microsoft asegura que empleando su formato propietario LIT, los libros cargados dentro del MS Reader no pueden ser extraídos del ordenador ni, por lo tanto, distribuidos fuera del control de los editores.
   Se está usando aquí la táctica típica de ofrecer gratuitos unos servicios que se están cobrando de forma indirecta gracias a los precios más elevados de lo que podrían ser debido a una situación de primacía o monopolio en otro sector para impedir la entrada de competidores. Empresas editoriales aliadas a las empresas de informática mantienen así los precios altos para los libros digitales y los potenciales beneficios del público lector no llegan a materializarse.
   Por suerte, la situación no está todavía estabilizada, y dos alternativas pugnan por cambiarla. La primera se basa en el formato estándar OEB, para el que han empezado a aparecer programas lectores, también gratuitos porque son ofrecidos por empresas editoras que confían todavía en el éxito de este formato, a pesar de su carencia de una forma de proteger los derechos digitales. Ya están anunciados por lo menos dos de estos programas lectores. La empresa GlobalMentor [GLM] ha anunciado el lector MentorAct, y la también americana ION Systems [IOS] el eMonocle ya disponible. Es de agradecer que eMonocle ha tenido especialmente en cuenta las necesidades de las personas con discapacidad visual y ofrece opciones destinadas a facilitar la accesibilidad. Este paso permite confiar en el incremento de la oferta de libros en formato OEB, hasta ahora bastante limitada. Somos los usuarios los que debemos apoyar esta tendencia comprando estos libros con preferencia a los ofrecidos en formatos propietarios y que restringen nuestros derechos de manipulación de los mismos.
   La otra alternativa que se mantiene todavía abierta es la que representan los dispositivos específicos para leer libros digitales. Este interesante enfoque alternativo se analiza a continuación.

3.2.2.- DISPOSITIVOS DE LECTURA BASADOS EN LA IMAGEN

   Estos aparatos representan el cambio más radical entre todas las propuestas vistas hasta ahora. La idea de usar un dispositivo lo más parecido a un libro, que oculta su aspecto de aparato electrónico para tener el tamaño, el aspecto físico y hasta el tacto de un libro, es el enfoque que más simpatías despierta entre muchos aficionados a la lectura. Se ha querido reservar el nombre de "libro electrónico" para estos aparatos, pero el nombre no ha cuajado ya que también se usa a menudo para referirse al libro digital, es decir, al contenido en lugar del continente.
   Esta idea de alejar radicalmente el libro digital del entorno informático que le es propio es la que representa una visión menos revolucionaria del cambio propuesto, ya que el lector de libros apenas tiene que cambiar sus hábitos para acceder a las ventajas de los documentos digitales. Aunque la mayoría de productos siguen utilizando un ordenador, al cual se conecta el aparato lector, para comprar en Internet y manipular los libros, existen incluso soluciones autónomas que permiten conectar directamente el dispositivo a la red para realizar estas funciones, aunque el elevado precio de estos dispositivos no ha permitido que sean los más vendidos.
   De hecho este enfoque, basado más en el hardware, ha entrado también en una situación de espera, semejante a la ya descrita para las soluciones basadas en software. Aunque las causas son diferentes, ninguno de ellos está cerca de conseguir el estallido, tan profetizado, del mercado.
   Hace un par de años, varios dispositivos competían por emerger como libros electrónicos de amplia divulgación, cómodos de usar y de precio aceptable. Entre ellos parecía estar a punto de imponerse el denominado Rocket eBook de la empresa Novomedia. Llegó a conseguir un cierto status de ganador, ya que además de su precio asequible estaba respaldado por una lista creciente de libros digitales en el formato propietario de este dispositivo. Pero entonces la empresa Gemstart, conocida por producir guías de programas de TV, decidió entrar en este mercado emergente y compró tanto Novomedia como su principal competidora Softbook. Gemstart ha anunciado nuevos dispositivos que se supone sustituyen a los anteriores de las empresas absorbidas, pero a precios menos atractivos y sin ventajas suficientes para que los antiguos clientes se animen a renovar sus aparatos ni para conseguir muchos nuevos usuarios. Estos dispositivos están fabricados por RCA con licencia de Gemstart y se denominan RCA REB 1100, sucesor del Rocket eBook, con pantalla monocroma y RCA REB 1200 de pantalla cromática y mayores prestaciones y precio. Ambos usan un formato propietario y han introducido un sistema de protección de derechos digitales más rígido que el anterior, lo cual no ha gustado a sus clientes.
   La entrada de Adobe y Microsoft con sus soluciones de software gratuitas no ha ayudado nada y de aquí nace esta situación de espera. La entrada de alguna oferta nueva, como las de Franklin Electronics [FRE], fabricante de diccionarios electrónicos de bolsillo, en este subsector tampoco ha servido para animarlo. El lector eBookman ha recibido elogios de sus compradores, pero esto no ha servido para que tenga una amplia aceptación.
   Para complicar la situación se ha revelado recientemente que se ha conseguido crackear el sistema de protección contra la copia usado por Gemstart, lo cual puede afectar sin duda a la disposición de las editoriales a proporcionar sus libros para este soporte.
   La duda que se está planteando es si no es preferible el uso de ordenadores de bolsillo (PDA's) con programas lectores a dispositivos de lectura específicos. Destaca aquí el hecho de que el mayor competidor con que se enfrentó el Roquet eBook fue la oferta de libros digitales de PeguinPress, que emplean un programa lector que viene en las agendas electrónicas que usan el sistema operativo PalmOS, que no ha sufrido los cambios de formato que han dañado a los productos de Gemstart. Por esto, los dispositivos de lectura nuevos, como el citado eBookman de Franklin y el nuevo Hiebook, anunciado pero todavía no disponible al escribir este artículo, están proporcionando otras funciones adicionales a la lectura de libros. Es interesante destacar que el Hiebook Reader, además de lector de libros y agenda electrónica, es reproductor de sonido en formato MP3, lo cual abre de inmediato la posibilidad de usarlo con voz sintética. Ya se puede adquirir en una pre-oferta del distribuidor de libros eBook Home [EBH] por 250 dólares USA junto a un paquete adicional de libros digitales. Aunque todavía no está claro en la nota de prensa que lo anuncia, parece que es capaz de leer libros en formato OEB, aumentando el atractivo creciente de este formato estándar.

4.- BREVE INTRODUCCIÓN A LOS SISTEMAS DE PRODUCCIÓN DE DOCUMENTOS DIGITALES

   Es evidente que para que el libro digital tenga éxito debe ser fácil y económico de producir. Aquí se encuentra una de las más importantes ventajas del formato digital sobre el convencional. Existen muchas formas de producir libros digitales, tanto de forma profesional como incluso doméstica. Aunque no es el tema central de este artículo, es interesante resaltar la variedad de aplicaciones informáticas cuyo resultado final es un documento digital.
   Esta variedad de aplicaciones incluye:
   * Aplicaciones de autoedición: Programas que producen libros listos para ser impresos por medios convencionales. Estas aplicaciones son ideales para organizar los servicios denominados "Impresión bajo demanda" (Print on Demand o simplemente POD), en los cuales el libro se imprime cuando lo compra el cliente. El formato PDF es ideal para este servicio.
   * Generación de páginas Web: Usa los mismos programas empleados para generar páginas Web, especialmente aquellos que ya utilizan lenguaje XML. La gran flexibilidad del XML permite que se use el mismo fichero fuente para producir múltiples resultados, sean páginas Web o libros.
   * Sistemas de autor para publicación multimedia: Los lenguajes de autor usados para publicar en CD-ROM son igualmente válidos para crear libros digitales.
   * Sistemas de producción de libros hablados: Los nuevos formatos desarrollados para producir libros con voz grabada permiten también manipular textos y sincronizar textos y voz cuando son leídos. Microsoft ha declarado su intención de usar el estándar DAISY de libros hablados para discapacitados visuales en su programa lector MS Reader.
   * Generación de libros digitales a partir de textos: De forma general cualquier editor o procesador de textos puede servir también para crear libros digitales. Incluso muchos profesionales no usan sistemas más sofisticados para crear sus documentos, por ejemplo en XML. Existen programas o incluso macros de procesador de textos gratuitos que generan los libros digitales a partir de textos editados de forma convencional. Hasta el formato PDF se crea automáticamente a partir de dichos textos de forma simple, por ejemplo haciendo imprimir el texto en una pseudo-impresora que es en realidad un convertidor a PDF.

4.1.- CREACIÓN DE UN TEXTO EN «BRAILLE» DIGITAL

   Un caso especial a considerar aparte es la creación de textos en el alfabeto Braille literario a partir de un texto digital convencional. Existen programas convertidores que realizan esta transformación, de los cuales el más usado en nuestro país es el desarrollado por la ONCE con el nombre de COBRA. Es antiguo, es una aplicación DOS, y no muy amigable pero es barato (5.000 ptas.) y rápido. El programa más usado internacionalmente para esta función es el Duxbury Braille Translator (DBT) de la empresa americana Duxbury Systems [DBS], que es un completo procesador interactivo de textos en Braille. Su precio, sin embargo, es lógicamente mucho más alto (unos 500 dólares USA). Es importante darse cuenta de que un texto en Braille de este tipo es difícilmente manipulable con cualquier otra adaptación que use un sistema de representación que no sea Braille (por ejemplo voz sintética), por lo que la conversión a Braille literario sólo nos interesa cuando la representación deseada sea exclusivamente el Braille, por ejmplo por desear escuchar el texto en un anotador portátil como puede ser el SonoBraille.

5.- LA GESTIÓN DE DERECHOS DIGITALES Y SU INFLUENCIA SOBRE LA ACCESIBILIDAD

   Para terminar la presentación de los distintos sistemas de lectura, es interesante destacar las grandes diferencias entre los sistemas basados en la voz y los basados en la imagen en relación con el difícil problema de los derechos de autor, denominado en inglés con las siglas DRM por Digital Rights Management.

5.1.- ESTADO ACTUAL DEL PROBLEMA

   Los sistemas basados en la voz han sido desarrollados para servir a las necesidades de las personas; muchos de ellos se dirigen especialmente a las personas con discapacidades lectoras. Por ello no tienen en cuenta el problema de los derechos de propiedad intelectual. Debido a esto no son tomados en consideración por las empresas editoriales que no se preocupan de publicar libros específicos para ellos, antes al contrario huyen de los formatos más habituales y manejables que son aceptados por estos sistemas de lectura.
   En cambio, los sistemas de lectura basados en la imagen están orientados al mundo editorial, que se supone los va a financiar indirectamente. Por ello ponen más interés en defender los derechos de autores y editores que los derechos de los compradores. Estos sistemas de lectura pueden ser acusados con toda razón de no respetar los derechos mínimos del comprador, ya que "secuestran" los libros de forma tal que el comprador no puede ya disponer de ellos como hace con los libros convencionales. No sólo no se pueden prestar a un amigo, imprimir o copiar a trozos, sino que ni siquiera se pueden trasladar a otros ordenadores con facilidad o sacar copias de seguridad. Debido a ello, un virus informático que nos obliga a reformatear el disco puede tener como consecuencia adicional la pérdida de toda nuestra biblioteca digital.
   La situación ha empeorado porque recientemente se ha promulgado en Estados Unidos la ley denominada con las siglas DMCA (Digital Millennium Certification Act) en la que se apoya el cifrado de los libros digitales y se considera un delito la actividad de desarrollar programas que descifren los ficheros encriptados. La radicalidad de esta ley se ha puesto en evidencia cuando debido a una denuncia de Adobe el FBI detuvo y se llevó esposado a un científico ruso que había ido a Estados Unidos a dar una conferencia sobre seguridad de la información. La indignación que despertó el hecho obligó a Adobe a retirar la denuncia, pero ha propiciado que se hayan presentado demandas de inconstitucionalidad contra la DMCA.
   Esta situación es inaceptable para una mayoría de potenciales compradores y si no se resuelve no puede esperarse la profetizada sustitución del libro convencional por el digital. Parece evidente que un comprador debe poder ser capaz de imprimir y copiar sus libros para uso privado, porque nadie quiere arriesgarse a perderlos simplemente porque el fabricante del lector que usa lo deje de soportar y ya no se puedan leer en los ordenadores que inevitablemente van a sustituir a los actuales equipos.
   La solución definitiva a este problema debe conseguir un equilibrio mejor entre las dos partes. Es más un problema de educación social y cívica que de leyes o de técnicas de protección de datos. Por ello es el principal inhibidor del profetizado estallido del libro digital.

5.2.- EL PROBLEMA DE LA ACCESIBILIDAD PARA LAS PERSONAS CON DISCAPACIDAD VISUAL

   Para las personas de este colectivo los libros digitales pueden representar la superación definitiva de la gran barrera que el libro convencional representa para sus derechos de acceso a la información, pero esta potencial accesibilidad puede verse frustrada por las mismas razones que hacen inaccesibles una gran mayoría de páginas Web: el predominio de la imagen sobre el texto, ya que se usan imágenes incluso cuando lo que se representa en la imagen es total o primordialmente un texto.
   Esta amenaza se convierte en dura realidad cuando se han empezado a divulgar los sistemas de lectura basados en la imagen. Ninguno de los lectores predominantes en este grupo, el de Adobe y el de Microsoft, son accesibles. Ninguno de los dos formatos propietarios antes citados, PDF y LIT, pueden ser manipulados por los sistemas de lectura que usan voz o Braille descritos en la primera parte de este artículo. Ni siquiera los sofisticados lectores de pantalla son capaces de leer el texto visualizado por el Adobe eBook Reader o el MS Reader. Esta situación podría ser algo entendible en el caso del PDF, que es un formato gráfico desde su origen, pero es incomprensible para el LIT que, siendo una aplicación XML, es un formato de texto. Su inaccesibilidad es una decisión consciente de Microsoft, la cual se justifica diciendo que si un lector de pantalla pudiese acceder al texto también lo podría hacer el programa que escribiese un hacker para piratear los libros en formato LIT. Se justifica el no atender a los derechos de un colectivo poco afortunado por el hecho de defender los derechos de otro colectivo que tiene otras formas de defenderlos.
   Ante las duras críticas que se han formulado por esta inaccesibilidad, tanto Adobe como Microsoft han prometido tomar medidas para resolver el problema. Adobe está sacando productos y servicios que ayudan a resolver el problema y Microsoft está haciendo declaraciones de buenas intenciones para el futuro. Las referencias [ADP] y [MSF] dan más información sobre las promesas de Adobe y Microsoft respectivamente.
   Puesto que Adobe va por delante de Microsoft en el tema de la accesibilidad, es interesante analizar su solución para aclarar lo que puede esperarse sobre este asunto. El Adobe eBook Reader no da todavía facilidades para las personas con resto visual, ya que no permite adaptar eficazmente el tamaño y el tipo de fuente ni los colores de fondo y letras, pero ya tiene la posibilidad de leer el texto con voz sintética. De momento es monolingüe, lo cual quiere decir que sólo está bien soportado en inglés ya que en castellano ni siquiera lee las vocales acentuadas, y no da facilidades para avanzar o retroceder en el texto leído, pero por lo menos permite darse una idea del contenido del documento. Esperemos que las futuras versiones mejoren esta situación. Nos da idea de lo que es posible el soporte que proporciona el veterano Acrobat Reader, cuya versión 5.0 viene preparada con opciones de accesibilidad incorporadas en una versión especializada que es también gratuita. Las personas con resto visual pueden cambiar tamaños, fuentes y colores para leer mejor el contenido, y se supone que está preparado para que los lectores de pantalla extraigan el texto a leer sin difi