Chatea, comparte con nosotros



jueves, 17 de junio de 2010

Cómo digitalizar imágenes y textos

Cómo digitalizar imágenes y textos

Realizado por Roger Cabrera

Indice
1. Introducción
2. Escaner
3. Tableta Digitalizadora
4. Lápiz Óptico
5. Cámaras Digitales

1. Introducción

El término digitalización se puede asociar de una manera clara, la forma como una imagen (texto, fotos, formas, sonido , movimiento...), se pueden convertir en un idioma comprensible para los computadores.
En general las señales exteriores que hacen posible la identificación en su estado natural, se transforman en código binario (0’s y 1’s) que mediante la utilización de programas se pueden transformar de acuerdo a los requerimientos.

2. Escaner

Los escáneres son periféricos diseñados para registrar caracteres escritos, o gráficos en forma de fotografías o dibujos, impresos en una hoja de papel facilitando su introducción en la computadora convirtiéndolos en información binaria comprensible para ésta.
El funcionamiento de un escáner es similar al de una fotocopiadora. Se coloca una hoja de papel que contiene una imagen sobre una superficie de cristal transparente, bajo el cristal existe una lente especial que realiza un barrido de la imagen existente en el papel; al realizar el barrido, la información existente en la hoja de papel es convertida en una sucesión de información en forma de unos y ceros que se introducen en la computadora.
Para mejorar el funcionamiento del sistema informático cuando se están registrando textos, los escáneres se asocian a un tipo de software especialmente diseñado para el manejo de este tipo de información en código binario llamados OCR (Optical Character Recognition o reconocimiento óptico de caracteres), que permiten reconocer e interpretar los caracteres detectados por el escáner en forma de una matriz de puntos e identificar y determinar qué caracteres son los que el subsistema está leyendo.

Un caso particular de la utilización de un scanner, aunque representa una de sus principales ventajas, es la velocidad de lectura e introducción de la información en el sistema informático con respecto al método tradicional de introducción manual de datos por medio del teclado, llegándose a alcanzar los 1.200 caracteres por segundo.

Así funciona un escáner:
Una definición simple de escáner podría ser la siguiente: dispositivo que permite pasar la información que contiene un documento en papel a una computadora, para de esta manera poder modificarlo.
Este proceso transforma las imágenes a formato digital, es decir en series de 0 y de 1, pudiendo entonces ser almacenadas, retocadas, impresas o ser utilizadas para ilustrar un texto.

El OCR:
Si pensamos un poco en el proceso de escaneado descrito, nos daremos cuenta de que al escanear un texto no se escanean letras, palabras y frases, sino sencillamente los puntos que las forman, una especie de fotografía del texto. Evidentemente, esto puede ser útil para archivar textos, pero sería deseable que pudiéramos coger todas esas referencias tan interesantes pero tan pesadas e incorporarlas al procesador de texto no como una imagen, sino como texto editable.
El OCR es un programa que lee esas imágenes digitales y busca conjuntos de puntos que se asemejen a letras, a caracteres. Dependiendo de la complejidad de dicho programa entenderá más o menos tipos de letra, llegando en algunos casos a interpretar la escritura manual, mantener el formato original (columnas, fotos entre el texto...) o a aplicar reglas gramaticales para aumentar la exactitud del proceso de reconocimiento.
Para que el programa pueda realizar estas tareas con una cierta fiabilidad, sin confundir "t" con "1", por ejemplo, la imagen debe cumplir unas ciertas características. Fundamentalmente debe tener una gran resolución, unos 300 ppp para textos con tipos de letra claros o 600 ppp si se trata de tipos de letra pequeños u originales de poca calidad como periódicos. Por contra, podemos ahorrar en el aspecto del color: casi siempre bastará con blanco y negro (1 bit de color), o a lo sumo una escala de 256 grises (8 bits). Por este motivo algunos escáners de rodillo (muy apropiados para este tipo de tareas) carecen de soporte para color.
El proceso de captación de una imagen resulta casi idéntico para cualquier escáner: se ilumina la imagen con un foco de luz, se conduce mediante espejos la luz reflejada hacia un dispositivo denominado CCD que transforma la luz en señales eléctricas, se transforma dichas señales eléctricas a formato digital en un DAC (conversor analógico-digital) y se transmite el caudal de bits resultante al ordenador.

Tipos de Escáneres
Existen cinco tipos de escáneres, pero no todos son ideales para la digitalización de imágenes
- De sobremesa o planos:
Un escáner plano es el tipo más versátil. Es ideal para escanear páginas de un libro sin tener que desprenderlas Generalmente lucen como fotocopiadoras pequeñas ideales para un escritorio, y se utilizan para los objetos planos. Sus precios pueden variar de acuerdo con la resolución de la imagen, pero salvo que se utilicen para realizar presentaciones muy importantes, como por ejemplo colocar imágenes para la Web, no se necesita adquirir uno de un costo tan alto.

- De mano:
Son los escáners "portátiles", es el menos costoso, con todo lo bueno y lo malo que implica esto. Hasta hace unos pocos años eran los únicos modelos con precios asequibles para el usuario medio, ya que los de sobremesa eran extremadamente caros; esta situación a cambiado tanto que en la actualidad los escáners de mano están casi inutilizados por las limitaciones que presentan en cuanto a tamaño del original a escanear (generalmente puede ser tan largo como se quiera, pero de poco más de 10 cm de ancho máximo) y a su baja velocidad, así como a la carencia de color en los modelos más económicos.
Lo que es más, casi todos ellos carecen de motor para arrastrar la hoja, sino que es el usuario el que debe pasar el escáner sobre la superficie a escanear. Todo esto es muy engorroso, pero resulta ideal para copiar imágenes pequeñas como firmas, logotipos y fotografías, además es eficaz para escanear rápidamente fotos de libros encuadernados, artículos periodísticos, facturas y toda clase de pequeñas imágenes.

- De rodillo:
Unos modelos de aparición relativamente moderna, se basan en un sistema muy similar al de los aparatos de fax: un rodillo de goma motorizado arrastra a la hoja, haciéndola pasar por una rendija donde está situado el elemento capturador de imagen.
Este sistema implica que los originales sean hojas sueltas, lo que limita mucho su uso al no poder escanear libros encuadernados sin realizar antes una fotocopia (o arrancar las páginas), salvo en modelos peculiares que permite separar el cabezal de lectura y usarlo como si fuera un escáner de mano. A favor tienen el hecho de ocupar muy poco espacio, incluso existen modelos que se integran en la parte superior del teclado; en contra tenemos que su resolución rara vez supera los 400x800 puntos, aunque esto es más que suficiente para el tipo de trabajo con hojas sueltas al que van dirigidos.

- Escáneres para transparencias:

Poseen una resolución mejor que los anteriores y por eso también son un poco más caros; pueden digitalizar transparencias desarrollando un trabajo de muy buena calidad. Estos tampoco son tan utilizados como los planos, pero en aquellas empresas en donde utilizan el formato de diapositiva y transparencia para sus impresiones, son una herramienta realmente indispensable.

Con el scanner se pueden digitalizar textos (escritos a máquina o con ordenador) e imágenes. Es imprescindible que el scanner esté encendido antes de encender el ordenador, en caso contrario no lo detecta. Para poder digitalizar textos hay que utilizar el programa OmniPage mientras que para las imágenes hay que utilizar el programa Paint Shop Pro 5.

Cómo digitalizar textos
Clicando sobre el icono llamado OmniPage que se encuentra en el escritorio, se accede al programa de digitalización de textos.
Una vez dentro del programa, hay que buscar la opción obtener imagen dentro del menú archivo o bien clicar sobre el icono del scanner que aparece en la parte superior izquierda de la pantalla.Aparecerá entonces una pequeña pantalla con varias opciones. Clicando sobre digitalizar el scanner empezará a trabajar.
Las hojas se pueden poner de dos formas diferentes en el scanner.
- Hay que colocar la hoja boca abajo en la parte superior derecha del scanner y después bajar la tapa.
- Se puede utilizar el alimentador automático.
Una vez que el programa ha obtenido la información de la hoja de texto, hay que pasarle el reconocedor de textos OCR. Para ello hay que buscar un icono con dichos caracteres OCR en la pantalla o bien en el menú archivo OCR, esta página.Si el reconocimiento ha sido correcto, el programa mostrará un nuevo menú para agregar más páginas o parar el digitalizado.
Clicando sobre parar digitalizado, aparece un menú en el que hay que indicarle al programa el nombre con el que queremos guardar el programa así como el formato.

Cómo digitalizar imágenes y fotografías:

Clicando sobre el icono PaintShop Pro 5 que se encuentra en el escritorio, se entra en el programa de digitalización de imágenes.
Una vez dentro, hay que buscar la opción Acquire dentro del menú File, import, twain
Cuando se clica sobre la opción acquire el scanner se pone en marcha mostrando una previsualización de la imagen en pantalla.
La imagen hay que colocarla el la parte superior derecha del scanner y siempre boca abajo cerrando después bien la tapa.
Una vez que se haya seleccionado la zona que se desea digitalizar y si las opciones de digitalizado son las deseadas, tipo, escala, brillo etc.. pulsando final el scanner digitalizará la imagen y la enviará al PaintShop Pro 5. Si la imagen digitalizada se ve detrás del menú de digitalización se podrá cerrar este para empezar a trabajar con las herramientas de retoque .

¿Cuánto ocupa una imagen?
Las imágenes digitalizadas se pueden guardar en diferentes formatos: GIF, TIF, BMP, JPG etc.
El formato que más comprime la imagen es el JPG pero a cambio pierde un poco de calidad. Cuanta mayor sea la compresión que se le aplique a la imagen, menor será la calidad.
El formato GIF tiene una buena resolución y, al igual que los JPG, se puede utilizar en paginas web HTML de internet, pero ocupa algo más.
El formato TIF es el que mejor calidad de imagen da y es compatible con Macintosh, pero es uno de los que más ocupan.
El formato BMP, es el más estandar y el más facil de insertar en cualquier editor de texto, en cambio, es uno de los que más espacio ocupan.
El formato PSP se puede leer únicamente con el PaintShop Pro.
Con la opción save as se llega al menú que permite trabajar con todas estas opciónes.
Cuando la imagen está guardada en la cuenta personal o en el disquete, se puede salir del programa mediante la opción exit del menú file.
Cuadro ilustrativo a cerca del tamaño de las imágenes:

Tipo de original

Destino

Método escaneado

Tamaño en RAM

Fotografía 10x15 cm

Pantalla

75 ppp / 24 bits

0,4 MB

Impresora B/N

300 ppp / 8 bits

2 MB

Impresora color

300 ppp / 24 bits

6 MB

Texto o dibujo en blanco y negro tamaño DIN-A4

Pantalla

75 ppp / 1 bit

66 KB

Impresora

300 ppp / 8 bit

8 MB

OCR

300 ppp / 1 bit

1 MB

Foto DIN-A4 en color

Pantalla

75 ppp / 24 bits

1,6 MB

Impresora

300 ppp / 24 bits

25 MB

Los colores y los bits
Al hablar de imágenes, digitales o no, a nadie se le escapa la importancia que tiene el color. Una fotografía en color resulta mucho más agradable de ver que otra en tonos grises; un gráfico acertadamente coloreado resulta mucho más interesante que otro en blanco y negro; incluso un texto en el que los epígrafes o las conclusiones tengan un color destacado resulta menos monótono e invita a su lectura.
Sin embargo, digitalizar los infinitos matices que puede haber en una foto cualquiera no es un proceso sencillo. Hasta no hace mucho, los escáners captaban las imágenes únicamente en blanco y negro o, como mucho, con un número muy limitado de matices de gris, entre 16 y 256. Posteriormente aparecieron escáners que podían captar color, aunque el proceso requería tres pasadas por encima de la imagen, una para cada color primario (rojo, azul y verde). Hoy en día la práctica totalidad de los escáners captan hasta 16,7 millones de colores distintos en una única pasada, e incluso algunos llegan hasta los 68.719 millones de colores.
Para entender cómo se llega a estas apabullantes cifras debemos explicar cómo asignan los ordenadores los colores a las imágenes. En todos los ordenadores se utiliza lo que se denomina sistema binario, que es un sistema matemático en el cual la unidad superior no es el 10 como en el sistema decimal al que estamos acostumbrados, sino el 2. Un bit cualquiera puede por tanto tomar 2 valores, que pueden representar colores (blanco y negro, por ejemplo); si en vez de un bit tenemos 8, los posibles valores son 2 elevado a 8 = 256 colores; si son 16 bits, 2 elevado a 16 = 65.536 colores; si son 24 bits, 2 elevado a 24 = 16’777.216 colores; etc, etc.
Por tanto, "una imagen a 24 bits de color" es una imagen en la cual cada punto puede tener hasta 16,7 millones de colores distintos; esta cantidad de colores se considera suficiente para casi todos los usos normales de una imagen, por lo que se le suele denominar color real. La casi totalidad de los escáners actuales capturan las imágenes con 24 bits, pero la tendencia actual consiste en escanear incluso con más bits, 30 ó incluso 36, de tal forma que se capte un espectro de colores absolutamente fiel al real; sin embargo, casi siempre se reduce posteriormente esta profundidad de color a 24 bits para mantener un tamaño de memoria razonable, pero la calidad final sigue siendo muy alta ya que sólo se eliminan los datos de color más redundantes.

Parámetros para una elección correcta
Definición:
Es la cualidad más importante de un escáner, es el grado de finura con el que se puede realizar el análisis de la imágen. Los fabricantes indican dos tipos de definición:
* óptica, que es la realmente importante, está determinada por el número de elementos CCD y la resolución de la lente. Se mide en puntos por pulgada.
* interpolada, que es el resultado de una serie de cálculos de difícil verificación.

Profundidad de análisis de color, que se expresa en número de bits
de 2 bits, resultaría una imágen en blanco y negro
de 8 bits, se obtendrías una imágen de 256 tonos de grises
de 24 bits u 8 bits por componente de color (verde, rojo, azul), la imágen puede llegar a ser de 16'7 millones de colores, de 30 bits, permite sobrepasar los mil millones de tintas.

Software:
Otro elemento a tener en cuenta es el software que acompaña al escáner. Muchos de ellos incorporan programas de gestión de textos y fotos, programas de reconocimiento de caracteres o programas de retoque fotográfico.

Conectores: ¿paralelo, SCSI o USB?
Esta es una de las grandes preguntas que debe hacerse todo futuro comprador de un escáner. La forma de conectar un periférico al ordenador es siempre importante, pues puede afectar al rendimiento del dispositivo, a su facilidad de uso o instalación... y fundamentalmente a su precio, claro.

Puerto paralelo
Es el método más común de conexión para escáners domésticos, entendiendo como tales aquellos de resolución intermedia-alta (hasta 600 x 1.200 ppp, pero más comúnmente de 300 x 600 ó 400 x 800 ppp) en los que la velocidad no tiene necesidad de ser muy elevada mientras que el precio es un factor muy importante.
El puerto paralelo, a veces denominado LPT1, es el que utilizan la mayor parte de las impresoras; como generalmente el usuario tiene ya una conectada a su ordenador, el escáner tendrá dos conectores, uno de entrada y otro de salida, de forma que quede conectado en medio del ordenador y la impresora. Como primer problema de este tipo de conexión tenemos el hecho de que arbitrar el uso del puerto paralelo es algo casi imposible, por lo que en general no podremos imprimir y escanear a la vez (aunque para un usuario doméstico esto no debería ser excesivo problema).

Conector SCSI
Sin lugar a dudas, es la opción profesional. Un escáner SCSI (leído "escasi") es siempre más caro que su equivalente con conector paralelo, e incluso muchos resultan más caros que modelos de mayor resolución pero que utilizan otro conector. Debido a este sobreprecio no se fabrican en la actualidad escáners SCSI de resolución menor de 300x600 ppp, siendo lo más común que las cifras ronden los 600x1.200 ppp o más.

Puerto USB
Esto es lo último en escáners. Los puertos USB están presentes en la mayoría de ordenadores Pentium II, AMD K6-2 o más modernos, así como en algunos Pentium MMX.
En general podríamos decir que los escáners USB se sitúan en un punto intermedio de calidad / precio. La velocidad de transmisión ronda los 1,5 MB / s, algo más que el puerto paralelo pero bastante menos que el SCSI; la facilidad de instalación es casi insuperable, ya que se basa en el famoso Plug and Play (enchufar y listo) que casi siempre funciona; todos los ordenadores modernos tienen el USB incorporado (los Pentium normales ya son antiguos; y además dejan el puerto paralelo libre para imprimir o conectar otros dispositivos.

La interfaz TWAIN
Se trata de una norma que se definió para que cualquier escáner pudiera ser usado por cualquier programa de una forma estandarizada e incluso con la misma interfaz para la adquisición de la imagen.
Si bien hace unos años aún existía un número relativamente alto de aparatos que usaban otros métodos propios, hoy en día se puede decir que todos los escáners normales utilizan este protocolo, con lo que los fabricantes sólo deben preocuparse de proporcionar el controlador TWAIN apropiado, generalmente en versiones para Windows 9x, NT y a veces 3.x. Desgraciadamente, sólo los escáners de marca relativamente caros traen controladores para otros sistemas operativos como OS/2 o Linux, e incluso en ocasiones ni siquiera para Windows 3.x o NT; la buena noticia es que la estandarización de TWAIN hace que a veces podamos usar el controlador de otro escáner de similares características, aunque evidentemente no es un método deseable...
Se trata de un programa en el que de una forma visual podemos controlar todos los parámetros del escaneado (resolución, número de colores, brillo...), además de poder definir el tamaño de la zona que queremos procesar.
Si la fidelidad del color es un factor de importancia, uno de los parámetros que probablemente deberemos modificar en esta interfaz es el control de gamma, para ajustar la gama de colores que capta el escáner con la que presenta nuestro monitor o imprime la impresora.

3. Tableta Digitalizadora

Es una tableta compacta generalmente de 127 x 102 mm que incorpora un lápiz sin cables . Esta excelente herramienta de trabajo permite emular una pizarra electrónica ideal para los ordenadores portátiles.
Permiten el manejo del cursor a través de la pantalla del sistema informático y facilitan una importante ayuda en el tratamiento de los comandos de órdenes en aplicaciones de CAD / CAM (diseño asistido por computadora).

Las tabletas digitalizadoras convierten una serie de coordenadas espaciales en un código binario que se introduce en la computadora. Estas coordenadas serán manejadas posteriormente por programas de dibujo, ingeniería, etc.
La tableta suele tener impresos en su armazón pulsadores con símbolos dibujados para ejecutar de modo directo comandos que agilizan el trabajo de manejo del software.
Las tabletas digitalizadoras poseen una resolución de alrededor de una décima de milímetro y pueden manejar gráficos en dos y tres dimensiones.
Una posibilidad de manejo muy intuitiva convierte a las tabletas digitalizadoras en unas herramientas muy útiles y polivalentes en los sistemas informáticos de diseño y manejo de gráficos.
Existen diversas tecnologías de construcción de tabletas, pudiendo ser éstas:
• Tabletas mecánicas.
• Tabletas electrónicas.

Las mecánicas, debido al desgaste producido en sus componentes por el uso continuado, son menos precisas y más delicadas de manejar que las electrónicas, siendo éstas, por ello, las más extendidas comercialmente en el mercado.

4. Lápiz Óptico

Es un instrumento en forma de lápiz que por medio de un sistema óptico, ubicado en su extremo, permite la entrada de datos directamente a la pantalla. Para elaborar dibujos, basta con mover el lápiz frente a la pantalla y en ella va apareciendo una línea que describe dicho movimiento, igualmente se puede mover líneas de un sitio a otro, cuando se coloca el punto de la pluma en la pantalla y se presiona un botón, un dispositivo siente dentro de la pluma activada. Transmite a la memoria de la computadora el sitio de la luz en la pantalla. También sirve para señalar ítems de los menús al igual que el mouse.
Los lápices ópticos son dispositivos de introducción de datos que trabajan directamente con la pantalla de la computadora, señalando puntos en ella y realizando operaciones de manejo de software.
Para operar con el lápiz óptico se coloca éste sobre la pantalla del sistema informático. En el momento en que el cañón de rayos catódicos de la pantalla barre el punto sobre el que se posiciona el lápiz, éste envía la información a un software especial que la maneja. El microprocesador calcula cuál es la posición sobre la pantalla de la computadora permitiendo manipular la información representada en ella.
Los lápices ópticos permiten la introducción de datos, el manejo del cursor, etc., en la pantalla de la computadora. Son una asistencia para las limitaciones de los teclados en algunas aplicaciones, sobre todo las que no son de gestión pura (creativas, etc.),
O bien los bolígrafos-escáner, utensilios con forma y tamaño de lápiz o marcador fluorescente que escanean el texto por encima del cual los pasamos y a veces hasta lo traducen a otro idioma al instante.

5. Cámaras Digitales

  • Una cámara digital permite tomar fotos que se pueden visualizar e imprimir utilizando una computadora.

La mayoría incluyen una pantalla tipo visualizador de cristal líquido (LCD), que puede utilizar para tener una vista preliminar y visualizar la fotografías.
Incluyen un cable que permite conectar la cámara a un puerto. Permitiendo transferir las fotografías.

Almacenan fotografías hasta que se las transfiera a una computadora. La mayoría tiene una memoria integrada o removible.
- Memoria removible: almacenan fotografías en una tarjeta de memoria. Algunas las almacenan en un disquete regular que calza dentro de esta. Se puede reemplazar una tarjeta de memoria o disquete cuando esté llena.
- Memoria incorporada: almacenan al menos 20 fotografías. Una vez que está llena, se las transfiere a la computadora.

  • Las filmadoras son unos aparatos periféricos altamente especializados que convierten información, que se les introduce en código binario, en imágenes con una calidad similar a la de una imprenta (1.600 puntos por pulgada como mínimo) o fotogramas similares a los de cinematografía.

Las filmadoras se pueden conectar a una computadora o trabajar con ellas remotamente llevando la información hasta el punto donde están por medio de un soporte magnético.

Se utilizan para grabar conversaciones y otros sonidos, utilizando programas de conferencia para comunicarse a través de Internet. Con los programas de control de voz se puede conversar en un micrófono y emplear los comando de voz para controlar la computadora.
Unidireccional: graba sonidos de una dirección, lo que ayuda a reducir el ruido de fondo. Este tipo es útil para grabar una voz individual
Omnidireccional: graba sonidos de todas direcciones. Este tipo es útil para grabar varias voces en una conversación en grupo

Otras Herramientas Para La Digitalización
La función de la biometría tecnológica sirve para verificar la identificación de cada persona y para confirmar que se trata realmente de quien dice ser.
Uno de los campos que más utilizan este sistema es la informática.
Los sistemas de identificación biométrica se basan en analizar una característica biológica única de la persona. Estos métodos de control dan mayor seguridad que la utilización de objetos como tarjetas, llaves, (lo que una persona porta), como así también contraseñas, información, claves, firma, etc. (lo que la persona sabe).

  • Lectura de la huella digital

La identificación de alguien mediante un sistema electrónico de la huella digital (digital personal) es una de las más utilizadas en el mundo.
Esta funciona conectada a una amplia base de datos que indica si en realidad las huellas dactilares concuerdan con la información que se tiene acerca de la persona.
¿Cómo lo hace? El sistema transforma los arcos, rizos y espirales de las huellas en códigos numéricos, que luego se comparan con los datos de que se dispone dando resultados exactos, lo que garantiza uno de los más altos niveles de seguridad.

  • Lectura de la geometría de la mano
    Otro aparato de biometría es el de identificación con base en las características de la mano (forma de los dedos, medidas, tamaño).

Sirve además para identificar al personal y sustituir el típico mercado de tarjetas a la hora de entrada o salida de las labores.

  • Escaneo del iris

El reconocimiento ocular es muy efectivo y se usa, sobre todo, en instituciones de alta seguridad (cárceles, bancos, cajeros...) de Japón, Gran Bretaña, Alemania y Estados Unidos. Lo que se examina son las fibras, manchas y surcos del iris por medio de una cámara especial (Iris scan)

  • Escaneo facial

También existe biometría facial que analiza la imagen de la cara de alguien impresa en una fotografía o en una toma de vídeo funciona analizando la imagen en vídeo o una fotografía y las características específicas de ciertas partes localizadas entre la frente y el labio superior, lugares que generalmente no se ven afectados por la expresión (esta puede operar sin que la persona sepa que está siendo estudiada).

  • Digitalización de la firma
  • Identificación de voz

Entre otros avances biométricos se encuentran los que tienen que ver con el olor corporal y la resonancia acústica de la cabeza (esta es muy efectiva porque permite reconocer las diferencias entre gemelos idénticos, lo cual no es posible bajo el sistema facial)

No hay comentarios:

Publicar un comentario