Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.espoch.edu.ec/handle/123456789/21272
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | Lozada Yánez, Pablo Eduardo | - |
dc.contributor.author | Luna Soria, Danilo Orlando | - |
dc.date.accessioned | 2024-06-05T14:49:15Z | - |
dc.date.available | 2024-06-05T14:49:15Z | - |
dc.date.issued | 2022-01-20 | - |
dc.identifier.citation | Luna Soria, Danilo Orlando. (2022). Desarrollo de un prototipo de dispositivo para reconocimiento de texto tipo imprenta y su conversión en audio orientado a personas con discapacidad visual mediante técnicas de visión artificial. Escuela Superior Politécnica de Chimborazo. Riobamba. | es_ES |
dc.identifier.uri | http://dspace.espoch.edu.ec/handle/123456789/21272 | - |
dc.description | En el presente trabajo de titulación se desarrolló un prototipo para el reconocimiento de texto tipo imprenta con sintetizador de voz orientado a personas con discapacidad visual empleando técnicas de visión artificial. El prototipo fue construido utilizando una computadora de placa reducida denominada Raspberry Pi 3B+, que es de fácil acceso, con un software libre de Linux llamado Raspbian. Se instalará en Raspbian el software Python que permitirá realizar el programa que consiste en reconocer caracteres partiendo de la captura de una imagen de texto a través del algoritmo Tesseract de OCR. El algoritmo extraerá de la imagen el texto para después por medio de GTTS (Google Text to Speech) convertirlo en audio en forma de voz para que el usuario pueda acceder a la información. En cuanto al hardware, se diseñó una estructura capaz de contener los elementos electrónicos que forman parte del dispositivo como: Raspberry pi 3B+, cámara Raspberry Pi, tarjeta de desarrollo Arduino nano, altavoces, sensor final de carrera, switch, pulsador, LCD y un panel led que se encargara de la iluminación del sistema. Se realizó pruebas de funcionamiento con los tres tipos de fuentes más utilizados, Calibri, Times New Roman, y Arial, conjuntamente se determinó la iluminación correcta y el rango de distancia en que debe estar la cámara con respecto a la hoja de texto para obtener una buena eficiencia. Es así como con una iluminación superior a los 180 lúmenes, a una distancia de 25 ± 5 cm de la cámara, Calibri con un tamaño de 12 pts., en formato normal con un texto de 150 ± 50 palabras, tiene una eficiencia superior al 95%. Se recomienda realizar un aprendizaje offline automático denominado entrenador, haciendo que el algoritmo pueda aprender por sí solo. | es_ES |
dc.description.abstract | The present graduate research project was to develop a prototype for recognizing type text printing press with a voice synthesizer aimed at people with visual disabilities using artificial vision. The prototype was built using a single-board computer called Raspberry Pi 3B+, easily accessible, with a free Linux software called Raspbian. The Python software will be installed on Raspbian to develop the program that consists of recognizing characters starting from the capture of a text image through the algorithm OCR Tesseract. The algorithm will extract the text from the image later through GTTS (Google Text to Speech) convert it to audio in a speech to access the information. In respect of hardware, a structure capable of containing the electronic elements was designed that are part of the device such as Raspberry pi 3B+, Raspberry Pi camera, Arduino nano development board, speakers, limit switch sensor, switch, push-button, LCD, and a led panel to be in charge of lighting the system. Functional tests were carried out with all three types of fonts most used, Calibri, Times New Roman, and Arial, together with the correct lighting and the range of distance the camera should be from the sheet of text for good efficiency. Thus, with illumination greater than 180 lumens, at a distance of 25 ± 5 cm from the camera, Calibri font with a size of 12 pts., in normal format with a text of 150 ± 50 words, has an efficiency of more than 95%. It is recommended to carry out offline learning called trainer, making the algorithm can learn by itself. | es_ES |
dc.language.iso | spa | es_ES |
dc.publisher | Escuela Superior Politécnica de Chimborazo | es_ES |
dc.relation.ispartofseries | UDCTFIYE;108T0413 | - |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.subject | VISIÓN ARTIFICIAL | es_ES |
dc.subject | RASPEBERRY PI | es_ES |
dc.subject | DISCAPACIDAD VISUAL | es_ES |
dc.subject | ARDUINO | es_ES |
dc.subject | PYTHON (SOFTWARE) | es_ES |
dc.subject | ALGORITMO DE PROGRAMACIÓN | es_ES |
dc.title | Desarrollo de un prototipo de dispositivo para reconocimiento de texto tipo imprenta y su conversión en audio orientado a personas con discapacidad visual mediante técnicas de visión artificial. | es_ES |
dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
dc.contributor.miembrotribunal | Hernández Ambato, Jorge Luis | - |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/3.0/ec/ | es_ES |
Aparece en las colecciones: | Ingeniero en Electrónica, Control y Redes Industriales; Ingeniero/a en Electrónica y Automatización |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
108T0413.pdf | 2,55 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons