Cari soci,
vi segnaliamo la possibilità di ascoltare la diretta radiofonica realizzata stasera a partire dalle ore 21,30 dal team di NvApple relativa alla presentazione della nuova applicazione SeeingAi e il link al quale fare riferimento per la diretta. Di seguito trovate una descrizione dellapplicazione:
www.nvapple.it/articoli/seeing-ai-uno-scatto-decisivo-verso-una-magg iore-autonomia-diretta-nvradio-20-dicembre-ore
Cordiali saluti
La segreteria UICI Firenze
Seeing AI: arriva l’app definitiva per l’ocr su iPhone!
Uno dei campi che più interessa chi se la deve vedere con una disabilità visiva è quello legato al riconoscimento caratteri. Con L’avvento degli smartphone e, più di preciso, con l’accessibilità che può garantire iOS sugli iPhone, si stanno moltiplicando le varie app, più o meno performanti, che consentono di scattare foto a documenti per poi farne l’ocr.
In questo campo, fino ad oggi, l’applicazione più efficace era KNFB Reader, davvero ottima, ma dal costo decisamente importante, ma da oggi ecco che qualcosa è cambiato ed in maniera pressochè epocale! Arriva nello store italiano Seeing AI, applicazione rilasciata da Microsoft e le prime impressioni sono, letteralmente, impressionanti! Seeing AI non è solo un’applicazione per il riconoscimento caratteri, ma rappresenta una vera e propria suite che racchiude al suo interno una serie di funzionalità le quali rappresentano l’eldorado per chi deve affrontare la quotidianità in autonomia!
Prima apertura di Seeing AI
Al suo primo avvio l’applicazione chiederà, in primis, di avere accesso alla fotocamera e, una volta dato l’ok, presenta un tutorial, tutto in inglese, che spiega come utilizzare l’applicazione. Se vogliamo arrivare subito al sodo, possiamo tappare sul bottone skip per saltare l’intero tutorial, altrimenti possiamo sfogliare, nel modo classico, le 5 pagine che vengono proposte. Giunti all’ultima pagina dovremo accettare i termini di utilizzo, attivando l’apposita checkbox in fondo alla schermata, per poi procedere sul bottone “get start”.
A questo punto ecco che ci viene presentata la schermata principale. La schermata principale La schermata principale dell’app propone un’interfaccia minimale e pulita, nonostante sia totalmente in inglese, e si compone di: Il pulsante menù in alto: propone le impostazioni del programma che, per altro, risultano poche e già a posto di default Il pulsante quick help: attiva la guida rapida contestualmente alla funzione scelta L’eventuale pulsante per scattare la foto o per l’eventuale messaggio in tempo reale Il bottone per stoppare i messaggi in tempo reale o per farli ripartire Lo slider per scegliere la funzione che desideriamo utilizzare (il programma definisce le singole funzioni “channel”)
Le singole funzioni
La potenza di quest’applicazione, come abbiamo già accennato, sta nella suite di funzioni, davvero impressionante per efficacia, che ci viene proposta e, di seguito, procederemo con la descrizione dei singoli “channel” di cui possiamo fruire. Ricordiamo che la prima volta che sceglieremo una funzione verremo rimandati alla schermata di spiegazione della funzione stessa che potremo chiudere con il bottone “close” e che potremo, ogni volta, rileggere attraverso il pulsante “quick help” sempre presente in ogni schermata.
Channel short text (ocr al volo senza scatto)
Questa funzionalità consente, semplicemente facendo scorrere la fotocamera, di fare il riconoscimento caratteri al volo consentendoci di poter, letteralmente, scartabellare buste, documenti e quant’altro, per poter vedere di cosa si tratta. Questa opzione non consente alcun tipo di salvataggio, possiamo definirla un vero e proprio colpo d’occhio su di un foglio!
Channel Document (funzione di scansione vera e propria)
Se scegliamo la funzione document la schermata ci proporrà il bottone “Take picture” che se tappato procederà con lo scatto. La messaggistica in tempo reale ci guiderà nell’inquadratura per consentire uno scatto il più preciso possibile. Il processo di scansione verrà accompagnato da una musichetta molto delicata ed a riconoscimento effettuato potremo leggere il testo con Voiceover.
Il programma possiede anche il suo tts, ma al momento la sintesi in italiano non è ancora supportata, però voiceover fa il suo dovere senza alcun problema.
Il pulsante share, presente in fondo alla schermata ci consentirà di: salvare direttamente l’immagine salvare il file con il testo riconosciuto
Sono supportati tutti gli standard di condivisione sul cloud, app file inclusa! Product (riconoscitore di codici a barre) Eccoci con una funzione molto interessante e dalle caratteristiche davvero fantastiche soprattutto se guardiamo la sua semplicità di utilizzo! Riconoscere un codice a barre non è mai stato così semplice: Sarà sufficiente prendere l’oggetto, puntare la fotocamera e cercare il codice a barre ruotando l’oggetto stesso. Un suono ci guiderà con toni di un certo tipo e quando il codice viene inquadrato saremo accompagnati da un tono continuo e dalla dicitura processing… Il riconoscimento avviene anche qui in tempo reale e ci viene data la possibilità di condividere l’immagine attraverso il pulsante share o, laddove la rete le renda disponibili, di avere ulteriori informazioni attraverso il pulsante “more info”.
Channel Person (riconoscimento di volti e persone) In questa schermata potremo utilizzare l’algoritmo di riconoscimento facciale per poter scattare foto in maniera autonoma. Attraverso il pulsante “switch to front camera” potremo scegliere quale fotocamera utilizzare e il pulsante take picture consente, ovviamente, di scattare la foto.
I soliti messaggi in tempo reale ci guideranno per poter centrare al meglio l’immagine.
Channel Currency preview (riconoscitore di denaro) Ecco il più tipico dei riconoscitore di denaro! La valuta è settata di default su “Euro” e sarà sufficiente posizionare le banconote sotto la fotocamera per vedersi riconoscere il denaro. Nota: non funziona con le monete Channel Scene preview (riconoscimento di oggetti ed ambienti) Eccoci di fronte ad un’altra funzionalità davvero notevole: con il riconoscimento delle scene possiamo scattare una foto, sempre attraverso il pulsante “take picture”, ad oggetti, stanze e chi più ne ha più ne metta, per vederci descrivere, sempre in inglese, ciò che appare nella foto. La qualità e la precisione per una funzione così particolare ci sta lasciando davvero interdetti, provare per credere!
Channel Color preview (il riconoscitore di colori) Semplice, efficace ed abbastanza preciso! Non crediamo ci sia altro modo per descrivere il riconoscitore di colori presente in Seeing AI e, nel suo genere, ci pare davvero efficace tenendo conto, va detto, che sino ad oggi i riconoscitori di colore su iPhone non hanno mai regalato prestazioni entusiasmanti. Posizionate la fotocamera su di un capo di abbigliamento e traete le vostre conclusioni!
Channel Handwriting previews (ocr della scrittura a mano) Nella descrizione della funzione viene detto che è ancora in fase sperimentale, ma la cosa ci ha praticamente fatto saltare sulla sedia! Ebbene sì, Microsoft ci mette a disposizione, con tutte le cautele del caso, la possibilità di poter scansionare un documento scritto a mano… La procedura è la stessa dei documenti stampati, ma ci ha colpito la cosa e l’efficacia della funzione. E’ ovvio che non potremo mai pretendere, ad esempio, che venga riconosciuta una calligrafia poco chiara, ma già così i risultati sono davvero incredibili…
Channel light (sensore di luce) L’ultima funzione presente in Seeing AI è il riconoscitore di luce. La fotocamera ci consentirà di poter verificare lo stato della luminosità in un ambiente attraverso suoni di acutezza differente in base all’intensità della luce e quando tutto sarà buio un tono cupo ce lo farà sapere.
Conclusioni Seeing AI rappresenta, a nostro avviso, l’inizio di quello che possiamo definire l’ocr 2.0 perchè le funzionalità che vengono proposte in una realtà “all in one” sono impressionanti per efficacia, varietà e per le innovazioni proposte.
Se a tutto questo aggiungiamo anche la totale gratuità del software ecco che il cerchio si chiude e gli scenari che si prospettano all’orizzonte sono pressoché inimmaginabili! Al momento, per noi, l’unico tallone d’Achille può esser rappresentato dalla lingua inglese, ma l’intuitività dell’applicazione è tale che ci sentiamo di consigliarla anche ai meno anglofoni!
Sistemi operativi: iOS
Categorie app: autonomia personale elaborazione documenti O.C.R. (riconoscimento caratteri)
Tipo di licenza dell’app: Gratuita
Offre acquisti in-app:
Grado di accessibilità dell’applicazione: pienamente accessibile
Il team di NvApple ha pensato di effettuare una diretta radio per parlare proprio di quest’app e scambiarsi consigli e informazioni sulle metodologie per ottenere i risultati più soddisfacenti. Avremo quindi una prima parte nella quale esploreremo assieme l’app, soprattutto per chi non ha molta dimestichezza con la lingua inglese. Una volta afferrati i concetti principali, daremo vita ad un confronto con gli utenti per imparare tutti assieme le migliori strategie di utilizzo, dove funziona bene e dove no, con quale telefono, etc etc.
Sarà anche l’occasione per scambiarci gli auguri di Natale!
Vi aspettiamo mercoledì 20 dicembre a partire dalle 21.30 su NvRadio. Per ascoltarci, potete utilizzare l’app NvApple presente sull’appStore per chi ha un iPhone o similari,: