ocr https://ertim.inalco.fr/ fr La reconnaissance optique des sinogrammes Cas d’usage du dictionnaire mandarin-taiwanais de Wu Shou-li/Ngôo Siù-lè https://ertim.inalco.fr/node/736 <span class="field field--name-title field--type-string field--label-hidden">La reconnaissance optique des sinogrammes Cas d’usage du dictionnaire mandarin-taiwanais de Wu Shou-li/Ngôo Siù-lè</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 10/10/2023 - 15:01</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Afala PHAXAY</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2022</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Dans l&#039;ère du numérique, de nombreux supports physiques deviennent encombrants et ne permettent plus une diffusion des informations qu&#039;ils contiennent. C&#039;est le cas des dictionnaires. Quelque soit leur taille, les dictionnaires physiques ne sont pas des outils simple d&#039;utilisation pour toutes personnes qui souhaitent utiliser à l&#039;extérieur de chez soi. Faire une recherche dans un dictionnaire électronique en ligne ou hors-ligne avec son téléphone devient un automatisme pour les utilisateurs qui délaissent les versions imprimées pour une interface plus conviviale et un accès simplifié. Et bien que les dictionnaires soient maintenant plus accessibles, ce sont surtout les dictionnaires récents qui sont concernés. Si aujourd&#039;hui les dictionnaires sont conçus directement avec des outils numériques, certains ouvrages de référence plus anciens ne sont disponibles qu&#039;en version imprimée et il peut être intéressant de les numériser. Dans un effort de préservation et d&#039;une meilleure diffusion, on utilise la technique de reconnaissance optique de caractères pour reconstituer le contenu de ses ouvrages. Ce mémoire retrace le travail effectué pour la récupération des informations manquantes du dictionnaire mandarin-taiwanais de Wu Shou-li/Ngôo Siù-lè à l&#039;aide de la reconnaissance optique de caractères et avec comme outils eScriptorium et kraken.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2609" hreflang="fr">roc</a></div> <div class="field__item"><a href="/taxonomy/term/2610" hreflang="fr">reconnaissance optique de caractères</a></div> <div class="field__item"><a href="/taxonomy/term/2375" hreflang="fr">ocr</a></div> <div class="field__item"><a href="/taxonomy/term/2611" hreflang="fr">escriptorium</a></div> <div class="field__item"><a href="/taxonomy/term/2612" hreflang="fr">kraken</a></div> <div class="field__item"><a href="/taxonomy/term/2493" hreflang="fr">open source</a></div> <div class="field__item"><a href="/taxonomy/term/2613" hreflang="fr">numérisation de dictionnaire</a></div> <div class="field__item"><a href="/taxonomy/term/2614" hreflang="fr">mandarin-taïwanais</a></div> <div class="field__item"><a href="/taxonomy/term/2615" hreflang="fr">bopomofo</a></div> <div class="field__item"><a href="/taxonomy/term/2616" hreflang="fr">zhuyin fuhao </a></div> <div class="field__item"><a href="/taxonomy/term/2617" hreflang="fr">注音符號</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/PHAXAY.pdf" type="application/pdf">PHAXAY.pdf</a></span> </div> </div> Tue, 10 Oct 2023 13:01:04 +0000 gestionnaire 736 at https://ertim.inalco.fr Approches pour une numérisation de qualité d’un dictionnaire vietnamien-français comprenant des caractères Nôm https://ertim.inalco.fr/node/585 <span class="field field--name-title field--type-string field--label-hidden">Approches pour une numérisation de qualité d’un dictionnaire vietnamien-français comprenant des caractères Nôm</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2015</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">la numérisation d’un dictionnaire ancien de vietnamien-français (Bonet 1899) qui fait usage de caractères anciens forgés sur le modèles de caractères chinois pose plusieurs problèmes : le support des dits caractères et la gestion du multilinguisme en particulier. Une architecture logicielle pour adresser le problème est décrite, ainsi que différentes techniques visant à augmenter la qualité de la reconnaissance en sortie.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2375" hreflang="fr">ocr</a></div> <div class="field__item"><a href="/taxonomy/term/2376" hreflang="fr">vietnamien</a></div> <div class="field__item"><a href="/taxonomy/term/2377" hreflang="fr">chữ nôm</a></div> <div class="field__item"><a href="/taxonomy/term/2378" hreflang="fr">automate fini déterministe</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/memoire_m2_Lecailliez_final_v1.00.pdf" type="application/pdf">memoire_m2_Lecailliez_final_v1.00.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 585 at https://ertim.inalco.fr