open source https://ertim.inalco.fr/ fr La reconnaissance optique des sinogrammes Cas d’usage du dictionnaire mandarin-taiwanais de Wu Shou-li/Ngôo Siù-lè https://ertim.inalco.fr/node/736 <span class="field field--name-title field--type-string field--label-hidden">La reconnaissance optique des sinogrammes Cas d’usage du dictionnaire mandarin-taiwanais de Wu Shou-li/Ngôo Siù-lè</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 10/10/2023 - 15:01</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Afala PHAXAY</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2022</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Dans l&#039;ère du numérique, de nombreux supports physiques deviennent encombrants et ne permettent plus une diffusion des informations qu&#039;ils contiennent. C&#039;est le cas des dictionnaires. Quelque soit leur taille, les dictionnaires physiques ne sont pas des outils simple d&#039;utilisation pour toutes personnes qui souhaitent utiliser à l&#039;extérieur de chez soi. Faire une recherche dans un dictionnaire électronique en ligne ou hors-ligne avec son téléphone devient un automatisme pour les utilisateurs qui délaissent les versions imprimées pour une interface plus conviviale et un accès simplifié. Et bien que les dictionnaires soient maintenant plus accessibles, ce sont surtout les dictionnaires récents qui sont concernés. Si aujourd&#039;hui les dictionnaires sont conçus directement avec des outils numériques, certains ouvrages de référence plus anciens ne sont disponibles qu&#039;en version imprimée et il peut être intéressant de les numériser. Dans un effort de préservation et d&#039;une meilleure diffusion, on utilise la technique de reconnaissance optique de caractères pour reconstituer le contenu de ses ouvrages. Ce mémoire retrace le travail effectué pour la récupération des informations manquantes du dictionnaire mandarin-taiwanais de Wu Shou-li/Ngôo Siù-lè à l&#039;aide de la reconnaissance optique de caractères et avec comme outils eScriptorium et kraken.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2609" hreflang="fr">roc</a></div> <div class="field__item"><a href="/taxonomy/term/2610" hreflang="fr">reconnaissance optique de caractères</a></div> <div class="field__item"><a href="/taxonomy/term/2375" hreflang="fr">ocr</a></div> <div class="field__item"><a href="/taxonomy/term/2611" hreflang="fr">escriptorium</a></div> <div class="field__item"><a href="/taxonomy/term/2612" hreflang="fr">kraken</a></div> <div class="field__item"><a href="/taxonomy/term/2493" hreflang="fr">open source</a></div> <div class="field__item"><a href="/taxonomy/term/2613" hreflang="fr">numérisation de dictionnaire</a></div> <div class="field__item"><a href="/taxonomy/term/2614" hreflang="fr">mandarin-taïwanais</a></div> <div class="field__item"><a href="/taxonomy/term/2615" hreflang="fr">bopomofo</a></div> <div class="field__item"><a href="/taxonomy/term/2616" hreflang="fr">zhuyin fuhao </a></div> <div class="field__item"><a href="/taxonomy/term/2617" hreflang="fr">注音符號</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/PHAXAY.pdf" type="application/pdf">PHAXAY.pdf</a></span> </div> </div> Tue, 10 Oct 2023 13:01:04 +0000 gestionnaire 736 at https://ertim.inalco.fr Agent conversationnel pour la relation client - Technologies, architectures et cas d'usage au domaine bancaire https://ertim.inalco.fr/node/718 <span class="field field--name-title field--type-string field--label-hidden">Agent conversationnel pour la relation client - Technologies, architectures et cas d&#039;usage au domaine bancaire</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 02/02/2021 - 12:01</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Pierre Rochet</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2020</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Nous proposons un agent conversationnel destiné à des conseillers clientèles dans le<br /> domaine bancaire. Nous montrons qu’il est possible de créer une architecture complètement<br /> basée sur des outils open source fiables. Nous nous appuyons sur le framework RASA, et<br /> basons nos choix des modèles d’apprentissage sur l’équilibre coûts-performances. L’automatisation entre modélisation et implémentation ainsi que la structure en thématiques facilitent<br /> grandement la flexibilité du système. Enfin nous présentons une perspective d’évolution pour<br /> intégrer la gestion d’une FAQ dans l’architecture proposée. Ce composant, qui allie recherche<br /> d’information et système de questions-réponses, permettrait d’élargir le périmètre de l’agent<br /> pour peu d’efforts tout en restant très modulable.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2155" hreflang="fr">agent conversationnel</a></div> <div class="field__item"><a href="/taxonomy/term/2435" hreflang="fr">chatbot</a></div> <div class="field__item"><a href="/taxonomy/term/2670" hreflang="fr">relation client</a></div> <div class="field__item"><a href="/taxonomy/term/2403" hreflang="fr">banque</a></div> <div class="field__item"><a href="/taxonomy/term/2493" hreflang="fr">open source</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/memoirepierrerochet.pdf" type="application/pdf">memoirepierrerochet.pdf</a></span> </div> </div> Tue, 02 Feb 2021 11:01:12 +0000 gestionnaire 718 at https://ertim.inalco.fr Développement en open source et évaluation d’un système de classification multi-classes pour des articles de presse du domaine https://ertim.inalco.fr/node/620 <span class="field field--name-title field--type-string field--label-hidden">Développement en open source et évaluation d’un système de classification multi-classes pour des articles de presse du domaine </span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Xi Rong</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2018</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce travail s’inscrit dans le projet LEOnard des Études Économiques de BNP Paribas. Il s’agit du redéveloppement en logiciel libre et de l’évaluation d’un système de classification multi-classes pour des articles de presse du domaine bancaire. Pour construire le système, différentes expériences ont été menées afin de trouver les paramètres optimaux : pré-traitements du corpus, sélection de features, choix de l’algorithme, etc. C’est l’algorithme SGD (Stochastic Gradient Descent) qui a finalement été retenu avec une F-Mesure de 95% sur le corpus de test. Le nouveau système doit s’adapter aux contraintes réelles de la tâche et les évaluations doivent aussi être adaptables et comparables avec le dernier. Cependant, les mesures classiques ne permettent pas d’intégrer les évaluations adaptées à la tâche ni de qualifier globalement la performance du système. Par conséquent, nous avons proposé des métriques complémentaires, dont le « Leo-Score », pour évaluer le système de classification intégré dans la plate-forme. Notre système a eu un Leo-Score de 81,76% tandis que le système existant a eu un Leo-Score de 64,88% pour de nouvelles données présentées dans la plate-forme LEOnard.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2388" hreflang="fr">classification multi-classe des textes</a></div> <div class="field__item"><a href="/taxonomy/term/2491" hreflang="fr">apprentissage supervisé</a></div> <div class="field__item"><a href="/taxonomy/term/2492" hreflang="fr">système de classification</a></div> <div class="field__item"><a href="/taxonomy/term/1949" hreflang="fr">classification automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2493" hreflang="fr">open source</a></div> <div class="field__item"><a href="/taxonomy/term/2494" hreflang="fr">mesure d’évaluation</a></div> <div class="field__item"><a href="/taxonomy/term/2495" hreflang="fr">validation croisée</a></div> <div class="field__item"><a href="/taxonomy/term/2496" hreflang="fr">leo-score</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/RONG%20Xi.pdf" type="application/pdf">RONG Xi.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 620 at https://ertim.inalco.fr