corpus multilingue https://ertim.inalco.fr/ fr Acquisition de connaissances à des fins d'analyse automatique : Extraction des différentes façons de nommer les ingrédients et actifs cosmétiques dans les conversations spontanées des internautes en français et anglais et comparaison multilingue https://ertim.inalco.fr/node/615 <span class="field field--name-title field--type-string field--label-hidden">Acquisition de connaissances à des fins d&#039;analyse automatique : Extraction des différentes façons de nommer les ingrédients et actifs cosmétiques dans les conversations spontanées des internautes en français et anglais et comparaison multilingue</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Karolina Krygier</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2018</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L&#039;objectif de ce mémoire est de mettre en place une méthode qui permette d&#039;extraire les différents nommages d&#039;ingrédients et actifs cosmétiques à partir de commentaires postés sur le Web en français et en anglais. Les commentaires n&#039;étant pas normalisés, les diverses expressions qui s&#039;y trouvent, amènent à s&#039;intéresser à leurs variations graphiques et morphosyntaxiques. La méthode exposée est hybride, alliant patrons morphosyntaxiques et distance de Levenshtein. Employée dans un contexte d&#039;acquisition de connaissances, les candidats termes validés pourront être intégrés aux ressources linguistiques et réutilisés dans des analyses ultérieures.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1904" hreflang="fr">acquisition de connaissances</a></div> <div class="field__item"><a href="/taxonomy/term/865" hreflang="fr">extraction terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2477" hreflang="fr">variation terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2428" hreflang="fr">méthode hybride</a></div> <div class="field__item"><a href="/taxonomy/term/2462" hreflang="fr">patrons morphosyntaxiques</a></div> <div class="field__item"><a href="/taxonomy/term/2409" hreflang="fr">distance de levenshtein</a></div> <div class="field__item"><a href="/taxonomy/term/2034" hreflang="fr">corpus multilingue</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/memoire_Krygier.pdf" type="application/pdf">memoire_Krygier.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 615 at https://ertim.inalco.fr Traitement d’un corpus quadrilingue parallèle (anglais, polonais, français et allemand), portant sur le domaine de la programmation https://ertim.inalco.fr/node/140 <span class="field field--name-title field--type-string field--label-hidden">Traitement d’un corpus quadrilingue parallèle (anglais, polonais, français et allemand), portant sur le domaine de la programmation</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Puisque les chercheurs se concentrent plus sur les corpus bilingues, nous nous intéressons dans un premier temps à la situation des outils de traitement des corpus multilingues (plus de trois langues), y compris les langues slaves. Les outils pris en compte concernent l&#039;alignement et l&#039;extraction des termes, mais nous nous intéressons aussi aux concordanciers. Dans un second temps, nous appliquons les outils accessibles à notre corpus pour observer les occurrences extraites du corpus dans leur contexte immédiat et ensuite, l&#039;alignement effectué pour analyser des équivalences en traductions. A l’avenir, le traitement de ce corpus pourrait aboutir à un lexique quadrilingue spécialisé en programmation.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2034" hreflang="fr">corpus multilingue</a></div> <div class="field__item"><a href="/taxonomy/term/1837" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2035" hreflang="fr">concordanciers</a></div> <div class="field__item"><a href="/taxonomy/term/1778" hreflang="fr">extraction de termes</a></div> <div class="field__item"><a href="/taxonomy/term/1936" hreflang="fr">allemand</a></div> <div class="field__item"><a href="/taxonomy/term/2036" hreflang="fr">polonais</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 140 at https://ertim.inalco.fr