identification automatique des langues https://ertim.inalco.fr/ fr Filtrage de paragraphes : reconnaissance de la langue et de l'écrit informel https://ertim.inalco.fr/node/120 <span class="field field--name-title field--type-string field--label-hidden">Filtrage de paragraphes : reconnaissance de la langue et de l&#039;écrit informel</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Delpech</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2008</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire propose une étude en deux volets pour le repérage, au niveau du paragraphe, de la langue et de l&#039;écrit informel issu d&#039;Internet. Il répond à deux besoins : adapter les traitements linguistiques aux types de texte et sélectionner les paragraphes de textes pertinents pour une tâche de recherche d&#039;information.<br /> <br /> Le premier volet traite de l&#039;identification automatique des langues, il rend compte de l&#039;implantation et de l&#039;évaluation de quatre méthodes. On s&#039;attache surtout à leurs performances sur de courtes séquences de texte.<br /> <br /> Le second volet concerne la reconnaissance de l&#039;écrit informel.<br /> <br /> La démarche est appuyée par des travaux en linguistique variationnelle et sur les nouvelles formes de communication écrite, puis appronfondie par une analyse lexicométrique. Enfin, on décrit l&#039;implantation d&#039;un arbre de décision qui utilise les indices remarqués lors de l&#039;étude linguistique.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1945" hreflang="fr">identification automatique des langues</a></div> <div class="field__item"><a href="/taxonomy/term/1946" hreflang="fr">variation linguistique</a></div> <div class="field__item"><a href="/taxonomy/term/1947" hreflang="fr">nouvelles formes de communication écrite</a></div> <div class="field__item"><a href="/taxonomy/term/1948" hreflang="fr">lexicométrie</a></div> <div class="field__item"><a href="/taxonomy/term/1949" hreflang="fr">classification automatique</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 120 at https://ertim.inalco.fr