internet

Détection de contenu utile depuis des sites d’actualité

Résumé
Dans un contexte de veille sur des sites d’actualité, la détection automatique du contenu rédigé par les journalistes est nécessaire au bon déroulement de traitements linguistiques automatisés. Nous adressons ce sujet en partant du constat que sur un même site d’actualité c’est principalement le contenu textuel porteur d’information qui change d’une page à l’autre. Plus généralement, nous définissons le contenu utile comme le contenu textuel qui diffère entre deux pages internet du même site. Nous utilisons différentes heuristiques et une comparaison par distance d’édition entre arbres HTML de mêmes structures pour déterminer ce contenu utile. Nous montrons que notre approche améliore les résultats par rapport à un outil de référence sur un corpus composé de pages récentes issues de différents sites d’actualité.

Traduction et Internet

Résumé
Avec la généralisation d’Internet, un site web multilingue représente un moyen à faible coût de faire connaître son entreprise et ses produits et de pénétrer rapidement et efficacement de nouveaux marchés.

La conversion d’un site web dans une autre langue représente une tâche qui dépasse le cadre d’un simple travail de traduction. Ce processus d’adaptation fait appel à des talents différents, mais complémentaires.

Aujourd’hui, la plupart des agences de traduction proposent la localisation de sites web.

Ce mémoire offre un bref aperçu de certains acteurs de la profession, de leurs méthodes de travail et des principales techniques mises en œuvre.

L'expression du multilinguisme dans la gestion de l'information sur le net, cas de la cohabitation des langues de cultures et des langues congolaises

Résumé
Ce travail est une réflexion concernant la gestion d’une information commune sur un site internet multilingue, impliquant des langues de familles différentes.

Nous avons fait le choix d’une telle activité impliquant trois langues de grande culture (anglais, français, roumain) et trois langues congolaises (lingala, munukutuba et tsangui). Sachant que les deux premières langues congolaises ont des rapports d’influence réciproque avec le français du fait de la colonisation.

Nous tentons de répondre à la question de savoir, comment gérer une information commune sur un site internet multilingue, quand les langues en présence peuvent exprimer des paradigmes pour le moins différents ?<