Spécification et réalisation d'un formalisme générique pour la segmentation multiple de documents textuels multilingues
Le problème de la segmentation en mots, ou itémisation, est souvent considéré comme trivial grâce à la présence de séparateurs dans l'écriture. L'essor de l'Internet et surtout du Web a rendu disponibles des millions de documents dans une multitude de langues et généré un intérêt pour...
Main Author: | Quint, Julien |
---|---|
Language: | FRE |
Published: |
2002
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00521940 http://tel.archives-ouvertes.fr/docs/00/52/19/40/PDF/these.pdf |
Similar Items
-
Weighted finite-state transducers in speech recognition : a compaction algorithm for non-determinizable transducers
by: Zhang, Shouwen
Published: (2016) -
Normalization and learning of transducers on trees and words
by: Boiret, Adrien
Published: (2016) -
Le morphologicocentrisme et ses conséquences : Supplétisme Radical; Lexicalisme ++; Structure (dés)Informationnelle; Portemantalisme; Paradigmatisme
by: Royer-Artuso, Nicolas
Published: (2021) -
Les emplois de "quando" dans différents genres textuels du latin préclassique au latin postclassique
by: Fatello, Fabienne
Published: (2018) -
Norme(s) et usage(s) langagiers : le cas des communications pilote-contrôleur en anglais
by: Lopez, Stéphanie
Published: (2013)