|
The lexical information about the morphemes consists of over 2000 roots, several hundred lexicalized words (sort of fixed complex stems combining a root and one or two suffixes), over 330 suffixes, over 300 noun endings and 1200 verb endings placed in a linguistic data base that we have created. Most of this lexical information comes from the works by Ken Harper, Alex Spalding, Lucien Schneider, Mick Mallon, and Louis-Jacques Dorais.
|
|
L'analyseur morphologique de l'inuktitut du CNRC est un programme Java développé dans le Groupe d'information interactive de l'Institut de technologie de l'information (ITI) du Conseil national de recherches du Canada (CNRC), qui décompose un mot Inuktitut en ses morphèmes, c'est-à-dire, sa racine, ses suffixes et sa terminaison grammaticale. L'information lexicale à la base de l'analyseur morphologique consiste de quelque 2000 racines, plusieurs centaines de mots lexicalisés (sorte de radicaux complexes fixes combinant une racine et un ou deux suffixes), plus de 330 suffixes, 300 terminaisons nominales et 1200 terminaisons verbales contenus dans une base de données que nous avons créée. La majeure partie de cette information lexicale provient des ouvrages de Ken Harper, Alex Spalding, Lucien Schneider, Mick Mallon, et Louis-Jacques Dorais. Veuillez vous référer à cette bibliographie pour une liste complète de nos références linguistiques. Les règles phonologiques des divers dialectes sur les groupes de consonnes (kt > tt, par exemple) ont été incorporées. Les dialectes reconnus par notre analyseur sont ceux d'Aivilik, Kivalliq, la Terre de Baffin du nord et du sud, et le nord du Québec. La loi de Schneider, qui s'applique au nord du Québec, a aussi été incorporée. La version actuelle de l'analyseur morphologique de l'inuktitut peut décomposer avec succès plus de 95% des mots les plus fréquents trouvés dans les Hansard du Nunavut et dans les pages inuktitut de l'internet. Nous continuons à travailler activement à augmenter les performances de l'analyseur morphologique de l'inuktitut par l'addition de racines et d'suffixes et d'informations pertinentes sur ces morphèmes.
|