Forum QtFR

La communauté francophone Qt

Vous n'êtes pas identifié(e).

Annonce

Qt 4: 4.8.4 - Qt 5: 5.0.2 - Qt Creator: 2.7.1 - Qt Installer: 1.3.0 - VS Qt 4: 1.1.11 - VS Qt 5: 1.2.1 - Monkey Studio: 1.9.0.4

#151 26-05-2012 13:16:18

myrddin772
Modérateur Qt
Inscription : 13-03-2010
Messages : 685

Re : Algorithme de codage de sonorité

Tiens, j'ai une petite question (peut-être bête wink )...
Quel est l'objectif du projet ? Faire un programme de correction orthographique pour des e-mail ?


"L'informatique n'est pas plus la science des ordinateurs que l'astronomie n'est celle des télescopes." Michael R. Fellows et Ian Parberry
Si tu ne sais pas : demande, si tu sais : partage !

Hors ligne

#152 26-05-2012 18:39:21

PapaJaac
Administrateur Qt
Lieu : Bordeaux
Inscription : 08-12-2008
Messages : 1 751

Re : Algorithme de codage de sonorité

Je te renvoie à ton premier message  ainsi qu'à ce sujet.

Le besoin auquel devait répondre Ortho était au départ de permettre la correction des textes obtenus suite à une reconnaissance optique de caractères (ROC ou OCR pour les anglomanes) sur des images. Cette ROC est effectuée par Tesseract (moteur de ROC assez performant mais uniquement en ligne de commande). Mon programme SolidROC permet de scanner des documents, de manipuler l'image obtenue, de lancer Tesseract dessus puis de récupérer le texte brut obtenu et le corriger.

Le besoin était donc assez particulier, une ROC pouvant créer des fautes d'orthographe mais pas des fautes de grammaire.
Par exemple OISEAU BLEU peut donner 0l5EAU B|_EU mais pas OISEAUX BLEU

Hors ligne

#153 26-05-2012 18:53:29

myrddin772
Modérateur Qt
Inscription : 13-03-2010
Messages : 685

Re : Algorithme de codage de sonorité

Ok, j'ai compris (j'avais dit que la question pouvait être bête tongue )


"L'informatique n'est pas plus la science des ordinateurs que l'astronomie n'est celle des télescopes." Michael R. Fellows et Ian Parberry
Si tu ne sais pas : demande, si tu sais : partage !

Hors ligne

#154 26-05-2012 22:08:02

myrddin772
Modérateur Qt
Inscription : 13-03-2010
Messages : 685

Re : Algorithme de codage de sonorité

Tiens je viens de me rendre compte d'un problème le mot (mal orthographié) "cessi" n'est pas reconnu ni par l'orthographe, ni par le sonex...

Le problème est le suivant :
Le mot "cessi" a pour sonex "SISI"ce qui est assez logique puisqu'un 'e' suivi de deux consonnes est prononcé 'é'.
Je voulais écrire un mot prononcé 'ceussi', donc je transforme mon mot en "ceussi" big_smile mais son sonex devient "SESI"... et je ne trouve toujours pas le mot correct dont le sonex est "SI" (en théorie c'est "SSI" mais on évite les doublons...
La question est donc : doit-on coder par "E" la lettre e qui serait entourée de deux consonnes ayant le même code ?


"L'informatique n'est pas plus la science des ordinateurs que l'astronomie n'est celle des télescopes." Michael R. Fellows et Ian Parberry
Si tu ne sais pas : demande, si tu sais : partage !

Hors ligne

#155 29-05-2012 09:04:48

PapaJaac
Administrateur Qt
Lieu : Bordeaux
Inscription : 08-12-2008
Messages : 1 751

Re : Algorithme de codage de sonorité

Nicolas SOUCHON a écrit :

pour récupérer, c'est comme pour trunk (...)

J'ai récupéré et testé, ça me convient fort bien.

Nicolas SOUCHON a écrit :

pour ce qui est des configs sur linux, il y a en général un répertoire utilisateur prioritaire (...)

C'est exact.

Donc ce qu'il faut faire
- basculer ta branche dans le tronc (dans ce sens-là, parce que j'ai des modifs non commitées qui sont beaucoup plus faciles à greffer sur les tiennes que le contraire. Je les ferai a la mano sur ton code : supprimer m_config dans la classe Ortho qui dérivera directement de QSettings)

- mettre en place cet algo :
1/ je modifierai le scan initial des répertoires qui renseigne m_availableLanguages, de façon à récupérer le chemin spécifique de chaque dico (supprimer m_dicsPath qui ne sera plus unique)
2/ au changement de langue on va voir dans  m_availableLanguages où se trouve le dico de la langue xxx
3/ on le charge avec ta méthode de test si pre-hashed ou pas

D'accord ?

Hors ligne

#156 29-05-2012 09:06:41

PapaJaac
Administrateur Qt
Lieu : Bordeaux
Inscription : 08-12-2008
Messages : 1 751

Re : Algorithme de codage de sonorité

myrddin772 a écrit :

La question est donc : doit-on coder par "E" la lettre e qui serait entourée de deux consonnes ayant le même code ?

Oui ! smile

Hors ligne

#157 21-06-2012 19:29:52

PapaJaac
Administrateur Qt
Lieu : Bordeaux
Inscription : 08-12-2008
Messages : 1 751

Re : Algorithme de codage de sonorité

Bonsoir !

J'ai avancé sur l'utilisation de Ortho par Dicodor (et commité les changements)
L'appli maintenant indique au fur et à mesure de la saisie les mots mal orthographiés par un soulignement rouge. Un clic droit sur un de ces mots inconnus de Ortho affiche les suggestions. La sélection d'une de ces suggestions remplace le mot inconnu.
Nicolas, je n'ai pas intégré ta branche "dissidente". Peux-tu le faire ? ton boulot m'intéresse beaucoup.
Merci

Hors ligne

#158 24-06-2012 22:51:13

myrddin772
Modérateur Qt
Inscription : 13-03-2010
Messages : 685

Re : Algorithme de codage de sonorité

Je viens de mettre à jour ma version... il y a un problème : m_ortho n'est pas connu dans le fichier textedit.cpp (aux lignes 100, 118, 155 et 160)


"L'informatique n'est pas plus la science des ordinateurs que l'astronomie n'est celle des télescopes." Michael R. Fellows et Ian Parberry
Si tu ne sais pas : demande, si tu sais : partage !

Hors ligne

#159 25-06-2012 07:35:10

PapaJaac
Administrateur Qt
Lieu : Bordeaux
Inscription : 08-12-2008
Messages : 1 751

Re : Algorithme de codage de sonorité

Le dépôt était un peu en bazar...

Rev. 60 : Ok.

Hors ligne

#160 02-07-2012 16:57:49

Nicolas SOUCHON
Administrateur Qt
Inscription : 28-07-2007
Messages : 3 154

Re : Algorithme de codage de sonorité

J'ai intégré les modifs de ma "branche dissidente" à partir de la rev.63 --> rev.64

voir le commentaire de commit
et demander si nécessaire

Hors ligne

#161 03-07-2012 09:06:30

myrddin772
Modérateur Qt
Inscription : 13-03-2010
Messages : 685

Re : Algorithme de codage de sonorité

Il semble qu'il y ait un problème car même les mots correctement orthographiés sont soulignés en rouge...


"L'informatique n'est pas plus la science des ordinateurs que l'astronomie n'est celle des télescopes." Michael R. Fellows et Ian Parberry
Si tu ne sais pas : demande, si tu sais : partage !

Hors ligne

#162 03-07-2012 09:11:23

PapaJaac
Administrateur Qt
Lieu : Bordeaux
Inscription : 08-12-2008
Messages : 1 751

Re : Algorithme de codage de sonorité

Que donne un clic droit dessus ?
Dans les messages, est-il indiqué que le dico est correctement chargé ?

Hors ligne

#163 03-07-2012 09:20:49

myrddin772
Modérateur Qt
Inscription : 13-03-2010
Messages : 685

Re : Algorithme de codage de sonorité

Quand je "clique droit" dessus, j'ai bien le menu contextuel (avec les propositions parfois nombreuses).
Il semble que les dictionnaires ne soient pas correctement chargés puisque je n'ai pas que des propositions en fonctions de la sonorité... D'où question : où dois-je mettre les dictionnaires de bases et comment le forcer à hasher de nouveau ces dictionnaires ?


"L'informatique n'est pas plus la science des ordinateurs que l'astronomie n'est celle des télescopes." Michael R. Fellows et Ian Parberry
Si tu ne sais pas : demande, si tu sais : partage !

Hors ligne

#164 03-07-2012 09:30:53

Nicolas SOUCHON
Administrateur Qt
Inscription : 28-07-2007
Messages : 3 154

Re : Algorithme de codage de sonorité

roll roll roll

l'intégration a été plus délicate que je ne pensais (évolution config et ortho)
je n'ai fais de test qu'avec des fôtes énôrmes (mea cupa)

en attendant ma correction, on peut mettre

dans orhto.cpp pour conserver l'ancien comportement

Hors ligne

#165 03-07-2012 11:06:12

Nicolas SOUCHON
Administrateur Qt
Inscription : 28-07-2007
Messages : 3 154

Re : Algorithme de codage de sonorité

L'erreur est corrigée @ rev.65

sad Désolé pour le désagrément !

Hors ligne

#166 03-07-2012 11:20:29

Nicolas SOUCHON
Administrateur Qt
Inscription : 28-07-2007
Messages : 3 154

Re : Algorithme de codage de sonorité

pour ce qui est de la place des dicos

config Ortho::BASE, lancer avec :
    # dicodor -dc=base [-dt]
    # dicodor -dc base [-dt]
recherche :
    c'est comme avant

config Ortho::NS[_MERGED], lancer avec :
    # dicodor -dc=ns[merged] [-dt]
    # dicodor -dc ns[merged] [-dt]
recherche :
    - /home/user/.dicodor/dics-ns[-merged]/
    - /usr/share/dicodor/ns[-merged]/     
    - /path/to/app/dics/                 
    - :/dics/
    merged est le defaut
    prend tous les fichier lang[.*].dic dans le premier répertoire où ils sont trouvés
les dictionnaires "pre-hashed" sont dans :
    - /home/user/.dicodor/dics-ns[-merged]/hashed
    supprimer ce répertoire pour forcer le pre-hashing

exemple:

Hors ligne

Pied de page des forums


Sitemap QtFR