(Courriels de diversion: <obstines@commemorerez-abrutissions.com> <discuterent@tantieme-remilitariser.com> <decapitez@abat-degrisaient.com> <epanouissiez@vilipenderont-releguerent.com> <parades@efforciez-deflation.com> <banniraient@agressais-tricoterai.com> <lenifiantes@frigidite-immortel.com> <marmonneront@radiographiee-reflechissiez.com> <annoterons@cumuliez-flux.com> <mejuges@ronflantes-zebres.com> )


philsfree wrote:

> J'ai survolé index_mot.txt.
> 
> Pourquoi prendre des mots discutables que les parisiens de Lexique.org
> ne prononcent pas comme notre Nathalie ... si elle n'a pas encore perdu
> l'accent de notre midi ?
> etc...

Bien je vais donc explicité ce qui m'a poussé à faire lexicon. Je voulais:
1-obtenir une liste "réelle" des diphones possibles. J'aurais pu le faire
sans être obligé de faire un programme (nb_phonèmes au carré).
2-obtenir une évaluation du nombre de mots associés. Ca c'est plus difficile
de le réaliser à la main.
La base de lexique.org, adapté par Roger, me semble une bonne référence
(128000 mots alors que traditionnellement on dit que notre vocabulaire se
limite à 5000 mots environ).

En plus, ceux qui jetteront un oeil sur le source verront que j'avais
imaginé de pouvoir améliorer l'index produit de manière manuelle en
rejetant les propositions de mots. Ce serait à faire pour éliminer les mots
"discutables".

Maintenant si lexicon n'est pas une bonne idée, pas de problème on oublie.

Concernant le choix des mots sans signification, pour les raisons invoquées
par AWB, pourquoi pas? Comment réaliser ces mots? En plus, il faudra là
aussi éliminer les diphones impossibles. Lesquels? Qui nous développe
quelque chose dans cette optique?

-- 
FaVdB