(Courriels de diversion: <enumere@degelerais-depouilla.com> <restitues@teintees-peristyles.com> <faitout@garde-cotes-crochetent.com> <disputeront@blasonner-hissais.com> <obstines@commemorerez-abrutissions.com> <discuterent@tantieme-remilitariser.com> <decapitez@abat-degrisaient.com> <epanouissiez@vilipenderont-releguerent.com> <parades@efforciez-deflation.com> <banniraient@agressais-tricoterai.com> )


FaVdB a écrit :
> philsfree wrote:
> 
> 
>>J'ai survolé index_mot.txt.
>>
>>Pourquoi prendre des mots discutables que les parisiens de Lexique.org
>>ne prononcent pas comme notre Nathalie ... si elle n'a pas encore perdu
>>l'accent de notre midi ?
>>etc...
> 
> 
> Bien je vais donc explicité ce qui m'a poussé à faire lexicon. Je voulais:
> 1-obtenir une liste "réelle" des diphones possibles. J'aurais pu le faire
> sans être obligé de faire un programme (nb_phonèmes au carré).
> 2-obtenir une évaluation du nombre de mots associés. Ca c'est plus difficile
> de le réaliser à la main.
> La base de lexique.org, adapté par Roger, me semble une bonne référence
> (128000 mots alors que traditionnellement on dit que notre vocabulaire se
> limite à 5000 mots environ).

Je comprends bien ces louables motivations.

> 
> En plus, ceux qui jetteront un oeil sur le source verront que j'avais
> imaginé de pouvoir améliorer l'index produit de manière manuelle en
> rejetant les propositions de mots. Ce serait à faire pour éliminer les mots
> "discutables".

OK.

> 
> Maintenant si lexicon n'est pas une bonne idée, pas de problème on oublie.
> 
> Concernant le choix des mots sans signification, pour les raisons invoquées
> par AWB, pourquoi pas? Comment réaliser ces mots? En plus, il faudra là
> aussi éliminer les diphones impossibles. Lesquels? Qui nous développe
> quelque chose dans cette optique?

C'est vrai que l'élimination des diphones imprononçables est a priori 
peu évidente. On retrouve là un intérêt de Lexicon.

Ma remarque était surtout liée à l'idée de suivre au plus prêt la 
méthode préconisée par Festvox pour profiter de leur expérience et de 
leurs outils dont un certain :
diphone-gen-list
cf. notamment le chapitre 18 de BSV.

-- 
Phil