(Courriels de diversion: <allient@recrimine-cachetteriez.com> <blagueuse@decollement-exceptant.com> <frileux@etheres-suppliciee.com> <tenables@coïncidents-ombragee.com> <pardonnons@malthusiennes-arche.com> <designeriez@cabale-sifflerais.com> <decotes@precede-heteroclites.com> <selliers@decervelage-decapotable.com> <fructifiaient@compatissions-deminerait.com> <prejugez@valoriserions-hypothecaires.com> )


Bonsoir,

Dans un premier temps, je vous adresse :
- tout d'abord, mes remerciements à l'assistance nombreuse
  qui a manifesté de l'intérêt envers ce projet
  à l'occasion de notre réunion de LUG de cet après-midi
- mes amicales pensées à ceux qui n'ont pas pu être présents
  en raison de leur éloignement géographique
  mais ont déjà apporté leur soutien à notre démarche
- à Pierre Brua qui avait superbement juste avant moi attiré et capté
  l'attention d'un public nombreux pour sa superbe conférence sur les
  clusters
  et qui a fini la réunion des (9) plus intéressés présents et
disponibles
  (jusqu'à 29 heures) en nous promettant outre ses investigations sur
  GnuSpeech un site d'hébergement de nos développements présents et
futurs
  (avec serveur CVS)
- à Patrick Labatut et Jean-Marc Harang qui avait eu la bonne idée
  d'organiser une bonne bouffe ce soir et ainsi rameuter encore plus
  les foules
- à Nath qui a vaincu sa modestie pour rappeler brièvement
  les motivations de BigLux ... et qui est notre constant aiguillon
  sans lequel on se bougerait sûrement moins ;-)
- à Roger dont le superbe travail sur Festival n'a pas été assez
justement
  et longuement démontré (matériel sous-dimensionné pour la salle
  + inévitable effet démo)

Bref, pour ce soir et pour conclure cet après-midi très encourageant,
je vous joins ci-dessous la partie textuelle des points essentiels
que j'ai pu vous exposer ce samedi après-midi ...
en attendant quelques pages web dans les jours qui viennent.



Pour faire lire un texte par un ordinateur, il faut 3 éléments
principaux :
- un transformateur de symboles 
- un phonétiseur 
- une synthèse vocale 

1- transformateur de symboles (tokenizer) :
  Traite les nombres, les chiffres romains, les numéros de téléphone,
les sigles, les abréviations, ...
 
2- un phonétiseur :
  En français, environ quarante phonèmes sont utilisés.
  FranParler est ma tentative de création d'un ensemble de règles de
phonétisation automatique.
  A ce jour, c'est un script Perl qui contient un peu plus de
quatre-cents règles de substitutions
  et moins de six-cents exceptions (et leurs dérivés). Son taux de
fiabilité est de l'ordre de
  95% (d'après un lexique de plus de 100 000 mots).
  Côté Festival, Roger a introduit un lexique de plus de
cent-vingt-mille mots (formes fléchies).
  Ce lexique contient pour chaque mot sa phonétisation et également une
identification grammaticale. 
  Cette dernière peut être utilisée dans des règles de liaison ou
d'intonation (prosodie).

3- synthèse vocale :
  Pour chaque phonème, il faut déclarer une durée et une hauteur
(modulation).
  De telles informations sont nécessaires à exploiter une base de
diphones :
  enregistrements de l'articulation de 2 phonèmes.
  FranParler est très simpliste sur cet aspect et ne gère pas du tout
l'intonation.
  Il se contente de fournir une durée fixe moyenne à chaque phonème.
  Roger a commencé à mettre en oeuvre ces aspects prosodiques du
français dans Festival.
  Rappel : Festival développé à l'origine par l'Université d'Edimbourg
est à ce jour la chaine
  de traitement de parole (TTS) la plus aboutie et en GPL.
  Festival peut utiliser la plus célèbre des bases de diphones
téléchargeable gratuitement
  pour usage personnel (mais n'est pas libre) qui s'appelle MBrola.
  Développée par l'Université de Mons, soutenu par l'union européenne,
  MBrola a le mérite de fournir de nombreuses voix dans plusieurs
  dizaines de langues alors que les synthèses (bases de diphones ou
autres)
  libres utilisables par Festival sont à ce jour anglophones, castillane
ou galloise.

Restrictions de FranParler et de Festival en français :
- une entrée en français correct (éviter les fôtes d'ortograf, les
abréviations,
  ne pas omettre les accents, ...)

Atouts de FranParler et de Festival en français :
- liberté (sauf Mbrola)
- extensibilité 

A faire :
- peaufiner la phonétisation automatique de FranParler et la rendre plus
portable
- intégrer ces règles de phonétisation automatique dans Festival
- développer et intégrer des règles de tokénisation 
- maîtriser la parallélisation et le tamponnage (bufferisation) de la
synthèse vocale
- améliorer les règles de prosodie
- maîtriser les commandes et le flux Emacspeak 
- créer des procédures d'installation 
- publier : site web à mettre à jour 
- étudier Flite (prononcer Flight)
- rejoindre le Gnome Accessibility Project 
- internationaliser Emacs (messages)
- faire des propositions d'extensions du Speech Synthesis Markup
Language (SSML du W3C)
- étudier des alternatives libres à Mbrola 
- résister aux sirènes propriétaires et à l'éparpillement


A+
-- 
Phil


---------------------------------------------------------------------
To unsubscribe, e-mail: biglux-unsubscribe@savage.iut-blagnac.frFor additional commands, e-mail: biglux-help@savage.iut-blagnac.fr