Re: connaissez-vous Praat ?

(Courriels de diversion: <aspergera@etaleras-rime.com> <contractualiserais@desorganisa-pratiquantes.com> <budgetaire@inconstitutionnalite-mordillees.com> <enseveliraient@assagie-dispersait.com> <aimants@soldee-necrologiques.com> <belligerante@emulee-montgolfieres.com> <deliberant@aviserai-emergeriez.com> <impartiaux@inacceptation-collera.com> <guerissable@recipiendaires-coopteras.com> <renouvellerai@sacraliser-denoncerez.com> )

To: biglux@culte.org
Subject: Re: connaissez-vous Praat ?
From: webmapper@ouvaton.org
Date: Sun, 15 Feb 2004 04:27:32 +0100

bonsoir,
j'ai un peu les pieds emmellés dans les fils de discussions, j'espère
que ce message arrivera au bon endroit...

je ne connais pas trop le projet et certains termes m'échappent :
(je vais essayer de plus me documenter sur lexique.org et essayer
liaphone)

> En partant de l'une des différentes base (Surface) on devrait 
> pouvoir élaborer un corpus. Le seul bémol c'est que le codage
phonétique est 
> du VoCodex et non du SAMPA, mais ce n'est pas vraiment ni important ni

> bloquant
> ...
> - il faut élaborer un système de base vocale (sous forme séquenciel
indexé des 
> sons segmentés indexés par les diphones), création et lecture


Cependant,
> On a fait tout ça aujourd'hui à la main, y'a pu qu'à... comme dit
l'autre.
Allons-y !

> - on a praat comme outil d'enregistrement et de segmentation
D'accord, c'est une partie longue et fastidieuse, mais faite une fois
pour toute,
encore faut-il définir une "rêgle" de segmentation. Y en a-t-il une ?
Laquelle
(lesquelles) sont appliquées dans les logiciels existants et dans les
recherches
linguistiques ? -> doc...

> - il faut élaborer le moteur de concaténation des diphones pour créer
le wav 
> de sortie
C'est à dire ?
Praat peut être appelé à partir du shell pour lire des sons :

j'ai enregistré les sons suivants :
sy_tu.wav, sy_as.wav, sy_vu.wav, sy_le.wav et sy_chat.wav.

j'ai créé 5 "scripts" praat identiques, sauf le nom du fichier wav à
jouer.
Ces 5 scripts sont enregistrés sous :
a_tu.pra, a_as.pra, a_vu.pra, a_le.pra et a_chat.pra.

voici le script "a_chat.pra" :
Read from file... /home/blaise/log/datas_praat/sy_chat.wav
Play
Remove


maintenant, sans ouvrir le logiciel praat, je tape dans une console :
./praat datas_praat/a_tu.pra
(je suis dans le répertoire où se trouve l'exe de praat et mes scripts
praat et les sons sont dans un sous répertoire /datas_praat .
et j'entend le son "tu".

Donc, je fais le petit fichier texte suivant :
./praat datas_praat/a_tu.pra
./praat datas_praat/a_as.pra
./praat datas_praat/a_vu.pra
./praat datas_praat/a_le.pra
./praat datas_praat/a_chat.pra
j'enregistre ce fichier, le rend exécutable et l'exécute et j'entend :
"tu as vu le chat" . . .

Ma question à :
> - il faut élaborer le moteur de concaténation des diphones pour créer
le wav 
> de sortie
praat ne peut-il pas le faire ? Ou plutôt un script shell appelant
praat,
ou mieux, un logiciel appelant praat en temps réel ?

Ayant du m'absenter l'année dernière, je n'ai pas pu suivre jusqu'au
bout les
excelents cours de shell d'Alain. Mais je vais m'y remettre pour écrire
un script
faisant ceci (ou faisons le puisque vous devez bien mieux maitriser le
shell que moi) :
- lire un fichier (syllabes prémachées)
- pour chaque syllabe, appeler praat avec la syllabe comme paramètre de
nom
  de fichier.

Si ce script fonctionne, on pourra essayer de l'interfacer avec un
programme, 
(script ?) pour obtenir du temps réel (avec les stdin, stdout et les
pipes ? ? ?)

Je pense, (à discuter ensemble), que pour réaliser rapidement une démo,
il vaudrait mieux s'orienter vers une "règle" de découpage des sons
assez "large", c'est à dire couvrant une syllabe entière, plutôt
q'une règle plus "étroite" qui décompose le son "chat" en deux ou trois
échantillons.
Cette méthode est sans doute, ?, de moins bonne qualité, mais je pense
qu'elle
est plus rapide à mettre en oeuvre.
Dans ce cas là (découpage par syllabe entière), combien et quelles
syllabes
faut-il ? (je vais aller chercher mon dictionnaire pour commencer...)

J'attends vos remarques et suggestions. Je pense qu'une telle démo peut
marcher d'ici 15 jours, il faut :
- enregistrer toutes (...) les syllabes possibles (combien, lesquelles
?)
- faire un script shell qui lit un fichier (de syllabes) et lance
  praat avec la syllabe comme paramètre de fichier wav à jouer.

N'hésitez pas à m'envoyer le script shell, sinon, je vais le trouver.
Si vous avez une liste de syllabe "officielle", je suis également
preneur,
mais sinon, je vais chercher.
Si vous faites la même démo, entendons nous sur les syllabes et les
noms
de fichier pour que nous puissions échanger nos voix !


un éventuel bémol à vérifer, dans l'option "règle de découpage étroite
:
ma séquence "tu as vu le chat" n'est pas trop
"hachée" ou alors ce sont mes échantillonages qui contiennent des
blancs,
mais surtout j'ai échantilloner des syllabes. Il faudrait tester si la
séquence
"challe" décomposée en 2 ou 3 sons n'est pas hachées par des "chtic-pop"
entre
chaque appel de traap (à partir du shell).

Blaise

Follow-Ups:
- Re: connaissez-vous Praat ?
  - From: Franz-Albert VAN DEN BUSSCHE <fa.vdb@free.fr>