(Courriels de diversion: <calorique@inculquerait-contrediraient.com> <definirait@differenciations-signez.com> <eclairions@pelletteras-chambre.com> <demantelee@iconographes-inconstantes.com> <ecourterez@imperieuse-commanditera.com> <endormez@exterieurs-chomerais.com> <encolleriez@recipiendaires-evadait.com> <charcuterez@deportations-accapariez.com> <boxe@insignes-flechirez.com> <oscilleras@gemines-divulgations.com> )
En fait, je parlais des performances des algorithmes plus que données traitées.
Dans le cas ou UTF-8 serait pénalisé, pensez-vous que l'ajout d'une instruction dédiée UTF-8 dans un processeur ait un sens?
vu la puissance actuelle des processeurs, vu qu'en utilisation bureautique (manipulation de caractères) ils tournent a qqchose comme 1% d'utilisation CPU, je ne vois pas trop l'interet d'un tel jeu d'instructions.
ensuite, les caches fetchent de toutes facons 64bits sur les nouveaux processeurs 64bits, donc ca blaste pas mal (-:
comptage:../data/essai/essai_en anglais 27660, 27660, 27922 comptage utf-16: 99 microsecondes comptage utf-8: 128 microsecondes
comptage:../data/essai/essai_fr français 967850, 967850, 1000000 comptage utf-16: 7895 microsecondes comptage utf-8: 7282 microsecondes
comptage:../data/essai/essai_ja japonais 425284, 425284, 1000000 comptage utf-16: 3841 microsecondes comptage utf-8: 7691 microsecondes
comptage:../data/essai/essai_ru russe 28472, 28472, 46862 comptage utf-16: 104 microsecondes comptage utf-8: 689 microsecondes
comptage:../data/essai/essai_zh chinois 58905, 58905, 94347 comptage utf-16: 292 microsecondes comptage utf-8: 638 microsecondes
-------------------------------------------------------------------- Les listes de diffusion occultes: <URL:http://www.CULTe.org/listes/>