Journées portes ouvertes sur les écoles et les instituts supérieurs dédiés à la Culture et à l'Art    Hommage à Alger à Kaddour M'Hamsadji, doyen des écrivains algériens    In Salah: 10 morts et 9 blessés dans un accident de la route au sud de la wilaya    Le président de la République reçoit une invitation de son homologue irakien pour assister au Sommet arabe à Baghdad    Gymnastique/Coupe du Monde-2025: Kaylia Nemour brille une nouvelle fois, avec deux médailles d'or et une d'argent en Egypte    Algérie-Canada: perspectives prometteuses pour le renforcement du partenariat économique dans l'énergie et les mines    Attaf reçoit un appel téléphonique de son homologue indien    France : le parti LFI exige le départ du ministre Bruno Retailleau    Une délégation ministérielle qatarie en visite à l'USTHB    Coupure de courant en Espagne et dans d'autres pays européens : aucune interruption du service Internet en Algérie    Merad salue les efforts des services de la Protection civile    Hadj 1446/2025 : Belmehdi appelle à intensifier les efforts pour une saison réussie    Décès de l'ancien journaliste à l'APS Djamel Boudaa: le ministre de la Communication présente ses condoléances    Changer l'approche de la gestion des structures des jeunes pour les rendre plus attractives    Ligue 1 Mobilis/USMA-ASO: les "Rouge et Noir" sommés de réagir    CHAN2025/Algérie-Gambie: les Verts poursuivent leur stage à Sidi Moussa    CIJ: poursuite des audiences sur les obligations humanitaires de l'entité sioniste en Palestine occupée    Des prix « lignes rouges » et des représailles contre les contrevenants    Le CS Constantine ne peut s'en vouloir qu'à lui-même    L'USMH conserve la tête, l'IRBO relégué en Inter-Régions    De Gustav Landauer à Hassan Nasrallah ou l'universalité de l'esprit de la société    Kiev doit céder les territoires conquis par la Russie    Premier festival de la cuisine halal    La DSP et les gestionnaires des EPH joignent leurs efforts pour une prise en charge des patients    Patriotisme et professionnalisme    Quelles est la situation de la balance commerciale et des exportations hors hydrocarbures en 2024 de l'Algérie ?    Avant-première du documentaire ''Zinet Alger : Le bonheur'' de Mohamed Latrèche    Présentation à Alger des projets associatifs subventionnés par le ministère de la Culture et des Arts    Saâdaoui annonce la propulsion de trois nouvelles plate-formes électroniques    Les renégats du Hirak de la discorde    Mise au point des actions entreprises    Ça se complique au sommet et ça éternue à la base !    Un site historique illustrant l'ingéniosité du fondateur de l'Etat algérien moderne    Sept produits contenant du porc illégalement certifiés halal    Se présenter aux élections ne se limite pas aux chefs de parti    Un art ancestral transmis à travers les générations    La Fifa organise un séminaire à Alger    Khaled Ouennouf intègre le bureau exécutif    L'Algérie et la Somalie demandent la tenue d'une réunion d'urgence du Conseil de sécurité    30 martyrs dans une série de frappes à Shuja'iyya    Lancement imminent d'une plate-forme antifraude    Les grandes ambitions de Sonelgaz    La force et la détermination de l'armée    Tebboune présente ses condoléances    Lutte acharnée contre les narcotrafiquants    La Coquette se refait une beauté    Cheikh Aheddad ou l'insurrection jusqu'à la mort    Un historique qui avait l'Algérie au cœur    







Merci d'avoir signalé!
Cette image sera automatiquement bloquée après qu'elle soit signalée par plusieurs personnes.



La voix devient une interface des services en ligne
Publié dans Le Quotidien d'Oran le 15 - 04 - 2015

La modélisation mathématique permet aujourd'hui de traiter la parole comme une donnée biométrique. La voix remplacera, un jour, l'authentification par mot de passe introduit via un clavier.
Les dix dernières années témoignent des progrès énormes réalisés dans l'amélioration de la fiabilité des systèmes de traitement automatique de la parole. Ce progrès a radicalement changé les environnements software et hardware des télécommunications. Un signal vocal, lors de son traitement par un processeur d'un smartphone, ou lors de son transport par les réseaux des opérateurs des télécommunications, est traité avec plus d'efficacité par les équipements numériques, et ce, grâce aux progrès réalisés dans la modélisation mathématique du processus de la production de la parole humaine. Ces performances scientifiques ont mené à une analyse et synthèse de la parole de qualité supérieure, à une reconnaissance automatique du locuteur et à la réalisation de codeurs de parole.
En incluant les technologies vocales dans les terminaux mobiles et ordinateurs portables, grâce à des logiciels de plus en plus performants de codage et de compression des données, la messagerie électronique vocale (Voice mail), les systèmes de traduction vocale en ligne, les terminaux intelligents, les ordinateurs individuels, les voitures connectées et les réseaux, l'avenir des télécommunications ne se fera aucunement sans évoquer le rôle primordial du traitement automatique du langage naturel joué dans le développement du Dialogue Homme/Machine. Ainsi, le lancement par Apple en 2011 de son service de reconnaissance vocale Siri permettant de commander vocalement son iPhone a simplifié la vie de son utilisateur et a, surtout, prouvé que la voix humaine occupe désormais le premier plan des usages mobiles innovants. Siri est un service qui permet à l'usager d'émettre une commande vocale, qui sera envoyée vers les serveurs Cloud d'Apple pour être analysée, afin d'exécuter l'action désirée par l'utilisateur. Un tel service est le fruit de travaux de recherche effectués dans le domaine de la production de la parole qui sont orientés vers une meilleure caractérisation quantitative de son analyse.
Speech to Text
Cette avancée a été obtenue grâce à une paramétrisation (action de modifier la structure d'un élément numérique) permettant la réduction de la largeur de bande et une représentation par un nombre réduit de paramètres pertinents. Aussi, les avancées réalisées dans l'analyse et la modélisation de la voix ont permis d'atteindre des objectifs inattendus dans le domaine de la recherche par mots clés dans le web. La technique du "Speech to Text" en est un exemple. Il s'agit d'une méthode de transcription automatique des sons des vidéos au format texte pour permettre un meilleur référencement du contenu. L'usager sera alors amené à juger le contenu d'un film avant même de l'avoir vu. La recherche d'une vidéo ou d'un programme TV web devient alors plus simple et surtout plus rapide. Malgré l'intérêt de cette solution de recherche par la parole, elle n'est toujours pas totalement démocratisée. Mais elle est d'une grande utilité dans la mesure où le nombre de vidéos présentes sur la toile a déjà dépassé le nombre de requêtes sur les moteurs de recherche. Le moteur de recherche Google est le premier à introduire la technique "Speech to Text" qui subira prochainement des améliorations inédites. Il sera possible alors de convertir du séquençage vidéo au format texte. Adobe va introduire cette technologie sur certains contenus.
Côté perspectives, l'authentification par signature vocale suscite beaucoup d'intérêts dans le renforcement de la sécurité des réseaux des télécommunications. A l'avenir, les utilisateurs qui accèdent à un réseau par un terminal mobile subiront un contrôle d'identité vocal afin de permettre de détecter des usagers non autorisés. Pour cela il est nécessaire d'implanter un système de reconnaissance vocale du locuteur déporté en ligne qui, en temps réel, authentifie la voix de l'utilisateur. Cependant, la disponibilité de cette technologie est conditionnée par la levée d'un obstacle très important. Il s'agit des limites relevées dans les terminaux dans le computing des programmes nécessaires à cette opération. Ces derniers doivent être stockés dans des serveurs Cloud. C'est pourquoi, les caractéristiques d'un réseau de communication doivent être prises en compte. Par exemple, la voix doit être codée à bas débit pour éviter une consommation trop importante de bande passante, et la transmission des communications doit reposer sur une architecture distribuée. La durée de vie d'un clavier, du moins pour certains usages et applications, est ainsi comptée...


Cliquez ici pour lire l'article depuis sa source.