DL : Bonjour, je suis Didier Lambert, le fondateur de la plateforme HubTic, une plateforme de veille et d’information dans le domaine des communications unifiées, de la collaboration et de l’expérience client. Ce matin, j’ai le plaisir d’échanger avec Kevin Perez Artaza qui est Key Account Manager chez AudioCodes. Bonjour Kevin, comment vas-tu ?
KPA : Bonjour Didier, très bien et toi ?
DL : Ça va. Merci de me consacrer un petit peu de temps ce matin pour parler d’agents conversationnels, d’agents vocaux. Mais avant qu’on rentre dans le vif du sujet, est-ce que tu peux en quelques mots nous repositionner, nous rappeler qui est AudioCodes et comment il se positionne sur le marché ?
KPA : Pour ceux qui ne nous connaissent pas, AudioCodes est une société israélienne qui existe maintenant depuis 30 ans, experte du monde de la voix — de la voix de l’entreprise et des opérateurs — avec différentes solutions pour faire migrer les entreprises, que ce soit en lien direct ou à travers nos partenaires, vers les nouvelles solutions CCaaS. Dans le monde du centre de contact — même si le sujet vogue également vers la collaboration — on intègre les différentes fonctionnalités IA en s’adaptant le plus précisément au besoin du client.
DL : Alors on va rentrer dans le vif du sujet. L’objectif aujourd’hui, c’est de comprendre quelle est l’offre d’AudioCodes dans ce secteur bien particulier et très tendance des agents conversationnels, et notamment dans leur déclinaison voix. Pour faire simple, j’ai vu au dernier salon une offre Voice AI Connect, si j’ai bien retenu le nom. Est-ce qu’on peut commencer par ça ? Est-ce que tu peux nous expliquer ce que c’est que cette offre proposée par AudioCodes aujourd’hui ?
KPA : Je peux tout à fait. Nos différentes solutions sont d’ailleurs assez liées. Voice AI Connect a été construit assez naturellement en fonction de ce qu’on avait fait par le passé, qui était la connectivité — comme on nous connaît, et bon nombre de personnes nous connaissent sur cette partie connectivité avec les différentes solutions. On a fait évoluer ce monde avec notre connaissance sur la voix pour créer une solution qui s’appelle donc Voice AI Connect, permettant de connecter les différentes solutions vocales d’une manière complètement agnostique, que ce soit sur la partie IA conversationnelle — les différents faiseurs, les LLM — et les différentes solutions CCaaS ou de centre de contact en prémisse, pour permettre aux entreprises de réutiliser ce qu’elles ont déjà ou de migrer vers de nouvelles solutions, tout en utilisant l’intelligence artificielle dans ce monde du centre de contact.
DL : Donc est-ce que ça veut dire qu’AudioCodes, sur ce segment-là, orchestre en fait toutes les briques qui sont disponibles sur le marché, ou est-ce qu’il y a malgré tout une offre d’agent vocal spécifique proposée par AudioCodes ?
KPA : Là, on a parlé de la solution Voice AI Connect, qui était la première solution dans le monde de l’intelligence artificielle qu’on a montée. Cette première solution vient justement faire cette orchestration — simplement cette orchestration — en s’appuyant sur les faiseurs ou sur les technologies qu’ils ont. Elle répond à une grande partie des besoins, mais avec les différents échanges, on s’est rendu compte qu’il y a un besoin de la part des métiers du monde du contact, de la part des techniques, mais également des agents. C’est pour ça qu’on a une deuxième solution qui s’est créée quasiment au même moment, qui s’appelle Live Hub, et qui reprend les mêmes fonctionnalités d’un point de vue connectivité et agnosticité, mais là on va pouvoir ajouter beaucoup plus de technologie et répondre aux besoins — un IVR intelligent, un agent assist, des choses plus concrètes. On va créer le bot : c’est une solution complètement SaaS, mais on va pouvoir vraiment monter de la partie connectivité jusqu’à un bot défini. Pour résumer : oui, Voice AI Connect est un orchestrateur, mais sur la partie Live Hub, on vient proposer toute la palette de solutions IA vocales — qu’elles soient AudioCodes, ou d’autres.
DL : Si on fait un focus sur l’application de ces agents conversationnels à l’accueil client — dans ce que beaucoup d’acteurs en tout cas en relation client appellent les IA réceptionnistes, même si c’est peut-être un peu réducteur — qu’est-ce qu’on peut faire avec cet environnement que tu viens de décrire en matière d’accueil client, et est-ce qu’il y a des fonctionnalités ou des spécificités disponibles dans l’offre proposée par AudioCodes aujourd’hui ?
KPA : C’est une très bonne question. Je pense que l’IVR intelligent — ou l’accueil, ou réceptionniste, comme on veut — c’est le premier pas vers l’intelligence artificielle vocale dans le centre de contact, parce que ce sont les premières fonctionnalités qu’on peut mettre en place assez simplement. Avec AudioCodes, on va pouvoir opérer selon deux principes : soit rester sur ce qui a été fait par le passé en montant en compétence petit à petit sur la partie IVR — donc simplifier un SVI et le rendre vocal, c’est le premier point, et on vient monter petit à petit vers un SVI intelligent, en ajoutant l’expertise de la partie voix avec une voix qui va de plus en plus se rapprocher d’une voix humaine, voire de l’agent. Et après le deuxième point, on arrive vraiment sur un réceptionniste à valeur ajoutée : on vient ajouter une expertise à cette partie bot vocale pour qu’il puisse effectuer de plus en plus de tâches, assez simples mais qui demandent de l’expertise. On se connecte donc avec le CRM, avec les cœurs de métier des clients, pour qu’ils puissent monter en compétence sur ce sujet et simplifier tous ces cas. Si on prend le cas d’usage des assureurs — les besoins de certificats en début d’année ou la création d’un nouveau contrat — toutes ces petites fonctions peuvent être faites par un agent vocal. C’est là où je parlais de partir de la base avec un SVI pour arriver à toutes les fonctionnalités d’un réceptionniste.
DL : On est dans une architecture full SaaS, si j’ai bien compris ce que tu disais. Comment concrètement, si j’ai un SVI à l’ancienne et que je veux évoluer vers ce type de brique technologique, je m’y prends ? Est-ce que c’est long ? Comment on déploie ça ? On passe par des intégrateurs, partenaires d’AudioCodes, ou c’est fait en direct avec AudioCodes ?
KPA : On ne vend jamais en direct, donc quoi qu’il arrive, on passe via un partenaire. Pour mettre en place un POC, c’est assez simple. C’est la pré-étude qui va demander le plus de temps, au-delà de l’intégration. Live Hub aujourd’hui est utilisé pour tout le déploiement qu’on met en place, même pour des solutions qui à terme seraient en prémisse. La solution Live Hub est tellement malléable qu’elle permet de pouvoir tester quasiment du jour au lendemain. On met en place toutes les fonctionnalités et le lendemain on peut le tester. La solution a été créée pour qu’il y ait une interface assez simple. Certains de nos clients vont même par eux-mêmes tester, vérifier, faire les différents liens et les différents bots pour tester d’eux-mêmes.
DL : Je rebondis juste sur un commentaire que tu as fait : on peut tester sur Live Hub en mode SaaS avant de passer en prémisse. Ça veut dire qu’on peut sur cette plateforme tester les différents schémas, les différents modèles qu’on a en tête, et quand tout ça est bouclé, on peut éventuellement en produire une déclinaison qui fonctionne on-premise ?
KPA : Exactement. Pour rappeler ce que je disais au début : Voice AI Connect a été créé pour être totalement souverain. On sait que les différentes technologies peuvent être dans le cloud, mais on peut garder la donnée et essayer de garder le plus de choses souveraines possible. Quand on parle de souverain, c’est vraiment soit cloud privé, soit data center en prémisse. Oui, pour répondre à ta question, on peut tout tester en cloud et essayer le plus possible de garder les solutions au plus près du client. On a fait ce choix de pouvoir proposer les deux, et bon nombre de nos clients — notamment des assureurs — ont quelques fonctionnalités cloud mais veulent garder leur donnée. Dans ce cas-là, on fait des tests avec une architecture qui pourrait être à terme totalement souveraine. On s’associe de plus en plus avec des partenaires qui ont également des solutions en prémisse, que ce soit pour la partie bot complexe, et on a des clients qui viennent prendre les deux briques pour proposer le souverain le plus large possible.
DL : Sur quoi fait-on tourner ces agents intelligents en termes de base de données, et comment se connectent-ils à l’écosystème applicatif de l’entreprise — notamment, je crois que tu l’as cité, les CRM ? Est-ce qu’on est sur un développement au cas par cas ou est-ce qu’il y a des connecteurs CRM natifs prêts à fonctionner ?
KPA : Tout est connectable via API, donc on peut connecter tous les CRM. Maintenant, il y a des préconfigurés pour certains CRM — on parle des plus gros. Le mot « agnostique » n’est pas choisi au hasard : les API sont totalement ouvertes côté CRM, et en fonction de ce qu’on veut récupérer, il y a des choses qui ont déjà été préconfigurées pour monter plus facilement le lien entre les deux.
DL : Alors, puisqu’on parle de préconfiguration, est-ce qu’il y a également dans l’approche d’AudioCodes des spécialisations par marchés verticaux ?
KPA : C’est une très bonne question, parce qu’on se rend compte que chaque client, chaque métier a des besoins spécifiques mais qui se ressemblent de plus en plus. Encore une fois, si on prend le réceptionniste, à 80 % ils ont quand même des similarités — pas seulement entre métiers, même entre les différents clients. Donc oui, on a des choses préconfigurées, et après, chaque métier, chaque client a des fonctionnalités qui ont déjà été faites. Il faut aussi regarder ce qui a déjà été fait.
DL : Le temps passe vite. J’ai encore quelques questions à te poser. Une qui est incontournable : le modèle tarifaire. Comment ça fonctionne ? Comment on consomme ce type de brique d’agent conversationnel ?
KPA : Si on parle de la solution SaaS, c’est à l’usage — vraiment ce qui a été utilisé par le client, et en fonction de son usage, le prix en découlera. Dans le mode Live Hub, c’est à l’usage. Pour la partie Voice AI Connect, on vérifie le nombre de sessions et le nombre de minutes utilisées, et on sera facturé en fonction de ce choix.
DL : En termes d’usage et de maturité de vos clients, est-ce que les entreprises sont aujourd’hui matures sur les bénéfices qu’elles peuvent tirer de ce genre de brique technologique — et si oui, qu’est-ce qu’elles en attendent — ou est-ce qu’il y a finalement un rôle d’éducation important d’un acteur comme AudioCodes ?
KPA : Je pense que tu l’as vu sur les différents salons, que ce soit All4Customer ou autre. Aujourd’hui, tout le monde parle d’IA et les clients ont également de plus en plus cet aspect-là. Il y a quelques années, oui, il fallait les accompagner fortement. Aujourd’hui, on ne se demande plus s’il faut utiliser l’intelligence artificielle, mais plutôt qui elle va remplacer ou à quel pourcentage on va l’utiliser. Le ROI est assez facile d’interprétation sur la partie réceptionniste comme tu l’as abordé : c’est à peu près 1 500 minutes — combien ça peut nous coûter versus combien nous coûte un agent. Mais encore une fois, tous les clients sont de plus en plus matures, et ce qu’ils attendent aujourd’hui d’un partenaire ou d’un fournisseur, c’est vraiment qu’il aborde leurs différents points spécifiques à leur métier, et non plus « vous devez utiliser un bot vocal. »
DL : Alors si on doit retenir deux ou trois points différenciants de l’approche d’AudioCodes sur ce marché bien disputé, ce serait lesquels ?
KPA : Le premier point, ce serait l’agnosticité — l’agnosticisme complet sur toute la chaîne. C’est un point très important. Si aujourd’hui on a une solution et que dans 6 mois on veut changer, on sait le faire : changer de LLM, changer de STT, garder le nôtre, avoir un autre bot, monter un bot — on sait tout faire. Le deuxième point, ce serait la maîtrise de la couche voix. On a plus de 30 ans d’expertise dans ce monde-là. Quand on parle de latence et d’écoute active, on a des marqueurs — on a identifié, on a analysé le bot, le LLM — pour avoir vraiment une écoute la plus proche possible de la partie vocale. C’est un des différenciateurs : une conversation très naturelle avec un bot qui entend vraiment. Et le troisième point, on l’a abordé, c’est la souveraineté. On peut tester très facilement, mais on peut également répondre à ce besoin d’architecture en prémisse, d’architecture permettant de garder la donnée, pour que chaque entreprise puisse avancer vers cette partie intelligente. Ce critère peut être très limitant : des entreprises n’osent pas franchir le pas même si elles ont une solution UCaaS, parce que la donnée est quand même très personnelle. Cette partie-là est l’une de nos différences.
DL : Super. Merci pour cette synthèse — je comprends mieux le positionnement, qui est un peu atypique. Merci beaucoup Kevin pour cet échange. Bonne journée à toi.
KPA : À toi également. Au revoir.







