OpenAI launches new voice intelligence features in its API

## OpenAI تعزز واجهة برمجة التطبيقات (API) بميزات ذكاء صوتي متقدمة

أعلنت OpenAI عن ترقية رئيسية لواجهة برمجة التطبيقات الخاصة بها، حيث قدمت مجموعة من إمكانيات الذكاء الصوتي الجديدة المصممة لتمكين المطورين من التفاعل الصوتي بشكل أكثر طبيعية وعالي الجودة وبزمن استجابة أقل.

تركز التحسينات بشكل أساسي على مجالين رئيسيين: تحسين تحويل النص إلى كلام (TTS) وتطوير وظائف تحويل الكلام إلى كلام (STS). يتوفر الآن نموذج جديد لتحويل النص إلى كلام يعمل في الوقت الفعلي، قادر على توليد صوت واقعي للغاية من النص باستخدام ستة أصوات طبيعية ومميزة. يتيح ذلك تجارب محادثة أكثر ديناميكية وجاذبية عبر مختلف التطبيقات.

علاوة على ذلك، تتيح ميزة تحويل الكلام إلى كلام الرائدة للمستخدمين إدخال صوت، ليقوم النموذج بالرد عليه، حتى بصوت أو لغة مختلفة، مع الحفاظ على النبرة العاطفية الأصلية للصوت المُدخل. هذه التطورات، إلى جانب أحدث إصدار من نموذج Whisper V3 لتحويل الكلام إلى نص، من شأنها أن تُحدث ثورة في كيفية دمج المطورين للذكاء الاصطناعي الصوتي في منتجاتهم، بدءًا من المساعدين الصوتيين المتقدمين وصولًا إلى الأدوات التعليمية التفاعلية والواجهات سهلة الاستخدام.

أطلقت OpenAI ميزات جديدة للذكاء الصوتي في واجهة برمجة التطبيقات الخاصة بها

اترك تعليقا إلغاء الرد