Deepgram تطلق Aura لمنح وكلاء الذكاء الاصطناعي صوتًا
بوابة الذكاء الاصطناعي - وحدة المتابعة
أصبحت Deepgram واحدة من الشركات الناشئة الرائدة في مجال التعرف على الأصوات. و أعلنت هذه الشركة عن إطلاق Aura، واجهة برمجة تطبيقات نص إلى كلام فوري جديدة. يجمع Aura بين نماذج صوت واقعية للغاية وواجهة برمجة تطبيقات منخفضة التأخير للسماح للمطورين ببناء وكلاء ذكاء اصطناعي حواريين في الوقت الحقيقي. وبدعم من نماذج لغوية ضخمة، يمكن لهؤلاء الوكلاء أن يحلوا محل وكلاء خدمة العملاء في مراكز الاتصال والمواقف الأخرى التي تتعامل مع العملاء.
ووفقًا لما صرح به مؤسس Deepgram والرئيس التنفيذي سكوت ستيفنسون لي، فإنه من الممكن منذ فترة طويلة الحصول على نماذج صوت رائعة، ولكن كانت تلك نماذج مكلفة وتستغرق وقتًا طويلاً للحساب. وفي الوقت نفسه، فإن النماذج ذات التأخير المنخفض tend to sound roboti. يجمع Aura من Deepgram بين نماذج صوت تشبه الإنسان تقدم نتائج سريعة للغاية (عادةً في غضون أقل من نصف ثانية)، ويفعل ذلك بسعر منخفض، كما أشار ستيفنسون بشكل متكرر.
وقال: “الآن يرغب الجميع في الحصول على وكلاء ذكاء اصطناعي صوتيين في الوقت الفعلي يمكنهم فهم ما يتم قوله وانشاء استجابة، ثم يمكنهم الكلام”. وبحسب رأيه، يتطلب الأمر مزيجًا من الدقة (والتي وصفها بأنها أمر أساسي لخدمة من هذا النوع)، والتأخير المنخفض والتكلفة المقبولة لجعل منتج مثل هذا جديرًا بالاهتمام للشركات، خاصةً عندما يتم دمجه مع التكلفة النسبياً العالية للوصول إلى نماذج لغوية ضخمة.
تدّعي Deepgram أن تسعيرة Aura حاليًا تتفوق على منافسيها تقريبًا بسعر 0.015 دولار لكل 1000 حرف. وعلى الرغم من أن هذا ليس بعيداً عن سعر Google لأصوات WaveNet بمقدار 0.016 دولار لكل 1000 حرف، وأصوات Neural لـ Polly من Amazon بنفس السعر 0.016 دولار لكل 1000 حرف، إلا أنها أرخص. ومع ذلك، يكون الطبقة العليا من Amazon أغلى بكثير.
وقال ستيفنسون: “يجب أن تصل إلى نقطة سعر جيدة حقًا عبر جميع الفئات، ولكن يجب أيضًا أن يكون لديك تأخير مدهش، وسرعة – ودقة مدهشة أيضًا. إنه أمر صعب حقًا لتحقيقه”. وتابع: “ولكن هذا هو ما ركزنا عليه من البداية، وهذا هو السبب في أننا قمنا ببناء البنية التحتية الأساسية لجعل ذلك حقيقيًا لمدة أربع سنوات قبل أن نُصدِر أي شيء”.
تقدم Aura حوالي عشرة نماذج صوت في هذه المرحلة، وتم تدريبها جميعًا بواسطة مجموعة بيانات أنشأتها Deepgram بالتعاون مع ممثلي الأصوات. تم تدريب نموذج Aura، تمامًا مثل جميع نماذج الشركة الأخرى، داخل الشركة.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي