उदाहरण: Sincere
Voice Affect: Calm, composed, and reassuring. Competent and in control, instilling trust.
Tone: Sincere, empathetic, with genuine concern for the customer and understanding of the situation.
Pacing: Slower during the apology to allow for clarity and processing. Faster when offering solutions to signal action and resolution.
Emotions: Calm reassurance, empathy, and gratitude.
Pronunciation: Clear, precise: Ensures clarity, especially with key details. Focus on key words like "refund" and "patience."
Pauses: Before and after the apology to give space for processing the apology.
उदाहरण: Medieval Knight
Voice Effect: गहरी, आदेशात्मक और हल्की नाटकीय अनुभूति, जो प्राचीन English कथाओं की भव्यता को दर्शाती है
Tone: उदात्त, वीरतापूर्ण और औपचारिक, जो मध्यकालीन शूरवीर और महाकाव्यात्मक साहसिक यात्रा के सार को पकड़ता है
Emotions: उत्साह, अपेक्षा, रहस्य और नियति व कर्तव्य की गंभीरता का संयोजन
Pronunciation: स्पष्ट, सावधानीपूर्ण और हल्की औपचारिक लय; "hast", "thou", "doth" जैसे शब्दों को प्राचीन English उच्चारण पैटर्न के अनुसार धीरे और ज़ोर देकर बोलना
Pauses: "Lo!", "Hark!" जैसे प्राचीन English वाक्यांशों के बाद विराम, और "Choose thy path" जैसी clauses के बीच विराम ताकि निर्णय के महत्व पर ज़ोर दिया जा सके और श्रोता quest की गंभीरता पर विचार कर सके
2 टिप्पणियां
Hacker News की राय
इन मॉडलों की कीमत ElevenLabs की तुलना में काफ़ी कम है
gpt-4o-mini-ttsमॉडल के मामले में, ऑडियो की लागत $0.015 प्रति मिनट है, जो ElevenLabs से 85% सस्ती हैBusinessप्लान $1100 प्रति माह में 11,000 मिनट TTS देता है, यानी 10 सेंट प्रति मिनटOpenAI के Jeff ने बताया कि नए ऑडियो मॉडल जारी किए गए हैं
text-to-speech और speech-to-text मॉडलों की reliability समस्याओं का ज़िक्र
generated audio के साथ
speech marksपाने का तरीका पूछा गयाspeech marksकी व्याख्याहाल के बड़े text-to-speech और speech-to-text मॉडलों में प्रगति
vibeबॉक्स में डाले गए टेक्स्ट के अनुसार विभिन्न intonation और personality लागू की जा सकती हैंNavy Seal copypasta डालने पर प्रतिक्रिया
vibeनिर्देशों के अनुसार अलग-अलग तरीके से काम करता हैनए मॉडल की आवाज़ में हल्का कंपन है, इसलिए यह Siri से कमतर लगती है
OpenAI के आधिकारिक tools नए मॉडल की घोषणा से जुड़े हुए हैं
आधिकारिक घोषणा से महत्वपूर्ण उद्धरण
vibesUI में दिए जाने वाले निर्देश हैंgpt-4o-mini-ttsऑडियो आउटपुट की लागत $0.015 प्रति मिनट है, जो व्यावहारिक हैहिंदी भी पूरी तरह से काम कर रही है।