Всем привет. Сейчас мы переживаем небывалый хайп AI, айтишные компании увольняют сотрудников и заменяют их AI-ем. OpenAI уже не знает, куда девать сотни миллиардов, в нее закачанные. Цукерберг переманивает AI-специалистов за сотни миллионов. При этом когда я общаюсь на греческом с ChatGPT, то общается он со мной неохотно, разговор не поддерживает, команду "помедленнее" не выполняет ) Вопрос к вам: посоветуйте плз хорошее AI-app, который бы поддерживал беседу, где можно было бы настроить уровень и скорость. Наверняка уже сделали такое.

2025-11-15 17:07:07


Такого нет, к сожалению. Если брать llm-ки с голосом, то есть тот же chatgpt, Gemini, grok, там просто нет настроек скорости говорения. Для этой задачи надо брать отдельно голос в текст, генерацию текста, текст в голос, а это слишком муторно делать чисто для греческого, тем более качество на нем среднее. Хотя... Можно попробовать что-нибудь собрать

2025-11-16 07:01:28


Во всех платных версиях всех публичных моделей есть функции настройки среды. В том же самом чате жипити создаёте отдельную жипитишку, заливаете туда словарный запас, за рамки которого она не должна выходить, перечень грамматики, за рамки которого она не должна выходить, и - вперёд!

2025-11-15 17:55:27


Но скорость речи все равно не регулируется.

2025-11-15 17:58:34


В диалоге в режиме реального времени это пока неосуществимо по архитектурным причинам. Регулировать скорость (в пределах +- 20%) без ухудшения качества пока можно только при озвучке написанных текстов. Можно заранее записать за диск устойчивые выражения, отдельные слова или даже фонемы и из них на лету собирать диалог (как это и делают сервисы обучения), но это будет большой и не дешевый проект.

2025-11-15 20:23:46


Ну вот сейчас попробовал parakeet, на 40% замедленная речь генерируется примерно с такой же задержкой. Предыдущего поколения сетки могут довольно вольно обращаться со звуком, но качество конечно будет не топовое. И да, это примерно 15 евро за час речи, лучше уже преподавателя найти :)

2025-11-15 19:23:50


Хммм, а зачем для этого нейросеть? Vimu player, куча других плееров и аудиоредакторов без проблем замедляют-ускоряют речь даже 2 раза... Youtube так тоже умеет. Не тупо увеличивая частоту семплирования (чип&дейл), или уменьшая (Дарт Вейдер), а по нормальному, т.е. тембр тот же остается.

2025-11-15 19:33:41


Нейросеть обучается в том числе на медленной речи, качество получается выше.
Вот с Language Transfer я тоже пытался стандартными звуковыми алгоритмами качество улучшить, получалось ужасно. А нейросетки справились норм - https://t.me/cylang/44595

2025-11-15 20:08:14


Ну вы же спрашивали не о "генерации речи", а о ведении диалога с ИИ на греческом языке в режиме реального времени. Или я вас неверно понял?

2025-11-16 07:04:48


Кто-нибудь пробовал разговаривать с ботом @Greek_for_everyone_bot ?
Поделитесь впечатлением, плиз.

2025-11-18 20:03:45