Author Topic: Читалки, говорилки  (Read 335 times)

Offline Python

  • Пользователь
  • **
  • Posts: 196
  • Карма: +53/-6
    • View Profile
Читалки, говорилки
« on: 13 March 2025, 15:47:34 »
  • 0
  • 0
Интересуют онлайн-ресурсы или программы для голосового воспроизведения литовского языка, дающие вменяемое качество произношения. Чтобы можно было взять произвольные слова из словаря и услышать, как они звучат в литературном произношении. Словари со встроенным голосовым воспроизведением тоже подойдут.

Пока нашел вот такое: https://ttsmp3.com/ai — литовский там тоже поддерживается, мне пока сложно судить о качестве произношения ИИ-голосов (насколько это похоже на произношение живых носителей, не сильно ли язык искорежен?); не очень нравится, что ИИ все определяет сам — и на каком языке написан текст, и где ударения  ставить — т.е., нет возможности явно указать ударения, плюс риск неправильного автоопределения языка, фраза должна быть достаточно длинной для автоопределения. Также голосовое воспроизведение литовского есть в гуглопереводчике, но там параметров еще меньше — язык можно указать явно, но голос для каждого языка всего один, со временем его могут поменять на какой-то другой похуже или получше — выбирать особо не из чего.

Offline Upliner

  • Администратор
  • Дважды герой
  • *****
  • Posts: 5599
  • Карма: +539/-22
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Читалки, говорилки
« Reply #1 on: 13 March 2025, 16:15:17 »
  • 0
  • 0
Если есть сомнения в произношении определённых слов, то лучше forvo пока ничего не придумали. А со средним качеством и Google Translate озвучить может.
Вход в Московское княжество -- 1 рубль, выход -- бесценен.
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Python

  • Пользователь
  • **
  • Posts: 196
  • Карма: +53/-6
    • View Profile
Re: Читалки, говорилки
« Reply #2 on: 13 March 2025, 17:14:45 »
  • 0
  • 0
Про forvo тоже подумал, но сейчас я бы предпочел иметь возможность слушать все слова в произношении одного и того же человека/робота, чтобы не смешивать особенности произношения конкретного слова и особенности произношения конкретного носителя. Что-то типа forvo, но с одним и тем же живым диктором для всех слов и словоформ, сложнее создать, и дороже.

Offline Upliner

  • Администратор
  • Дважды герой
  • *****
  • Posts: 5599
  • Карма: +539/-22
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Читалки, говорилки
« Reply #3 on: 13 March 2025, 18:36:33 »
  • 0
  • 0
Ну тут к сожалению на данном уровне развития ИИ, чем умнее нейросетка, тем как правило больше отсебятины она может нести.
нет возможности явно указать ударения
А вот такая возможность кстати есть. По крайней мере, на украинском он знак ударения понимает. Может, в литовском надо какой-то другой знак ставить? Иногда помогает писать большие буквы на месте ударения.
« Last Edit: 13 March 2025, 18:50:19 by Upliner »
Вход в Московское княжество -- 1 рубль, выход -- бесценен.
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Python

  • Пользователь
  • **
  • Posts: 196
  • Карма: +53/-6
    • View Profile
Re: Читалки, говорилки
« Reply #4 on: 13 March 2025, 21:15:54 »
  • 0
  • 0
С несколькими видами ударения в литовском, одних больших букв будет явно недостаточно.

Да, похоже, что на литовские ударения читалка реагирует. Причем, композитные и комбинационные диакритики дают разный результат — пока не разобрался, которые из них следует использовать и насколько результат соответствует правильному произношению.

Offline Upliner

  • Администратор
  • Дважды герой
  • *****
  • Posts: 5599
  • Карма: +539/-22
  • Gender: Male
  • Кис-кис-кис!
    • View Profile
    • лифчег
Re: Читалки, говорилки
« Reply #5 on: 13 March 2025, 22:23:53 »
  • 0
  • 0
пока не разобрался, которые из них следует использовать и насколько результат соответствует правильному произношению.
Тут вряд ли есть правильный ответ. Скорее всего просто в разных обучающих массивах использовались разные типы знаков, и машине не объяснили композитный символ идентичен комбинации.
Вход в Московское княжество -- 1 рубль, выход -- бесценен.
Дві найголовніші помилки українського народу -- зек і зєк.

Offline Python

  • Пользователь
  • **
  • Posts: 196
  • Карма: +53/-6
    • View Profile
Re: Читалки, говорилки
« Reply #6 on: 13 March 2025, 23:59:45 »
  • 0
  • 0
Либо, в более пессимистичном варианте, ИИ понятия не имеет о знаках ударения, композит обрабатывается как буква без диакритиков, комбинационный диакритик разбивает слово подобно пробелу или запятой — реакция есть, но не та.