- фича
word duration
считается от длины слова в символах:- возможно, лучше перейти на фонемы
- насчитать статистики по фонемам и смотреть на сколько в общем фонемы в слове отклоняются от своих средних
- не помню, чтобы в статьях у Сбера было что-то про фичу наклона питча (F0 slope) над всем словом, но решил оставить пока
- возможно, стоит посмотреть статистики по признакам глазами и сделать бины неравномерными, пока решил попробовать равномерные: см. выступление Salute AI Day — пример квантилей