-
Notifications
You must be signed in to change notification settings - Fork 2
Определение слайдов, на которых докладчик замедляется
Во время выступления докладчик может забыть свой текст, запнуться и потерять нить рассказа, сказать что-то не то, немного подумать и исправиться. Во всех этих случаях возникают довольно длинные паузы между предложениями или словами, и всех этих случаев не должно присутствовать в хорошо прорепетированном публичном выступлении. Мы хотим научиться определять слайды, на которых докладчик делал слишком много пауз, чтобы помочь пользователю понять, где у него проблемы.
Во время выступления пользователь переключает слайды. Приложение сохраняет информацию по слайдам, а после нажатия пользователем кнопки "Завершить" выводит следующую информацию для каждого слайда: суммарная доля пауз, средняя длина паузы, количество пауз с длиной выше средней.
Во время записи (подробнее о записи звука можно почитать на этой странице) мы проверяем, не переключил ли пользователь слайд. Если да, то мы вычисляем суммарную долю пауз (так же, как и описано по ссылке; отличие только в том, что для слайда заведены два отдельных счётчика, обнуляющиеся при каждом переключении), среднюю длину паузы на слайде и количество пауз длиннее средней. Средняя длина паузы и количество пауз длиннее средней рассчитываются по списку всех пауз на слайде. То, как определяются паузы для списка, описано по ссылке. Данные по каждому слайду сохраняются в список, а после окончания записи выводятся на экран.
Для тестирования были использованы два фрагмента с достаточным количеством длинных пауз, возникших из-за того, что докладчик сбился или забыл текст. Фрагменты можно найти в директории test_speakers
(ветка test_speakers
) под названиями pauses_speaker1
и pauses_speaker2
. Файлы с расширением .mp3
представляют собой оригиналы записей, .pcm
— записи, выполненные приложением.
Подробные числовые данные представлены в таблице (лист step5
соответствует записи pauses_speaker1
, step2
— pauses_speaker2
): google sheets.
Алгоритм показывает адекватные результаты при определнии суммарной доли пауз:
pauses_speaker1
Без учёта "коротких" (короче 0.1 сек.) пауз:
Номер слайда | Средняя суммарная доля пауз | Истинная суммарная доля пауз |
---|---|---|
1 | 22,42% | 28% |
2 | 24,32% | 34% |
3 | 33,07% | 42% |
С учётом "коротких" пауз:
Номер слайда | Средняя суммарная доля пауз | Истинная суммарная доля пауз |
---|---|---|
1 | 26,27% | 28% |
2 | 28,79% | 34% |
3 | 37,42% | 42% |
pauses_speaker2
Без учёта "коротких" пауз:
Номер слайда | Средняя суммарная доля пауз | Истинная суммарная доля пауз |
---|---|---|
1 | 24,82% | 35,02% |
2 | 38,46% | 41,04% |
3 | 34,98% | 43,86% |