Skip to content

Определение слайдов, на которых докладчик замедляется

sharkovadarya edited this page Dec 14, 2018 · 2 revisions

Описание

Во время выступления докладчик может забыть свой текст, запнуться и потерять нить рассказа, сказать что-то не то, немного подумать и исправиться. Во всех этих случаях возникают довольно длинные паузы между предложениями или словами, и всех этих случаев не должно присутствовать в хорошо прорепетированном публичном выступлении. Мы хотим научиться определять слайды, на которых докладчик делал слишком много пауз, чтобы помочь пользователю понять, где у него проблемы.

Во время выступления пользователь переключает слайды. Приложение сохраняет информацию по слайдам, а после нажатия пользователем кнопки "Завершить" выводит следующую информацию для каждого слайда: суммарная доля пауз, средняя длина паузы, количество пауз с длиной выше средней.

Алгоритм

Во время записи (подробнее о записи звука можно почитать на этой странице) мы проверяем, не переключил ли пользователь слайд. Если да, то мы вычисляем суммарную долю пауз (так же, как и описано по ссылке; отличие только в том, что для слайда заведены два отдельных счётчика, обнуляющиеся при каждом переключении), среднюю длину паузы на слайде и количество пауз длиннее средней. Средняя длина паузы и количество пауз длиннее средней рассчитываются по списку всех пауз на слайде. То, как определяются паузы для списка, описано по ссылке. Данные по каждому слайду сохраняются в список, а после окончания записи выводятся на экран.

Тестирование

Для тестирования были использованы два фрагмента с достаточным количеством длинных пауз, возникших из-за того, что докладчик сбился или забыл текст. Фрагменты можно найти в директории test_speakers (ветка test_speakers) под названиями pauses_speaker1 и pauses_speaker2. Файлы с расширением .mp3 представляют собой оригиналы записей, .pcm — записи, выполненные приложением.

Подробные числовые данные представлены в таблице (лист step5 соответствует записи pauses_speaker1, step2pauses_speaker2): google sheets.

Алгоритм показывает адекватные результаты при определнии суммарной доли пауз:

pauses_speaker1

Без учёта "коротких" (короче 0.1 сек.) пауз:

Номер слайда Средняя суммарная доля пауз Истинная суммарная доля пауз
1 22,42% 28%
2 24,32% 34%
3 33,07% 42%

С учётом "коротких" пауз:

Номер слайда Средняя суммарная доля пауз Истинная суммарная доля пауз
1 26,27% 28%
2 28,79% 34%
3 37,42% 42%

pauses_speaker2

Без учёта "коротких" пауз:

Номер слайда Средняя суммарная доля пауз Истинная суммарная доля пауз
1 24,82% 35,02%
2 38,46% 41,04%
3 34,98% 43,86%
Clone this wiki locally