speech-recognition

Currently data is stored at data/audio and data/label. Maybe can follow LibriSpeech directory structure.
AudioDataset - read data from directory and convert to spectogram. Variable length.
dataloader_audio.collate_fn pad sequence. Yet to check compatiblity with nn.
utils.TextProcess to clean text. Currently include to lower case, remove punctuations, numbers(including years) to words.

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
scraper		scraper
utils		utils
.gitignore		.gitignore
Audio exploration.ipynb		Audio exploration.ipynb
Audio preprocessing.ipynb		Audio preprocessing.ipynb
Build model.ipynb		Build model.ipynb
README.md		README.md
dataset.py		dataset.py

Provide feedback