Intoxicated Speech Detection

Dataset

Alcohol Language Corpus

Workflow

Models

CNN: alc_cnn.ipynb

Pretrained Wav2Vec2: alc_wav2vec2.ipynb

Feature Extraction

Feature sets: eGEMAPS, COMPARE
Tool: openSMILE

File structure

├── README.md
├── alc_cnn.ipynb
├── alc_wav2vec2.ipynb
├── cnn_architecture.png
├── feature_extraction_compare.py
├── feature_extraction_egemaps.py
├── file_name_split
│   ├── create_balanced_data.py
│   ├── file_name_split.py
├── load_convert_data.py
├── requirements.txt
└── workflow.png

Data preprocessing

Acoustic features of all wav files are extracted using openSMILE.
Once openSMILE is installed, you can navigate to the config files to remove/add features you want to extract.
The config file for eGEMAPS feature set is, e.g., saved under: anaconda3/envs/TL/lib/python3.10/site-packages/opensmile/core/config/egemaps

Notes

Json files are converted to h5 files (load_convert_data.py) to be loaded faster in CNN.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Intoxicated Speech Detection

Dataset

Workflow

Models

Feature Extraction

File structure

Data preprocessing

Notes

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
file_name_split		file_name_split
.DS_Store		.DS_Store
README.md		README.md
alc_cnn.ipynb		alc_cnn.ipynb
alc_wav2vec2.ipynb		alc_wav2vec2.ipynb
cnn_architecture.png		cnn_architecture.png
feature_extraction_compare.py		feature_extraction_compare.py
feature_extraction_egemaps.py		feature_extraction_egemaps.py
load_convert_data.py		load_convert_data.py
requirements.txt		requirements.txt
workflow.png		workflow.png

Yen444/intoxicatedSpeechClassification

Folders and files

Latest commit

History

Repository files navigation

Intoxicated Speech Detection

Dataset

Workflow

Models

Feature Extraction

File structure

Data preprocessing

Notes

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages