모든 실습 코드는 Ref [1]을 확인해주세요 목차 Import Display Waveform FFT -> Power Spectrum SFTF -> Spectrogram Cast Amplitude to Decibels MFCCs Import import numpy as np import librosa, librosa.display import matplotlib.pyplot as plt Display Waveform FIG_SIZE = (15, 10) file = "blues.00000.wav" # load audio file with Librosa signal, sample_rate = librosa.load(file, sr=22050) print('signal shape : ', signal.shap..
이 글은 brightwon님의 MFCC(Mel-Frequency Cepstral Coefficient) 이해하기를 재가공 한 글입니다. 요약 - Audio Signal에 FFT를 수행하면 Spectrum이 된다. - Spectrum에 Mel-Filter bank를 거치면 Mel-Spectrum이 된다. - log X [k] = log(Mel-Spectrum)이라고 할 때 log X [k]에 Cepstral Analysis를 하면 log X [k] = log H [k] + log E [k]로 표현되고, 이것에 IFFT를 수행하면 x [k] = h [k] + e [k] 이 된다 - h [k]를 Mel-Spectrum에 대해 얻은 Cepstral Coefficients(Cepstral 계수)라고 하며 MFCC..
- Total
- Today
- Yesterday
- librosa
- Tensorflow2.0
- aws cli
- boto3
- Introduction to Algorithm
- 알고리즘 강의
- keras
- nlp
- MFCC
- nlp 트렌드
- AWS
- MIT
- BOJ
- S3
- LSTM
- wavenet
- TF2.0
- tensorflow
- 오디오 전처리
- 알고리즘
- 모델 시각화
- netron
- stft
- 핵심어 검출
- 시계열
- lambda
- RNN
- 인공지능 스피커 호출
- 6.006
- nlg
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |