
본 게시글은 Dacon에서 JunhoSun님이 공유해주신 음성 신호 기본 정보를 바탕으로 작성되었습니다. 모든 코드와 음성 파일은 Github에서 확인하실 수 있습니다. 목차 Intro Import Data Load Spectrogram, Melspectrogram 변환 주요 개념 푸리에 변환 STFT Melspectrogram Function and Option win_length n_fft hop_length n_mels Spectrogram, Melspectrogram 구하기 해상력 Intro 음성 신호에 대한 기본적인 내용을 설명하고 torchaudio를 사용하여 spectrogram과 melspectrogram feature를 만드는 과정에 대해 알아보겠습니다. Import Data Load 음..

모든 실습 코드는 Ref [1]을 확인해주세요 목차 Import Display Waveform FFT -> Power Spectrum SFTF -> Spectrogram Cast Amplitude to Decibels MFCCs Import import numpy as np import librosa, librosa.display import matplotlib.pyplot as plt Display Waveform FIG_SIZE = (15, 10) file = "blues.00000.wav" # load audio file with Librosa signal, sample_rate = librosa.load(file, sr=22050) print('signal shape : ', signal.shap..
- Total
- Today
- Yesterday
- aws cli
- 핵심어 검출
- tensorflow
- TF2.0
- Tensorflow2.0
- librosa
- boto3
- nlp 트렌드
- netron
- nlg
- LSTM
- stft
- AWS
- MFCC
- S3
- BOJ
- RNN
- lambda
- 알고리즘 강의
- 인공지능 스피커 호출
- wavenet
- 6.006
- Introduction to Algorithm
- keras
- 오디오 전처리
- MIT
- nlp
- 알고리즘
- 시계열
- 모델 시각화
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |