PENGENALAN PEMBICARA DENGAN EKSTRAKSI CIRI MFCC MENGGUNAKAN METODE KUANTISASI VEKTOR

Nunu Nugraha

Abstract


Speaker recognition adalah suatu proses yang bertujuan mengenali siapa yang sedang berbicara berdasarkan informasi yang terkandung dalam gelombang suara yang di-input-kan. Speaker identification adalah proses mendapatkan identitas dari seorang pembicara dengan membandingkan fitur-fitur suara yang di-input-kan dengan semua fitur-fitur dari setiap pembicara yang ada di dalam database. Penelitian ini membahas mengenai pengenalan pembicara dengan menggunakan ekstraksi ciri MFCC (Mel Frequency Cepstral Coefficients) dan metode kuantisasi vektor. Ekstraksi ciri MFCC menkonversikan sinyal suara kedalam beberapa vektor data yang berguna dalam proses pengenalan pembicara. Kemudian hasil dari ekstraksi tersebut akan dibandingkan dengan data pembicara yang ada dalam database. Kuantisasi vektor adalah proses meletakkan vektor-vektor ciri yang berukuran besar dan menghasilkan ukuran vektor-vektor yang kecil yang berhubungan dengan distribusi centroid. Algoritma K-mean digunakan untuk kluster. Pengenalan pembicara yang dibuat pada penelitian ini diujikan terhadap 22 orang pembicara, dimana masing-masing pembicara mengucapkan kata “bandungâ€. Pada tahap pengujian, ukuran distorsi berdasarkan minimisasi jarak Euclidean digunakan untuk mencocokkan pembicara yang diujikan dengan data pembicara dalam database. Nilai parameter  yang dirubah adalah ukuran codebook. Hasil pengujian menunjukkan tingkat akurasi tertinggi sistem dalam mengenali pembicara yaitu sebesar 95.45%. tingkat keberhasilan pengenalan tersebut dipengaruhi oleh nilai parameter-parameter yang digunakan dalam metode kuantisasi vektor yaitu ukuran codebook.
   

References


Agustini, Ketut., “Biometrik Suara Dengan Transformasi Wavelet Berbasis Orthogonal Daubenchiesâ€

Antonio M. Peinado and Jos´e C. Segura 2006 speech recognition over digital University of Granada, Spain

Barisevicius, Gintaras. (2004) Text–Independent Speaker Verivication. Departement of Software Engineering, Kaunas University of Technology, Kaunas. Lithuania.

Do, Minh N. “An Automatic Speaker Recognition System†Swiss Federal Institute of Technology, Lausanne, Switzerland

Feng, Ling. (2004) Speaker Recognition. Technical University of Denmark, Informatics and Mathematical Modelling. http://www.imm.dtu.dk/pubdb/imm3319.pdf

Furui, S, “Digital Speech Processing, Synthesis, and Recognitionâ€, Marcel Dekker Inc.New York, 1989 Lawrence B. Holder, Speech Recognition (Briefly),

Kinunen, Tomi dan Ismo Karkkainen. “Class-Discriminative Weighted Distortion Measure for VQ-Based Speaker Identificationâ€. Depaetement of Computer Science. University of Joensuu. Finland.

Petersen , Sigurdsson S, K.B dan Schiøler TL,“Mel Frequency Cepstral Coefficients: An Evaluation of Robustness of MP3 Encoded Musicâ€, University of Victoria, 2006.

Sawit, Kasuriya, ChaiWutiwiwatchai and Chularat tanprasert. (“Comparative Studi of Continuous Hideen Markov Models (CHMM) and Artificial Neural Network (ANN) on Speaker Identification Systemâ€. Phayatai. Bangkok. Thailand

Song F.K, Rosenberg dan Juang B.H , “A vector quantisation approach to speaker recognitionâ€, AT&T Technical Journal, Vol. 66-2, pp. 14-26, March 1987.

Ho, CE. 1998. Speaker Recognition System, Project Report. California: California Institut of Technology.

http://www.cs.berkeley.edu/~russell/classes/ cs188/s05/slides/chapter15b.pdf, 8 Agustus 2009.

http://mutohar.wordpress.com/2007/11/30/speaker-recognition-mengenali-seseorang-dengan-suara/




DOI: https://doi.org/10.25134/nuansa.v8i2.12

NUANSA INFORMATIKA : JURNAL TEKNOLOGY DAN INFORMASI
p-ISSN :1858-3911 , e-ISSN : 2614-5405
DOI : https://doi.org/10.25134/nuansa
Accreditation : SINTA 5

Organized by Faculty of Computer Science, Universitas Kuningan, Indonesia.
Website : https://journal.uniku.ac.id/index.php/ilkom
Email : [email protected]
Address : Jalan Cut Nyak Dhien No.36A Kuningan, Jawa Barat, Indonesia.

StatCounter

View My Stats Creative Commons

Lisensi Creative Commons
NUANSA INFORMATIKA is licensed under a Lisensi Creative Commons Atribusi 4.0 Internasional.