Rongga mulut
Rongga mulut manusia sangat penting dijaga agar terhindar dari berbagai masalah
mulut salah satunya adalah tumor dan kanker rongga mulut. Pertumbuhan sel pada rongga
mulut dibagi menjadi tumor jinak rongga mulut (benign), lesi prakanker, dan kanker rongga
mulut (malignant). Klasifikasi citra lesi benign dan malignant dapat membantu untuk
mengetahui apakah sel yang ada pada rongga mulut termasuk sel yang jinak atau ganas. CNN
adalah jenis neural network yang dapat digunakan untuk mengekstrak fitur yang terdapat pada
sebuah citra. Pada penelitian ini akan dilakukan klasifikasi citra lesi benign dan malignant
dengan menerapkan arsitektur ResNet50 pada metode CNN. Dataset yang digunakan adalah
Oral Image Dataset, yang memiliki 2 kelas, yaitu kelas benign, dan kelas malignant. Pengujian
dilakukan dengan menggunakan data testing dari masing-masing kelas dengan menggunakan
optimizer Adam dan SGD. Berdasarkan hasil pengujian dapat disimpulkan bahwa ResNet50
mampu melakukan klasifikasi citra lesi benign dan malignant dengan baik menggunakan
optimizer Adam dengan nilai akurasi, yaitu 94%. alah satu bagian tubuh manusia yang sangat penting untuk bicara dan pencernaan adalah
rongga mulut, yang terdiri dari lidah, langit-langit mulut, gusi, bibir, dan bagian dalam
pipi. Untuk menghindari berbagai masalah mulut, termasuk tumor dan kanker, rongga
mulut harus selalu dibersihkan. Tumor dan kanker rongga mulut adalah pertumbuhan sel yang
tidak normal yang dapat terjadi di bagian rongga mulut seseorang [1]. Pertumbuhan sel pada
rongga mulut dibagi menjadi tumor jinak rongga mulut (benign), lesi prakanker, dan kanker
rongga mulut (malignant). Beberapa jenis tumor dan kanker rongga mulut melibatkan berbagai
jenis sel dan dapat bervariasi dalam tingkat keganasan.
Kanker mulut menempati urutan kedua yang menyebabkan kematian akibat
keganasannya. Organisasi Kesehatan Dunia (WHO) melaporkan sekitar 650 ribu kasus kanker
mulut pada setiap tahunnya, dan lebih dari setengahnya menyebabkan kematian [2]. Menurut
data dari Globocan, kanker rongga mulut menempati urutan ke-17 untuk kasus baru terbanyak
di Indonesia pada tahun 2020 dengan jumlah 5.780 kasus [3].
Tidak semua orang dapat mengetahui apakah ada yang tidak normal terjadi pada rongga
mulutnya. Hanya dokterlah yang dapat mengetahui hal tersebut. Dokter juga tidak dapat
menjamin 100% apakah sel yang ada pada rongga mulut adalah lesi yang bersifat jinak (benign)
ataupun ganas (malignant) jika tanpa pemeriksaan medis. Klasifikasi citra lesi benign dan
malignant digunakan untuk mengetahui jenis sel yang ada pada rongga mulut apakah jinak atau
ganas berdasarkan data training yang dilatih dan data testing yang digunakan untuk uji coba.
Salah satu dari metode yang dapat digunakan untuk melakukan klasifikasi citra adalah
metode Convolutional Neural Network (CNN). Kelebihan CNN adalah kedalaman jaringan
yang tinggi yang menjadikannya metode ini sangat unik untuk digunakan pada data citra [4].
CNN memiliki banyak arsitektur yang dapat digunakan seperti AlexNet, ResNet, VGG, dan
GoogleNet.
Penelitian [5] melakukan perbandingan model AlexNet dan ResNet pada klasifikasi
spesies bunga. Hasil menunjukkan bahwa model ResNet memiliki akurasi yang lebih tinggi
dengan 97.3% untuk ResNet50, dan 90.2% untuk AlexNet.
Penelitian [6] melakukan analisis perbandingan performa dari arsitektur Convolutional
Neural Network untuk mengklasifikasikan sel darah putih. Arsitektur yang digunakan adalah
AlexNet, GoogleNet, ResNet-50, dan VGG-16. Hasil menunjukkan bahwa ResNet-50 memiliki
akurasi paling tinggi yaitu 94.17%, selanjutnya GoogleNet, VGG-16, dan AlexNet yaitu 93.33%,
91.67%, dan 90%.
Penelitian [7] melakukan klasifikasi kekerabatan (kinship) menggunakan arsitektur
ResNet50 dengan optimizer adam, RMSprop, dan SGD. Model ResNet50 dapat
mengklasifikasikan kinship dengan baik. Hasil menunjukkan bahwa akurasi terbesar didapat
dengan menggunakan optimizer adam sebesar 93%, RMSprop 88%, dan SGD 65%.
Penelitian [8] melakukan klasifikasi citra ekspresi wajah manusia dengan menggunakan
CNN dan 7 optimizer, yaitu Adadelta, Adagrad, Adam, Adamax, Nadam, Rmsprop, dan SGD.
Hasil menunjukkan bahwa optimizer SGD menghasilkan hasil akurasi yang lebih tinggi yaitu
63%.
Berdasarkan penelitian yang dilakukan sebelumnya, arsitektur ResNet50 mampu
melakukan klasifikasi citra dengan lebih baik dengan optimizer Adam dan SGD. Berdasarkan
hal tersebut maka akan dilakukan klasifikasi lesi benign dan malignant pada rongga mulut
menggunakan arsitektur ResNet50 dengan optimizer Adam, dan SGD. 2.1 Rongga Mulut
Rongga mulut adalah area di dalam mulut manusia yang terdiri dari beberapa bagian
yang penting untuk proses pencernaan dan komunikasi. Beberapa bagian utama dari rongga
mulut, yaitu bibir, gigi, lidah, langit-langit mulut, gusi dan tonsil.
Lesi adalah perubahan atau kerusakan pada jaringan tubuh akibat adanya penyakit atau
cidera [9]. Lesi rongga mulut adalah segala bentuk perubahan atau kelainan yang terjadi di
dalam rongga mulut. Kondisi bisa berupa luka, bintik-bintik, benjolan ataupun perubahan warna
pada jaringan di dalam mulut.
Pertumbuhan sel pada rongga mulut dibagi menjadi tumor jinak rongga mulut (benign),
lesi prakanker, dan kanker rongga mulut (malignant) [10] [11].
2.2 CNN
CNN adalah salah satu model deep learning karena kedalaman jaringan yang tinggi dan
sangat unggul jika diimplementasikan pada data citra. CNN didesain dari pengembangan
Multilayer Perceptron (MLP) yang digunakan untuk mengelola data dua dimensi.
CNN memiliki tiga tipe layer, yaitu: convolutional layer, pooling layer, dan fully
connected layer [8]. Convolutional layer digunakan untuk filtering terhadap citra yang akan
dikenali. Polling layer digunakan untuk mengurangi dimensi dari feature map untuk
mempercepat komputasi, dan fully connected layer digunakan untuk menghubungkan semua
neuron seperti multilayer perceptron yang digunakan untuk klasifikasi. Struktur CNN dapat
dilihat pada Gambar 1.
2.3 ResNet50
Residual Network (ResNet) adalah arsitektur CNN yang merupakan jaringan residual
yang memiliki jaringan yang dalam. Terdapat beberapa varian pada model ResNet, yaitu:
ResNet18, ResNet34, ResNet50, ResNet101, dan ResNet152. Karakteristik dari arsitektur ResNet
adalah mampu menangani masalah hilangnya gradien dengan lebih baik. Semakin banyak
jumlah layer, maka gradien tersebut akan menjadi sangat kecil atau menghilang [7]. Hilangnya
gradien ini dapat menghambat kemampuan jaringan untuk belajar secara efektif [5].
ResNet50 adalah tipe ResNet yang memiliki 50 layer yang terdiri dari 48 convolution
layer, 1 maxpool layer, dan 1 average pool layer [7]. Arsitektur ResNet50 dapat dilihat pada
Gambar 2.
Penelitian ini mengunakan dataset publik bernama Oral Image Dataset [14]. Dataset ini
berupa citra lesi benign dan malignant pada rongga mulut berukuran 304x304 piksel sebanyak
2270 data yang terbagi dalam 2 (dua) kelas, yaitu 1155 data kelas benign dan 1115 data kelas
malignant. Dataset ini telah mengalami proses augmentasi, yaitu flipping, rotation, dan
resizing. Data citra yang dikumpulkan akan terbagi menjadi 80% data training dan 20% data
testing. Contoh citra lesi benign dan malignant dapat dilihat pada Gambar 3 dan Gambar 4.
Dataset yang akan digunakan akan dilakukan preprocessing dengan dilakukan resize
otomatis oleh sistem menjadi 224x224 piksel untuk menjadi input ke dalam model ResNet50.
Model ResNet50 yang akan dibangun menggunakan arsitektur ResNet50 yang terdiri dari 48
convolution layer, 1 maxpool layer, dan 1 average pool layer. Terdapat 1 dense layer dengan
fungsi aktivasi softmax.
Model yang dirancang akan diimplementasikan ke dalam bahasa pemrograman python
menggunakan Google Colab. Optimizer yang akan digunakan yaitu Adam dan SGD. Kemudian
akan dilakukan uji coba terhadap model yang telah diimplementasikan menggunakan data
testing yang telah disiapkan.
Proses pengujian akan menggunakan CNN dengan arsitektur ResNet50 dan melakukan
perbandingan 2 (dua) optimizer, yaitu Adam dan SGD. Pengujian ini menggunakan learning
rate sebesar 0,0001 dengan batch size 16 dan epoch sebanyak 20.
Berdasarkan hasil akurasi, precision, dan recall untuk optimizer Adam dan SGD yang
ditunjukkan pada Tabel 1 dapat dilihat bahwa optimizer Adam mempunyai tingkat akurasi yang
lebih tinggi yaitu 94%, sedangkan hasil akurasi dari SGD optimizer sebesar 62%Berdasarkan hasil dari confusion matrix pada Gambar 5 dan Gambar 6, dapat dilihat
bahwa pada Optimizer Adam kesalahan dalam mengenali kelas benign dan malignant sebanyak
14 data, sedangkan pada Optimizer SGD kesalahan dalam mengenali kelas benign 170 data
lebih banyak dibandingkan kelas malignant 2 data.
Berdasarkan hasil pengujian dapat disimpulkan bahwa arsitektur ResNet50 mampu
melakukan klasifikasi citra lesi benign dan malignant pada rongga mulut dengan baik.
Pengujian dengan menggunakan optimizer Adam menghasilkan hasil yang terbaik dengan
akurasi 94%, dibandingkan optimizer SGD dengan akurasi 62%.