Content-Based Filtering untuk Sistem Rekomendasi Produk E-Commerce
DOI:
https://doi.org/10.59095/ijcsr.v5i1.254Keywords:
Confusion Matrix, Content-Based Filtering, Cosine Similarity, E-Commerce, Sistem Rekomendasi, TF-IDFAbstract
Perkembangan pesat platform e-commerce mendorong kebutuhan akan sistem rekomendasi yang mampu membantu pengguna menemukan produk yang relevan secara efektif. Meskipun sistem rekomendasi telah banyak dikembangkan, implementasi yang teruji secara empiris pada dataset produk e-commerce Indonesia masih terbatas. Penelitian ini bertujuan untuk mengembangkan sistem rekomendasi produk e-commerce berbasis content-based filtering dengan memanfaatkan kemiripan konten antar produk. Dataset yang digunakan bersumber dari Tokopedia Products 2025 yang diperoleh melalui Kaggle, berisi informasi produk seperti nama, kategori, dan deskripsi. Representasi fitur teks dilakukan menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF) untuk mengekstraksi karakteristik penting dari setiap produk. Selanjutnya, tingkat kemiripan antar produk dihitung menggunakan Cosine Similarity guna menghasilkan rekomendasi produk yang paling relevan berdasarkan preferensi pengguna. Implementasi dilakukan menggunakan bahasa pemrograman Python dengan pustaka pandas, NumPy, dan scikit-learn. Hasil evaluasi menggunakan berbagai ukuran sampel query dan nilai K yang terdiri dari sample size 50 query yang paling representatif, sistem mencapai Precision@10 sebesar 88.40%, Recall@10 sebesar 46.81%, dan F1-Score@10 sebesar 50.88%, dengan nilai F1-Score optimal dicapai pada K=30 sebesar 66.79%. Hasil penelitian menunjukkan bahwa kombinasi TF-IDF dan Cosine Similarity mampu memberikan rekomendasi produk yang relevan dengan tingkat akurasi yang baik, sehingga metode ini layak diterapkan sebagai solusi sistem rekomendasi pada platform e-commerce berbasis konten
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Fiki Pratama, Sabib Prastio, Erni Seniwati, Ninik Tri Hartanti, Sudarmanto Sudarmanto

This work is licensed under a Creative Commons Attribution 4.0 International License.


